d*******1 发帖数: 854 | 1 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by
variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在
一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问
题呢 | D******n 发帖数: 2836 | 2 你可以先算算一两百个基因定定时间。
【在 d*******1 的大作中提到】 : 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by : variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在 : 一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问 : 题呢
| d*******1 发帖数: 854 | 3 如何把头100-200基因的数据parse出来呢?:(, 问题太蠢,见谅了,呵呵
【在 D******n 的大作中提到】 : 你可以先算算一两百个基因定定时间。
| g********r 发帖数: 8017 | 4 不是R的问题。这样的test,就算你用循环,时间也应该是几分钟而已。
直接ttest还不如用SAM或者limma,快多了。
【在 d*******1 的大作中提到】 : 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by : variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在 : 一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问 : 题呢
| d*******1 发帖数: 854 | 5 在初学阶段, 我比较避免用那些black box的package, 更倾向于自己一条条把work
flow建起来。等熟习了以后在去用那些package.
【在 g********r 的大作中提到】 : 不是R的问题。这样的test,就算你用循环,时间也应该是几分钟而已。 : 直接ttest还不如用SAM或者limma,快多了。
| s*r 发帖数: 2757 | | d*******1 发帖数: 854 | 7 一点头绪:
result<- lapply(split(data,data$gene),function(x) lm(logvalue~treatment,x))
大概25分钟搞定, 我开始的错误在于在LM中用了data$logvalue, data$treatment
【在 d*******1 的大作中提到】 : 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by : variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在 : 一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问 : 题呢
| f******d 发帖数: 537 | 8 Why use "split"....
a simple apply will do
result <- apply(data, 2, function(x) lm(x~treatment))
And it shouldn't take no more than 5 minutes.
【在 d*******1 的大作中提到】 : 一点头绪: : result<- lapply(split(data,data$gene),function(x) lm(logvalue~treatment,x)) : 大概25分钟搞定, 我开始的错误在于在LM中用了data$logvalue, data$treatment
| d*******1 发帖数: 854 | 9 what is 2 in your apply function?
【在 f******d 的大作中提到】 : Why use "split".... : a simple apply will do : result <- apply(data, 2, function(x) lm(x~treatment)) : And it shouldn't take no more than 5 minutes.
| D******n 发帖数: 2836 | 10 ................this is way off......
【在 f******d 的大作中提到】 : Why use "split".... : a simple apply will do : result <- apply(data, 2, function(x) lm(x~treatment)) : And it shouldn't take no more than 5 minutes.
| d*******1 发帖数: 854 | 11 do you mean he is incorrect?
【在 D******n 的大作中提到】 : ................this is way off......
| D******n 发帖数: 2836 | 12 totally wrong, of course, u can test it.
【在 d*******1 的大作中提到】 : do you mean he is incorrect?
|
|