由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - R performace issue
相关主题
怎样用apply对多种endpoint构建linear modelR program help
怎样用R subset character stringR question about apply() and outer()
还是那个MACRO的问题再问R的问题 - 关于matrix 的operation
请问sas如何做两万次ttest不崩溃?[合集] 请问如何看到R的source code?
[合集] 怎样fit 这个 gene-SNP 的mixed model?R一问
如何在R里面对一整列数据进行操作?R问题请教。
今天又“R”了 -- 感想和请教。请问R里apply和sapply有什么区别
R 问题如何把model fitting statistics 读出来(R)
相关话题的讨论汇总
话题: performace话题: issue话题: 搞定话题: test话题: lm
进入Statistics版参与讨论
1 (共1页)
d*******1
发帖数: 854
1
我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by
variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在
一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问
题呢
D******n
发帖数: 2836
2
你可以先算算一两百个基因定定时间。

【在 d*******1 的大作中提到】
: 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by
: variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在
: 一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问
: 题呢

d*******1
发帖数: 854
3
如何把头100-200基因的数据parse出来呢?:(, 问题太蠢,见谅了,呵呵

【在 D******n 的大作中提到】
: 你可以先算算一两百个基因定定时间。
g********r
发帖数: 8017
4
不是R的问题。这样的test,就算你用循环,时间也应该是几分钟而已。
直接ttest还不如用SAM或者limma,快多了。

【在 d*******1 的大作中提到】
: 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by
: variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在
: 一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问
: 题呢

d*******1
发帖数: 854
5
在初学阶段, 我比较避免用那些black box的package, 更倾向于自己一条条把work
flow建起来。等熟习了以后在去用那些package.

【在 g********r 的大作中提到】
: 不是R的问题。这样的test,就算你用循环,时间也应该是几分钟而已。
: 直接ttest还不如用SAM或者limma,快多了。

s*r
发帖数: 2757
6
100 wb
d*******1
发帖数: 854
7
一点头绪:
result<- lapply(split(data,data$gene),function(x) lm(logvalue~treatment,x))
大概25分钟搞定, 我开始的错误在于在LM中用了data$logvalue, data$treatment

【在 d*******1 的大作中提到】
: 我还想就这个算法的performance请教一下大家, 我这个数据有大概6万个gene (by
: variable), 在每个基因下是一个6对6的t test,大家觉得应该用多长时间搞定。 我在
: 一个linux server (8 cores, 32 GB memory), 耗时3-4小时还没有搞定。会是什么问
: 题呢

f******d
发帖数: 537
8
Why use "split"....
a simple apply will do
result <- apply(data, 2, function(x) lm(x~treatment))
And it shouldn't take no more than 5 minutes.

【在 d*******1 的大作中提到】
: 一点头绪:
: result<- lapply(split(data,data$gene),function(x) lm(logvalue~treatment,x))
: 大概25分钟搞定, 我开始的错误在于在LM中用了data$logvalue, data$treatment

d*******1
发帖数: 854
9
what is 2 in your apply function?

【在 f******d 的大作中提到】
: Why use "split"....
: a simple apply will do
: result <- apply(data, 2, function(x) lm(x~treatment))
: And it shouldn't take no more than 5 minutes.

D******n
发帖数: 2836
10
................this is way off......

【在 f******d 的大作中提到】
: Why use "split"....
: a simple apply will do
: result <- apply(data, 2, function(x) lm(x~treatment))
: And it shouldn't take no more than 5 minutes.

d*******1
发帖数: 854
11
do you mean he is incorrect?

【在 D******n 的大作中提到】
: ................this is way off......
D******n
发帖数: 2836
12
totally wrong, of course, u can test it.

【在 d*******1 的大作中提到】
: do you mean he is incorrect?
1 (共1页)
进入Statistics版参与讨论
相关主题
如何把model fitting statistics 读出来(R)[合集] 怎样fit 这个 gene-SNP 的mixed model?
Dashagen请进如何在R里面对一整列数据进行操作?
[R]how to sample all possible continuous subset from ordered data今天又“R”了 -- 感想和请教。
这个R LOOP错在那里了R 问题
怎样用apply对多种endpoint构建linear modelR program help
怎样用R subset character stringR question about apply() and outer()
还是那个MACRO的问题再问R的问题 - 关于matrix 的operation
请问sas如何做两万次ttest不崩溃?[合集] 请问如何看到R的source code?
相关话题的讨论汇总
话题: performace话题: issue话题: 搞定话题: test话题: lm