由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 请问有做quantitative genetics的人吗?问个kinship和mixed model的问题。
相关主题
如果genotyping结果发现一个SNP不符合HWE说明啥?DNA quality for SNP genotyping
新手求教,用什么办法根据genotypes的数据,分析risk hyplotype??请问genotype和phenotype的相关性分析
genotype 的价格弱问Trizol提RNA
machine learning来对GWAS结果建模应该控制生物新技术的大规模应用
有趣的计算生物学问题(2):标签序列设计问题大量购买Tag酶和dNTP做genotyping,那里最便宜?
如何定义动物(小鼠)实验的“independent experiments"的次数R 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财(转载)
SNP Genotyping有奖问答:每个细胞所含的dna是完全一样的吗?
弱问:ABO gene 上的一个SNP G703A, 怎么样知道它的rs号是什么?forensic是个不错的career啊
相关话题的讨论汇总
话题: kinship话题: genotype话题: trait话题: model话题: matrix
进入Biology版参与讨论
1 (共1页)
o******n
发帖数: 511
1
我们想把kinship matrix加到我们的model里,分析一些植物的genotype和它们的trait
的关系。
采样的时候,我们每个植物的genotype取了三个样,有27种植物的genotype,所以有81
个样品。
在把kinship放到模型里的R packages里,要求trait data matrix和kinship matrix要
有一样的size,请问我们这种81*n trait的trait data matrix和27*27的kinship
matrix怎么才能对应起来呢?取平均值肯定不是最优的办法。
谢谢!
M*P
发帖数: 6456
2
balanced design, 我觉得取平均值是没问题的。

trait
81
★ 发自iPhone App: ChineseWeb 7.8

【在 o******n 的大作中提到】
: 我们想把kinship matrix加到我们的model里,分析一些植物的genotype和它们的trait
: 的关系。
: 采样的时候,我们每个植物的genotype取了三个样,有27种植物的genotype,所以有81
: 个样品。
: 在把kinship放到模型里的R packages里,要求trait data matrix和kinship matrix要
: 有一样的size,请问我们这种81*n trait的trait data matrix和27*27的kinship
: matrix怎么才能对应起来呢?取平均值肯定不是最优的办法。
: 谢谢!

o******n
发帖数: 511
3
谢谢你的回复。
那如果不是balanced design请问怎么处理好?
比如实际中,有的样品测序没有出来,所以不是每个genotype都有3个replicates。
gwas里面每个genotype应该也会测几个replicate的吧,而且也不一定是balanced
design,他们是怎么把不一样大的trait data matrix和kinship matrix联系起来的呀?
也许做gwas的人不会遇到我这个问题吧,他们的每个replicates也都genotype过,有
SNP data,所以trait data和kinship的矩阵大小一致。可是我们没有每株植物的SNP
data。
我这个问题看来真的不好办…… :-(
M*P
发帖数: 6456
4
you can do a majority vote and see how it goes.
in your case, genotype is the control variable, which is not assumed to be
random variable in most situations. If anyone knows how to make both
genotype and phenotype as random variable, I would like to learn how to do
the analysis.

呀?

【在 o******n 的大作中提到】
: 谢谢你的回复。
: 那如果不是balanced design请问怎么处理好?
: 比如实际中,有的样品测序没有出来,所以不是每个genotype都有3个replicates。
: gwas里面每个genotype应该也会测几个replicate的吧,而且也不一定是balanced
: design,他们是怎么把不一样大的trait data matrix和kinship matrix联系起来的呀?
: 也许做gwas的人不会遇到我这个问题吧,他们的每个replicates也都genotype过,有
: SNP data,所以trait data和kinship的矩阵大小一致。可是我们没有每株植物的SNP
: data。
: 我这个问题看来真的不好办…… :-(

o******n
发帖数: 511
5
谢谢你的回复。
如果我们不加kinship到model里,那么genotype就是一个有27个level的factor,R会
assume这些level是一样的,但其实它们之间的genetic distance并不一样,所以我们
想把这个信息加到model里。
让我困惑的就是怎么加。我想到一个办法就是把每个plant genotype跟其它所有
genotype的total genetic distance作为一个新的covariate放到model里。但我又觉得
,这个covariate和genotype不是collinear的吗?
plant breeding的人有时会把kinship matrix加到model里做association analysis。
不过我们的trait不是传统意义上的phenotype,也没有每株植物的SNP data,所以很多
软件/package不能用……

【在 M*P 的大作中提到】
: you can do a majority vote and see how it goes.
: in your case, genotype is the control variable, which is not assumed to be
: random variable in most situations. If anyone knows how to make both
: genotype and phenotype as random variable, I would like to learn how to do
: the analysis.
:
: 呀?

M*P
发帖数: 6456
6
you think this as a two step process. First you get the best genotype
estimation you can get using 3 replicates for each species. For the second
step, you forget about the errors in the genotype and assume they are 100%
correct. Then you do the linear mixed model for whatever your analysis is.
The kinship is used as random effect to control for the relateness of the
species.

【在 o******n 的大作中提到】
: 谢谢你的回复。
: 如果我们不加kinship到model里,那么genotype就是一个有27个level的factor,R会
: assume这些level是一样的,但其实它们之间的genetic distance并不一样,所以我们
: 想把这个信息加到model里。
: 让我困惑的就是怎么加。我想到一个办法就是把每个plant genotype跟其它所有
: genotype的total genetic distance作为一个新的covariate放到model里。但我又觉得
: ,这个covariate和genotype不是collinear的吗?
: plant breeding的人有时会把kinship matrix加到model里做association analysis。
: 不过我们的trait不是传统意义上的phenotype,也没有每株植物的SNP data,所以很多
: 软件/package不能用……

o******n
发帖数: 511
7
谢谢你哦。我想你的意思是,把第一步算出的genotype的coefficients作为dependent
variable用kinship来model,对吗?那第二步的什么结果可以回答plant genotype和
trait的关系吗?
我们还知道有significant genotype by environment interaction,所以第一步的
model里面也会加入E和GxE,所以GxE也会被genotype relatedness影响。

【在 M*P 的大作中提到】
: you think this as a two step process. First you get the best genotype
: estimation you can get using 3 replicates for each species. For the second
: step, you forget about the errors in the genotype and assume they are 100%
: correct. Then you do the linear mixed model for whatever your analysis is.
: The kinship is used as random effect to control for the relateness of the
: species.

o******n
发帖数: 511
8
@MHP:
我下午查文献和R help list的时候看到有人跟你类似的方法了。
我刚想出来另外一个办法了!
我把那个kinship matrix inflate到trait data的size就可以了,然后随便什么可以
take kinship or correlation matrix的package都能用了,哈哈!而且这样比取均值
要更make sense。
1 (共1页)
进入Biology版参与讨论
相关主题
forensic是个不错的career啊有趣的计算生物学问题(2):标签序列设计问题
Re "关于将来提高cancer治愈率的一个粗略预期"如何定义动物(小鼠)实验的“independent experiments"的次数
谁有做snp的genotyping 学习资料SNP Genotyping
SNP 分析请教弱问:ABO gene 上的一个SNP G703A, 怎么样知道它的rs号是什么?
如果genotyping结果发现一个SNP不符合HWE说明啥?DNA quality for SNP genotyping
新手求教,用什么办法根据genotypes的数据,分析risk hyplotype??请问genotype和phenotype的相关性分析
genotype 的价格弱问Trizol提RNA
machine learning来对GWAS结果建模应该控制生物新技术的大规模应用
相关话题的讨论汇总
话题: kinship话题: genotype话题: trait话题: model话题: matrix