t**********y 发帖数: 374 | 1 具体的数据如附图所示
这里是10,000 个基因的表达情况。
上面一个图的每个点是这些基因在两个雌性个体中的表达量, 每个坐标轴表示一个个
体。
下面一个图类似, 每个点是基因在两个雄性个体中的表达量, 每个坐标轴表示一个个
体。
大致的趋势是, 高表达的基因, 在两个同性个体中的表达趋于接近。但两个图有明显
的不同, 就是上面的图(雌性数据)were more scattered.
问题如下: 如果以下面的图(雄性数据)的趋势作为基准的话, 如何找出上面图中那
些更加scattered的点(gene)?
非常感谢! |
a****g 发帖数: 8131 | 2 standardize expressions in female
then define a threshold for selection purpose |
s******s 发帖数: 13035 | 3 这两个图是你画的么?
【在 t**********y 的大作中提到】 : 具体的数据如附图所示 : 这里是10,000 个基因的表达情况。 : 上面一个图的每个点是这些基因在两个雌性个体中的表达量, 每个坐标轴表示一个个 : 体。 : 下面一个图类似, 每个点是基因在两个雄性个体中的表达量, 每个坐标轴表示一个个 : 体。 : 大致的趋势是, 高表达的基因, 在两个同性个体中的表达趋于接近。但两个图有明显 : 的不同, 就是上面的图(雌性数据)were more scattered. : 问题如下: 如果以下面的图(雄性数据)的趋势作为基准的话, 如何找出上面图中那 : 些更加scattered的点(gene)?
|
t**********y 发帖数: 374 | 4 是啊! 用的是R.
有什么问题吗?
【在 s******s 的大作中提到】 : 这两个图是你画的么?
|
t**********y 发帖数: 374 | 5 能具体一点, how to standardize?
多谢了!
【在 a****g 的大作中提到】 : standardize expressions in female : then define a threshold for selection purpose
|
s******s 发帖数: 13035 | 6 你自己能用R画,后面不应该不会做啊。define个distance,然后自己define个区别的
threshold不就行了
【在 t**********y 的大作中提到】 : 是啊! 用的是R. : 有什么问题吗?
|
D******n 发帖数: 2836 | 7 两个 个体,是不是太少了。
你这个貌似是想知道不同sex之间,基因表达的profile的差异,
【在 t**********y 的大作中提到】 : 具体的数据如附图所示 : 这里是10,000 个基因的表达情况。 : 上面一个图的每个点是这些基因在两个雌性个体中的表达量, 每个坐标轴表示一个个 : 体。 : 下面一个图类似, 每个点是基因在两个雄性个体中的表达量, 每个坐标轴表示一个个 : 体。 : 大致的趋势是, 高表达的基因, 在两个同性个体中的表达趋于接近。但两个图有明显 : 的不同, 就是上面的图(雌性数据)were more scattered. : 问题如下: 如果以下面的图(雄性数据)的趋势作为基准的话, 如何找出上面图中那 : 些更加scattered的点(gene)?
|
t**********y 发帖数: 374 | 8
【在 s******s 的大作中提到】 : 你自己能用R画,后面不应该不会做啊。define个distance,然后自己define个区别的 : threshold不就行了
|
t**********y 发帖数: 374 | 9 不是学统计的。 只会画图而已。
请提示得具体些。 多谢了!
【在 s******s 的大作中提到】 : 你自己能用R画,后面不应该不会做啊。define个distance,然后自己define个区别的 : threshold不就行了
|
t**********y 发帖数: 374 | 10 所以在标题里写了, 不知是否该发在这儿。 不晓得这是数学问题, 还是统计问题。
。。
【在 D******n 的大作中提到】 : 两个 个体,是不是太少了。 : 你这个貌似是想知道不同sex之间,基因表达的profile的差异,
|
|
|
d*****t 发帖数: 7903 | 11 我估计他的意思是以male x-axis对应的每个y range为reference,用female的相应
range去除这些个range,得出的ratio产生新的图。然后设定threshold。
【在 t**********y 的大作中提到】 : 能具体一点, how to standardize? : 多谢了!
|
a*******7 发帖数: 772 | 12 基因在两个个体中的表达,一除,越接近1的,就说明越不scatter;都除完了以后减去
1,按照差的绝对值大小排个顺序,绝对值越大的说明越scatter。
先对两个雄性个体做一下,把绝对值最小的8000个gene找出来,再对两个雌性个体做一
下,先把之前找出来的那8000个gene去掉,剩下的排个顺序,估计就找到了吧。 |
a****g 发帖数: 8131 | 13 上面已经有兄弟回答了 就是那个意思
如果有几次实验结果,做个ratio的confidence interval,这样结果会更加可靠
【在 t**********y 的大作中提到】 : 能具体一点, how to standardize? : 多谢了!
|
t**********y 发帖数: 374 | 14 问题是我希望, gene 表达水平低的可以scatter的范围大一些。 也就是说每一个gene
的可允许的variablity 是不一样的。 而这个variablity是以雄性样本为基准的。
所以我希望有一种方法可以model 雄性样本的variability, 寻找variance 和mean的关
系, 然后计算出threshhold..
【在 a*******7 的大作中提到】 : 基因在两个个体中的表达,一除,越接近1的,就说明越不scatter;都除完了以后减去 : 1,按照差的绝对值大小排个顺序,绝对值越大的说明越scatter。 : 先对两个雄性个体做一下,把绝对值最小的8000个gene找出来,再对两个雌性个体做一 : 下,先把之前找出来的那8000个gene去掉,剩下的排个顺序,估计就找到了吧。
|
r********n 发帖数: 40 | 15 用Copula比较好。heavy right tail or Gumbel copula都可以。因为它们都是左下角
less correlated, 右上角highly correlated. Do a copula fitting for 雄性数据,
find the correlation coefficient for say Heavy right tail copula. Let's say
we get 0.8 for the male data. Simulate 1,000,000or more data points based
on the 0.8 heavy right tail copula. 模拟数据越多越好,要能够覆盖雌性数据其中
一个边际分布。取雌性数据其中一个边际分布的值,我们取x轴好了。找到最接近的模
拟数据x轴上的值,再找到对应的模拟数据y轴上的max and min 值。比较empirical
female data y axis value and simulated y axis range for the same x axis
value. 若不在区间内,就是scattered data points.
问题是我希望, gene 表达水平低的可以scatter的范围大一些。 也就是说每一个gene
的可允许的variablity 是不一样的。 而这个variablity是以雄性样........
【在 t**********y 的大作中提到】 : 问题是我希望, gene 表达水平低的可以scatter的范围大一些。 也就是说每一个gene : 的可允许的variablity 是不一样的。 而这个variablity是以雄性样本为基准的。 : 所以我希望有一种方法可以model 雄性样本的variability, 寻找variance 和mean的关 : 系, 然后计算出threshhold..
|
t**********y 发帖数: 374 | 16 非常感谢, 我琢磨琢磨。
不是统计本行,消耗起来有点慢:)
say
gene
【在 r********n 的大作中提到】 : 用Copula比较好。heavy right tail or Gumbel copula都可以。因为它们都是左下角 : less correlated, 右上角highly correlated. Do a copula fitting for 雄性数据, : find the correlation coefficient for say Heavy right tail copula. Let's say : we get 0.8 for the male data. Simulate 1,000,000or more data points based : on the 0.8 heavy right tail copula. 模拟数据越多越好,要能够覆盖雌性数据其中 : 一个边际分布。取雌性数据其中一个边际分布的值,我们取x轴好了。找到最接近的模 : 拟数据x轴上的值,再找到对应的模拟数据y轴上的max and min 值。比较empirical : female data y axis value and simulated y axis range for the same x axis : value. 若不在区间内,就是scattered data points. :
|