由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 可不可以去掉一个偏差最大的值?
相关主题
求教一个生物统计学得问题问个生物计算中的for loop的问题
QPCR三个复孔,可以去掉一个明显偏离另两个孔的值吗?总结2016.08.08【记录历史】谁重复验证了NgAgo?
How to define an outlier in statistical analysis?请教这个图是用什么软件做出来的?
刚刚在lab meeting上吵架了如何在同一个EXCEL图中显示2个差异很大的数字?
统计学问题求教求推荐~Correlation analysis 软件
如何算P value?请教:manuscript里的柱状图和plot大家都用什么软件做?
Nature, 叶诗文, 造假, 饶毅, 施一公, 王小东请教这种surviving fraction versus dose 图怎么画?
请教:如何处理outlier data请教--关于p value的计算
相关话题的讨论汇总
话题: sd话题: median话题: 数据话题: 去掉话题: outliers
进入Biology版参与讨论
1 (共1页)
D***a
发帖数: 516
1
在做luciferase assay,重复5个孔,经常有一个值跟其他的相差很多。比如别的都是
30到60,这个200多。在做统计时,是不是允许去除这个值?谢谢。
v*******e
发帖数: 11604
2
from my intuition: should indicate in your paper that you removed this point
.
e*********6
发帖数: 3453
3
当做实验错误去掉应该没啥吧。

【在 D***a 的大作中提到】
: 在做luciferase assay,重复5个孔,经常有一个值跟其他的相差很多。比如别的都是
: 30到60,这个200多。在做统计时,是不是允许去除这个值?谢谢。

G*****h
发帖数: 320
4
单独因为自己觉得是 outlier 而把它去掉也许不妥。但可以考虑有个针对所有数据去
掉 outliers 的方案(consistency in treating all data)? 也许最简单的就是先
计算所有datasets 的 SD,然后排除大于多少个 SD 的数据?
GraphPad 网页上有个outlier calculator,可以试试:
http://graphpad.com/quickcalcs/Grubbs1.cfm
网页上的也可以点击 “principles of outlier detection” 和 “exactly how this
test works”阅读更多细节
r******9
发帖数: 2632
5
别瞎整。
无知不会成为被谅解的理由。
D***a
发帖数: 516
6
谢谢你的建议。

this

【在 G*****h 的大作中提到】
: 单独因为自己觉得是 outlier 而把它去掉也许不妥。但可以考虑有个针对所有数据去
: 掉 outliers 的方案(consistency in treating all data)? 也许最简单的就是先
: 计算所有datasets 的 SD,然后排除大于多少个 SD 的数据?
: GraphPad 网页上有个outlier calculator,可以试试:
: http://graphpad.com/quickcalcs/Grubbs1.cfm
: 网页上的也可以点击 “principles of outlier detection” 和 “exactly how this
: test works”阅读更多细节

D***a
发帖数: 516
7
是不敢瞎整,所以要找一个大家接受的方法啊。

【在 r******9 的大作中提到】
: 别瞎整。
: 无知不会成为被谅解的理由。

s*****j
发帖数: 6435
8
费力半天,不就是为自己找个理由去掉自己看不惯的数据。

【在 G*****h 的大作中提到】
: 单独因为自己觉得是 outlier 而把它去掉也许不妥。但可以考虑有个针对所有数据去
: 掉 outliers 的方案(consistency in treating all data)? 也许最简单的就是先
: 计算所有datasets 的 SD,然后排除大于多少个 SD 的数据?
: GraphPad 网页上有个outlier calculator,可以试试:
: http://graphpad.com/quickcalcs/Grubbs1.cfm
: 网页上的也可以点击 “principles of outlier detection” 和 “exactly how this
: test works”阅读更多细节

G*****h
发帖数: 320
9
如果只是因为看不惯而去掉某个数据,肯定不合理。但也有些数据是真的不同原因导致
的 outliers。所有主要的问题是如何区别某种合理分布曲线里面的尾巴上的数据和真
正的outliers(有个方法就是通过检查一套数据的分布情况来判断)。这个在统计学上
也是个合理的问题,有相应的处理方案。一些处理方案也是在统计学上被接受的。
GraphPad 的那个网页上的一些说明还是比较不错的。当然,如果可行的话,也许最好
是重复实验、增加 biological or technical replicates。

【在 s*****j 的大作中提到】
: 费力半天,不就是为自己找个理由去掉自己看不惯的数据。
G*****h
发帖数: 320
10
补充一下:
Grubbs' and ROUT tests 方法的前提是数据符合 Gaussian distribution,同时考虑
样本大小等。应该比单单考虑 SD 要更加合理。但不合适 不是Gaussian 分布的数据。
如果用 SD 倍数来判断,最近有人提出了一个替代方案,可以作参考:
"Detecting outliers: Do not use standard deviation around the mean, use
absolute deviation around the median" Journal of Experimental Social
Psychology, Volume 49, Issue 4, July 2013, Pages 764–766.
http://www.sciencedirect.com/science/article/pii/S0022103113000
纯属个人看法,仅供参考 :)
相关主题
如何算P value?问个生物计算中的for loop的问题
Nature, 叶诗文, 造假, 饶毅, 施一公, 王小东总结2016.08.08【记录历史】谁重复验证了NgAgo?
请教:如何处理outlier data请教这个图是用什么软件做出来的?
进入Biology版参与讨论
D*a
发帖数: 6830
11
用median?
t******k
发帖数: 599
12
密立根做油滴实验的时候据说就是这么搞的。
G*****h
发帖数: 320
13
是 median。这篇文章提出的 alternative approach 是先计算 median absolute
deviation (MAD),然后根据严格程度选择一个阈值:“the values of 3 (very
conservative), 2.5 (moderately conservative) or even 2 (poorly conservative)
”。类似于 mean 加减 几个SD 的方法,但 median 加减几个 MAD 的处理方法,应该
对符合和不符合正态分布的数据都合理吧。

【在 D*a 的大作中提到】
: 用median?
s******s
发帖数: 13035
14
只要consistent就行。lz又不是做统计的,没人会有意见。

this

【在 G*****h 的大作中提到】
: 单独因为自己觉得是 outlier 而把它去掉也许不妥。但可以考虑有个针对所有数据去
: 掉 outliers 的方案(consistency in treating all data)? 也许最简单的就是先
: 计算所有datasets 的 SD,然后排除大于多少个 SD 的数据?
: GraphPad 网页上有个outlier calculator,可以试试:
: http://graphpad.com/quickcalcs/Grubbs1.cfm
: 网页上的也可以点击 “principles of outlier detection” 和 “exactly how this
: test works”阅读更多细节

c***n
发帖数: 223
15
take the median
b*******8
发帖数: 37364
16
这样永远都发现不了原子核?
H*******i
发帖数: 196
17
"经常"有一个值跟其他的相差很多
你不能指出是为什么么?
c*****i
发帖数: 1392
18
这就是为什么实验要qualify的原因,因为你不知道是实验误差还是错误操作。

【在 D***a 的大作中提到】
: 在做luciferase assay,重复5个孔,经常有一个值跟其他的相差很多。比如别的都是
: 30到60,这个200多。在做统计时,是不是允许去除这个值?谢谢。

1 (共1页)
进入Biology版参与讨论
相关主题
请教--关于p value的计算统计学问题求教
求一个graphpad prism 5的下载啊如何算P value?
Help: SigmaPlot for surviving fraction curveNature, 叶诗文, 造假, 饶毅, 施一公, 王小东
这个图是怎么做出来的?请教:如何处理outlier data
求教一个生物统计学得问题问个生物计算中的for loop的问题
QPCR三个复孔,可以去掉一个明显偏离另两个孔的值吗?总结2016.08.08【记录历史】谁重复验证了NgAgo?
How to define an outlier in statistical analysis?请教这个图是用什么软件做出来的?
刚刚在lab meeting上吵架了如何在同一个EXCEL图中显示2个差异很大的数字?
相关话题的讨论汇总
话题: sd话题: median话题: 数据话题: 去掉话题: outliers