请教个bioinformatics的问题 - Biology版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Biology版 - 请教个bioinformatics的问题

相关主题
● 请问Genome Biology的投稿有啥要注意的	● 求意见：想找个烂journal把paper发了毕业
● bmc bioinformatics和bmc genomics哪个好？	● BMC Medicine这个杂志怎么样？
● Re: bioinformatics的杂志	● 请推荐接受短篇幅小文章的bioinformatics, computational biology的杂志
● 哪些生物journal发表论文是免费的	● 提供审稿机会(生物信息方向)
● 求定位	● 继续求生物信息审稿机会
● 求建议：文章共同一作的先后顺序，两博后相持不下	● 求审稿机会（基因组学，生物信息学）
● 终于见识了PLOS ONE 的威力了	● Plos One 的好处这么多为啥不受待见?
● 此人为何能在NIBS做资深研究员？	● 生物千老能做什么兼职？谢谢

相关话题的讨论汇总
话题: 问题话题: tp话题: false话题: plos

进入Biology版参与讨论

1

(共1页)

e*********6 发帖数: 3453	1 在bioinformatics里边，各种做prediction是个热门话题，但是有个问题始终搞不明白比如看这篇文章，http://www.nature.com/articles/srep28517 他的方法以及他对比的方法，都有1%的false positive，这在同类研究中已经算是非常好的成果了, 画个ROC算个AUC都很好看，但是有个问题很不解，因为在整个基因组上，想要的interesting points（这里是 promoter）是非常非常稀疏的，也就几万个，人体基因组有3 billion bp，就算100个 bp一个间隔来创造备选的样品（长度200bp来算只有50% overlap了），这就有30 million个samples，就算百分之一的false positive，那就有30万个false positive，已经是true positive的好多倍了，这种问题如何在进一步解决呢？并且，类似这种paper，包括发在非常decent，high-impact的journal上的（包括plos 系列，BMC系列，包括这篇是nature系列的），都没提到过如何解决这个问题？
I**********r 发帖数: 72	2 你说的是文章中的accuracy 吗？
e*********6 发帖数: 3453	3 差不多吧，不过他的accuracy没细看啥意思，但是应该false positive和false negative都是百分之一左右【在 I**********r 的大作中提到】 : 你说的是文章中的accuracy 吗？
n******g 发帖数: 2201	4 decent? Scientific Report is a trash journal. Even Nature is trash plos 【在 e*********6 的大作中提到】 : 在bioinformatics里边，各种做prediction是个热门话题，但是有个问题始终搞不明白 : 比如看这篇文章，http://www.nature.com/articles/srep28517 : 他的方法以及他对比的方法，都有1%的false positive，这在同类研究中已经算是非常 : 好的成果了, 画个ROC算个AUC都很好看，但 : 是有个问题很不解，因为在整个基因组上，想要的interesting points（这里是 : promoter）是非常非常稀疏的，也就几万个，人体基因组有3 billion bp，就算100个 : bp一个间隔来创造备选的样品（长度200bp来算只有50% overlap了），这就有30 : million个samples，就算百分之一的false positive，那就有30万个false positive， : 已经是true positive的好多倍了，这种问题如何在进一步解决呢？ : 并且，类似这种paper，包括发在非常decent，high-impact的journal上的（包括plos
s*****c 发帖数: 753	5 1% false negative? On average, PEDLA achieved 95.0% accuracy, a 96.8% GM (99.0% sensitivity and 94.6% specificity) and a 78.7% F1-score (99.0% recall and 65.4% precision) 99% sensitivity or recall means FN is 1% of the TP. 65% precision means FP is 50% of TP. not 好多倍 94.6% specificity means FP is 5.7% of TN. TP:TN ~ 1:10 plos 【在 e*********6 的大作中提到】 : 在bioinformatics里边，各种做prediction是个热门话题，但是有个问题始终搞不明白 : 比如看这篇文章，http://www.nature.com/articles/srep28517 : 他的方法以及他对比的方法，都有1%的false positive，这在同类研究中已经算是非常 : 好的成果了, 画个ROC算个AUC都很好看，但 : 是有个问题很不解，因为在整个基因组上，想要的interesting points（这里是 : promoter）是非常非常稀疏的，也就几万个，人体基因组有3 billion bp，就算100个 : bp一个间隔来创造备选的样品（长度200bp来算只有50% overlap了），这就有30 : million个samples，就算百分之一的false positive，那就有30万个false positive， : 已经是true positive的好多倍了，这种问题如何在进一步解决呢？ : 并且，类似这种paper，包括发在非常decent，high-impact的journal上的（包括plos
e*********6 发帖数: 3453	6 问题就在这里，他抽样了是tp比tn一比十，从方法上说没问题，但现实应用起来，实际是一比一百万 and 【在 s*****c 的大作中提到】 : : 1% false negative? : On average, PEDLA achieved 95.0% accuracy, a 96.8% GM (99.0% sensitivity and : 94.6% specificity) and a 78.7% F1-score (99.0% recall and 65.4% precision) : 99% sensitivity or recall means FN is 1% of the TP. : 65% precision means FP is 50% of TP. not 好多倍 : 94.6% specificity means FP is 5.7% of TN. : TP:TN ~ 1:10 : plos
r********6 发帖数: 27	7 [在 nostring (尼) 的大作中提到：] :decent? Scientific Report is a trash journal. :Even Nature is trash :plos 老兄火气很很大啊哈哈哈哈哈
c***3 发帖数: 251	8 Scientific reports 上面的生物信息的文章，我建议你不要看。大部分水平都不行，但得质量可以，都会发表在，genome biology， plos CB 或者 bioinformatics上面了问题就在这里，他抽样了是tp比tn一比十，从方法上说没问题，但现实应用起来，实际【在 e*********6 的大作中提到】 : 问题就在这里，他抽样了是tp比tn一比十，从方法上说没问题，但现实应用起来，实际 : 是一比一百万 : : and

1

(共1页)

进入Biology版参与讨论

相关主题
● 生物千老能做什么兼职？谢谢	● 求定位
● paper help please	● 求建议：文章共同一作的先后顺序，两博后相持不下
● Plos One是非常大的进步	● 终于见识了PLOS ONE 的威力了
● 文章档次对以后事业发展影响有多大？	● 此人为何能在NIBS做资深研究员？
● 请问Genome Biology的投稿有啥要注意的	● 求意见：想找个烂journal把paper发了毕业
● bmc bioinformatics和bmc genomics哪个好？	● BMC Medicine这个杂志怎么样？
● Re: bioinformatics的杂志	● 请推荐接受短篇幅小文章的bioinformatics, computational biology的杂志
● 哪些生物journal发表论文是免费的	● 提供审稿机会(生物信息方向)

相关话题的讨论汇总
话题: 问题话题: tp话题: false话题: plos

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)