由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 请问单纯提高成熟算法速度的文章能发nature methods么
相关主题
一半实验一半生物信息求选择建议高年级PhD毕业求建议
此人为何能在NIBS做资深研究员?关于没能发成paper的project
请问Genome Biology的投稿有啥要注意的bioinformatics吐下槽
继续求生物信息审稿机会bioinformatics postdoc poition($35,000 - $40,000)
问个whole exome capture之后出来的data要怎么分析该转到computational bio领域吗
贡献一个SNP/Indel calling pipelineBioinformatics招人 提供refer
急问:需要多少内存Re: bioinformatics的杂志
Nature Methods为啥总有些很烂的文章?哪些生物journal发表论文是免费的
相关话题的讨论汇总
话题: nm话题: 算法话题: br话题: methods
进入Biology版参与讨论
1 (共1页)
c**y
发帖数: 1
1
想请问下,手上一篇文章,如果唯一的优点是比现有成熟的算法快几十倍(比方说
bowtie 2),其他指标都相当,那么这种东西能发nature methods的短文么...
thx
z**********5
发帖数: 63
2
当然。
都可以开公司了
c**y
发帖数: 1
3
想请问下在小组里可能性大么,要是可能性不大,我就直接投bioinformatics了...

【在 z**********5 的大作中提到】
: 当然。
: 都可以开公司了

n******7
发帖数: 12463
4
可以试试,rnaseq这几年的提高就是这种类型的


: 想请问下在小组里可能性大么,要是可能性不大,我就直接投bioinformatics了
...



【在 c**y 的大作中提到】
: 想请问下在小组里可能性大么,要是可能性不大,我就直接投bioinformatics了...
h****n
发帖数: 92
5
这个也看被改进的算法现在有多少人在用。GATK就不要提了,已经被人做了。
n******7
发帖数: 12463
6
你说edico吗?他们那个主要是工程性质,不算算法


: 这个也看被改进的算法现在有多少人在用。GATK就不要提了,已经被人做了。



【在 h****n 的大作中提到】
: 这个也看被改进的算法现在有多少人在用。GATK就不要提了,已经被人做了。
c**y
发帖数: 1
7
请问nature methods是不是不是很看重速度...?需不需要找一些生物学上的亮点?
我和生院的人讨论了的时候,他们觉得速度提升不是一件很重要的事情...

【在 n******7 的大作中提到】
: 可以试试,rnaseq这几年的提高就是这种类型的
:
:
: 想请问下在小组里可能性大么,要是可能性不大,我就直接投bioinformatics了
: ...
:

n******7
发帖数: 12463
8
你读读sailfish salmon kallisto 的文章找找感觉?
我又看了一遍你的标题,你是说你更好的实现了已有算法,让它快了几十倍?


: 请问nature methods是不是不是很看重速度...?需不需要找一些生物学上的亮点?

: 我和生院的人讨论了的时候,他们觉得速度提升不是一件很重要的事情...



【在 c**y 的大作中提到】
: 请问nature methods是不是不是很看重速度...?需不需要找一些生物学上的亮点?
: 我和生院的人讨论了的时候,他们觉得速度提升不是一件很重要的事情...

c**y
发帖数: 1
9
好吧我直接说了好了。我就是做了一个新的甲基化比对方法:
1. 比最常用的Bismark和BSMAP快了几十倍(最好情况大于80倍)
2. 比后来一些新方法也快了一个数量级。这些新方法的召回率和准确率都有问题,
我的方法召回率和准确率都高于这些方法,和Bismark相当。
3. 也不是纯实现,肯定是从计算机算法角度有些创新,才能快几十倍
差不多是这么个情况...

点?

【在 n******7 的大作中提到】
: 你读读sailfish salmon kallisto 的文章找找感觉?
: 我又看了一遍你的标题,你是说你更好的实现了已有算法,让它快了几十倍?
:
:
: 请问nature methods是不是不是很看重速度...?需不需要找一些生物学上的亮点?
:
: 我和生院的人讨论了的时候,他们觉得速度提升不是一件很重要的事情...
:

n******7
发帖数: 12463
10
要是真的跟你说的这样,我非常喜欢你这个方法
之前做了很久的WGBS分析,用的Bismark,速度太慢了,还一堆没用的CHG结果
这玩意记得是5千多行perl,很多hard coded的部分,我在12个地方做了同样的改动,
才把输出文件大小降低了两个数量级
一直想methylation calling要是能快一些就好了
也在脑子里面琢磨过一些方案,但是没有精力实际去试,也不一定work
不过,你这个东西有两点:
1. 相对于主流的WGS和RNA-Seq,WGBS是比较冷门的东西,需求有限,所以你这个方法
的影响力注定要弱一些
2. 还是因为不那么流行,这类数据也相对较少,即使慢点,也能忍受
我给你一个列子,若干年前,我们要处理XX TB的RNA-seq data
先是用tophat,一个哥们儿断断续续高了几个月,各种数据转腾挪移
后来出来一个新方法,我用它重新处理了大部分数据,记得不到两周搞定
如果用最新的这波几分钟一个sample的方法,估计两天之内搞定
有需求有大量数据的情况下,大家当然喜欢快的方法
如果你说的是真的,我坚信你这个东西是好东西。但是能不能发NM,就有太多不确定因
素了,也看你的追求。
只是追求知名度的话,bioinformatics 搞个application note,就两页纸,省事。
Github维护勤快点,到处推广你的工具,很快就可以成为业界主流
就是申请绿卡(假设你还没有)也非常有用

【在 c**y 的大作中提到】
: 好吧我直接说了好了。我就是做了一个新的甲基化比对方法:
: 1. 比最常用的Bismark和BSMAP快了几十倍(最好情况大于80倍)
: 2. 比后来一些新方法也快了一个数量级。这些新方法的召回率和准确率都有问题,
: 我的方法召回率和准确率都高于这些方法,和Bismark相当。
: 3. 也不是纯实现,肯定是从计算机算法角度有些创新,才能快几十倍
: 差不多是这么个情况...
:
: 点?

相关主题
急问:需要多少内存关于没能发成paper的project
Nature Methods为啥总有些很烂的文章?bioinformatics吐下槽
高年级PhD毕业求建议bioinformatics postdoc poition($35,000 - $40,000)
进入Biology版参与讨论
n******7
发帖数: 12463
11
另外说起NM这个杂志,几年前我在版面上问过
为啥一个估算需要测序深度的简单辅助工具也能发
被某位版主教育,搞计算的人做的东西再烂,你们千老也要膜拜学习
我只能呵呵了
c**y
发帖数: 1
12
跪谢。东西肯定是真的,在人类基因组上我换了好几个公开数据集结果都是类似的效果
(Hiseq 2500/Nextseq 500/Hiseq X)。
因为我们这边是小组,不知道这玩意投nature methods是不是要大牛背书。
肯定是想分高点,因为本身也有bioinformatics,多个短文好像也没啥太大意义...而
且多搞一篇bioinformatics(还是短文)感觉找工作也没有太大帮助...
而且NM的短文写起来也很简单...
我的正常预期是想看能不能中个genome research? 您看这种文章发在GR上靠谱么

【在 n******7 的大作中提到】
: 另外说起NM这个杂志,几年前我在版面上问过
: 为啥一个估算需要测序深度的简单辅助工具也能发
: 被某位版主教育,搞计算的人做的东西再烂,你们千老也要膜拜学习
: 我只能呵呵了

j*********g
发帖数: 463
13
至少能发GR吧?Nat Comm我看也有纯卖分析工具的文章呀(用一点点实验)。
核酸研究和Bioinformatics哪个好?

【在 c**y 的大作中提到】
: 跪谢。东西肯定是真的,在人类基因组上我换了好几个公开数据集结果都是类似的效果
: (Hiseq 2500/Nextseq 500/Hiseq X)。
: 因为我们这边是小组,不知道这玩意投nature methods是不是要大牛背书。
: 肯定是想分高点,因为本身也有bioinformatics,多个短文好像也没啥太大意义...而
: 且多搞一篇bioinformatics(还是短文)感觉找工作也没有太大帮助...
: 而且NM的短文写起来也很简单...
: 我的正常预期是想看能不能中个genome research? 您看这种文章发在GR上靠谱么

n******7
发帖数: 12463
14
GR的文章个人感觉需要很多生物方面的分析
不知道收纯method的短文不
GB上倒是读过不少methylation的方法文章
记得bsmap还是bsmooth就是发在gb上
不过这个杂志觉得比GR还是差半档
你还是先试试NM吧,反正也没啥损失
投稿前bioarxv github都先搞上,也不怕reviewer使坏


: 跪谢。东西肯定是真的,在人类基因组上我换了好几个公开数据集结果都是类似
的效果

: (Hiseq 2500/Nextseq 500/Hiseq X)。

: 因为我们这边是小组,不知道这玩意投nature methods是不是要大牛背书。

: 肯定是想分高点,因为本身也有bioinformatics,多个短文好像也没啥太大意义
...而

: 且多搞一篇bioinformatics(还是短文)感觉找工作也没有太大帮助...

: 而且NM的短文写起来也很简单...

: 我的正常预期是想看能不能中个genome research? 您看这种文章发在GR上靠谱么



【在 c**y 的大作中提到】
: 跪谢。东西肯定是真的,在人类基因组上我换了好几个公开数据集结果都是类似的效果
: (Hiseq 2500/Nextseq 500/Hiseq X)。
: 因为我们这边是小组,不知道这玩意投nature methods是不是要大牛背书。
: 肯定是想分高点,因为本身也有bioinformatics,多个短文好像也没啥太大意义...而
: 且多搞一篇bioinformatics(还是短文)感觉找工作也没有太大帮助...
: 而且NM的短文写起来也很简单...
: 我的正常预期是想看能不能中个genome research? 您看这种文章发在GR上靠谱么

h*****s
发帖数: 153
15
try it.
They like it or reject, u will see the result in a week or so. Super quick.
Most papers got rejected within three days in NM...
d********m
发帖数: 3662
16
嗯,很有那位版主的风格

【在 n******7 的大作中提到】
: 另外说起NM这个杂志,几年前我在版面上问过
: 为啥一个估算需要测序深度的简单辅助工具也能发
: 被某位版主教育,搞计算的人做的东西再烂,你们千老也要膜拜学习
: 我只能呵呵了

d********m
发帖数: 3662
17
这个东西,我个人的感觉是这么快怎么来。杂志的档次是次要的
你这个内容听起来很酷炫,但单纯改进了一点算法,就算发了NM,找教职比也不一定比
发了bioinformatics更管用。
c**y
发帖数: 1
18

不晓得,感觉cs这边更认bioinformatics一点?

【在 j*********g 的大作中提到】
: 至少能发GR吧?Nat Comm我看也有纯卖分析工具的文章呀(用一点点实验)。
: 核酸研究和Bioinformatics哪个好?

c**y
发帖数: 1
19
ok,跪谢。不过我记得bowtie不就是在发在GR上么,他那个时候好像就是纯方法

【在 n******7 的大作中提到】
: GR的文章个人感觉需要很多生物方面的分析
: 不知道收纯method的短文不
: GB上倒是读过不少methylation的方法文章
: 记得bsmap还是bsmooth就是发在gb上
: 不过这个杂志觉得比GR还是差半档
: 你还是先试试NM吧,反正也没啥损失
: 投稿前bioarxv github都先搞上,也不怕reviewer使坏
:
:
: 跪谢。东西肯定是真的,在人类基因组上我换了好几个公开数据集结果都是类似
: 的效果

c**y
发帖数: 1
20
好嘞,我去试试。多谢多谢

.

【在 h*****s 的大作中提到】
: try it.
: They like it or reject, u will see the result in a week or so. Super quick.
: Most papers got rejected within three days in NM...

相关主题
该转到computational bio领域吗哪些生物journal发表论文是免费的
Bioinformatics招人 提供refer浅谈生物信息的职业发展规划
Re: bioinformatics的杂志求建议:文章共同一作的先后顺序,两博后相持不下
进入Biology版参与讨论
c**y
发帖数: 1
21
这么尴尬的么,NM找工作不如bioinformatics么...
搭车请问下,cs找工作两三篇bioinformatics能去哪?都是纯方法的文章

【在 d********m 的大作中提到】
: 这个东西,我个人的感觉是这么快怎么来。杂志的档次是次要的
: 你这个内容听起来很酷炫,但单纯改进了一点算法,就算发了NM,找教职比也不一定比
: 发了bioinformatics更管用。

z**********5
发帖数: 63
22

没戏。这个问题本来就没有这么重要。
Bioinformatics 估计也玄,BMC Bioinformatics是最终归宿。

【在 c**y 的大作中提到】
: 好吧我直接说了好了。我就是做了一个新的甲基化比对方法:
: 1. 比最常用的Bismark和BSMAP快了几十倍(最好情况大于80倍)
: 2. 比后来一些新方法也快了一个数量级。这些新方法的召回率和准确率都有问题,
: 我的方法召回率和准确率都高于这些方法,和Bismark相当。
: 3. 也不是纯实现,肯定是从计算机算法角度有些创新,才能快几十倍
: 差不多是这么个情况...
:
: 点?

e*********6
发帖数: 3453
23
你的算法变快了,有没有trade off,比如内存占用变大, 因为什么原因变快了,是big
o小了一个级别,还是单纯常数项小了
c**y
发帖数: 1
24
没啥trade off,可能的trade off是估计在低质量的数据集上mapping率可能有点下降
。但是现在read质量一般都很高吧?
只是减了一点常数项,所以方法上谈不上巨大的创新...

big

【在 e*********6 的大作中提到】
: 你的算法变快了,有没有trade off,比如内存占用变大, 因为什么原因变快了,是big
: o小了一个级别,还是单纯常数项小了

c**y
发帖数: 1
25
这个就扯了吧,bioinformatics收这种文章还是没问题吧,Bismark 11年的文章引用都
1000多了。而且bioinformatics本很会收一些不知所谓的东西。
不过的确没有WGS和WES那么重要。

【在 z**********5 的大作中提到】
:
: 没戏。这个问题本来就没有这么重要。
: Bioinformatics 估计也玄,BMC Bioinformatics是最终归宿。

e*********6
发帖数: 3453
26
这还是有trade off,就看这个产品是否需要了,对我们做计算的,实验那边才是客户
,要为马首是瞻

:没啥trade off,可能的trade off是估计在低质量的数据集上mapping率可能有点下降
:。但是现在read质量一般都很高吧?
c**y
发帖数: 1
27
只能说写论文的时候可以不暴露出来,因为几乎没有低质量的测序数据,,,
其实像diamond和hisat都有类似的问题

下降

【在 e*********6 的大作中提到】
: 这还是有trade off,就看这个产品是否需要了,对我们做计算的,实验那边才是客户
: ,要为马首是瞻
:
: :没啥trade off,可能的trade off是估计在低质量的数据集上mapping率可能有点下降
: :。但是现在read质量一般都很高吧?

s*******o
发帖数: 24
28
建议发bioinformatics, NM希望不大
b********d
发帖数: 16
29
NM 大多数投稿都不送审,editor一周就会据了。所以试一下也没什么损失。
另外也可以考虑投NAR和GB。

【在 c**y 的大作中提到】
: 想请问下,手上一篇文章,如果唯一的优点是比现有成熟的算法快几十倍(比方说
: bowtie 2),其他指标都相当,那么这种东西能发nature methods的短文么...
: thx

d********m
发帖数: 3662
30
it does not make any difference if the report is short and brief.

【在 c**y 的大作中提到】
: 这么尴尬的么,NM找工作不如bioinformatics么...
: 搭车请问下,cs找工作两三篇bioinformatics能去哪?都是纯方法的文章

相关主题
请教一下各位评价一下几个杂志水平还有投稿难易程度此人为何能在NIBS做资深研究员?
老板对博厚的expectation请问Genome Biology的投稿有啥要注意的
一半实验一半生物信息求选择建议继续求生物信息审稿机会
进入Biology版参与讨论
c**y
发帖数: 1
31
thx

【在 d********m 的大作中提到】
: it does not make any difference if the report is short and brief.
s******s
发帖数: 13035
32
有没有试过biscuit

【在 n******7 的大作中提到】
: 要是真的跟你说的这样,我非常喜欢你这个方法
: 之前做了很久的WGBS分析,用的Bismark,速度太慢了,还一堆没用的CHG结果
: 这玩意记得是5千多行perl,很多hard coded的部分,我在12个地方做了同样的改动,
: 才把输出文件大小降低了两个数量级
: 一直想methylation calling要是能快一些就好了
: 也在脑子里面琢磨过一些方案,但是没有精力实际去试,也不一定work
: 不过,你这个东西有两点:
: 1. 相对于主流的WGS和RNA-Seq,WGBS是比较冷门的东西,需求有限,所以你这个方法
: 的影响力注定要弱一些
: 2. 还是因为不那么流行,这类数据也相对较少,即使慢点,也能忍受

h****n
发帖数: 92
33
不是。Sentieon,纯算法加速,10X以上。

【在 n******7 的大作中提到】
: 你说edico吗?他们那个主要是工程性质,不算算法
:
:
: 这个也看被改进的算法现在有多少人在用。GATK就不要提了,已经被人做了。
:

1 (共1页)
进入Biology版参与讨论
相关主题
浅谈生物信息的职业发展规划问个whole exome capture之后出来的data要怎么分析
求建议:文章共同一作的先后顺序,两博后相持不下贡献一个SNP/Indel calling pipeline
请教一下各位评价一下几个杂志水平还有投稿难易程度急问:需要多少内存
老板对博厚的expectationNature Methods为啥总有些很烂的文章?
一半实验一半生物信息求选择建议高年级PhD毕业求建议
此人为何能在NIBS做资深研究员?关于没能发成paper的project
请问Genome Biology的投稿有啥要注意的bioinformatics吐下槽
继续求生物信息审稿机会bioinformatics postdoc poition($35,000 - $40,000)
相关话题的讨论汇总
话题: nm话题: 算法话题: br话题: methods