生物信息迄今为止没有任何贡献 - Biology版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Biology版 - 生物信息迄今为止没有任何贡献

相关主题
● 也来说说GWAS	● 乔帮主的癌细胞基因组被测序了
● 海龟同济这样的大学看来性价比不错	● 深度测序的精确度会随被测的目的基因改变吗？
● 请推荐测序和分析的公司	● 千人基因组测序的文章出来了，通讯作者是Gil A. McVean, 和王俊说的不一样
● 真的没有什么值得自豪的	● 饶毅指责共享性科研令人遗憾
● 第三代测序是什么东西?	● 比较基因组学问题请教
● J. Bacteriol 上好多测序的文章!!!	● mouse的ChIPseq结果却map到human基因组，咋回事？
● 搞下一代基因组测序怎么样？有一个老板在招千老，请教各位高人。	● 有谁知道这种图怎么画吗？
● “我国自主研发的DNA测序仪”	● 关于肠道菌群宏基因组测序

相关话题的讨论汇总
话题: 生物话题: br话题: 生信话题: 研究话题: 噪音

进入Biology版参与讨论

(共1页)

n******g
发帖数: 2201

制造了一批基因组垃圾文章

k***b
发帖数: 181

怎么可能

P****R
发帖数: 22479

还是有些成果，就是费效比差。

【在 n******g 的大作中提到】

: 制造了一批基因组垃圾文章

P****R
发帖数: 22479

说明单单从基因组序列上说明不了更多问题。

v*******e
发帖数: 11604

有用，7、8千种孟德尔遗传的病，绝大多数已经找到致病基因。着要是用以前的
pedigree、linkage做，不知道要做多少年。

l*******1
发帖数: 16217

听着这么不靠谱，还不如韩春雨
7、8千种孟德尔遗传的病，绝大多数已经找到致病基因

d********i
发帖数: 113

你这么说明显是对生物信息不了解。现在的任何一个实验室进行的高通量数据，包括
microarray, DNA 测序和RNA测序，都离不开生物信息学。你是不是觉得处理这些数据
的软件，算法，统计方法都是天上掉下来的？

【在 n******g 的大作中提到】

: 制造了一批基因组垃圾文章

t*****z
发帖数: 1598

这葡萄真酸

【在 n******g 的大作中提到】

: 制造了一批基因组垃圾文章

l****m
发帖数: 751

智商暴露贴

d*****g
发帖数: 978

估计是指临床和市场应用单纯基因组转录组蛋白组还远远不够需要更高级的模拟分
析而这个层次需要的计算分析应该大幅超出目前的状态
瓶颈应该在计算方

【在 d********i 的大作中提到】

: 你这么说明显是对生物信息不了解。现在的任何一个实验室进行的高通量数据，包括
: microarray, DNA 测序和RNA测序，都离不开生物信息学。你是不是觉得处理这些数据
: 的软件，算法，统计方法都是天上掉下来的？

相关主题
● J. Bacteriol 上好多测序的文章!!!	● 乔帮主的癌细胞基因组被测序了
● 搞下一代基因组测序怎么样？有一个老板在招千老，请教各位高人。	● 深度测序的精确度会随被测的目的基因改变吗？
● “我国自主研发的DNA测序仪”	● 千人基因组测序的文章出来了，通讯作者是Gil A. McVean, 和王俊说的不一样
进入Biology版参与讨论

l******q
发帖数: 52

a******r
发帖数: 786

跑胶屌总认为自己的下一张胶就能得炸药奖

l******r
发帖数: 18699

有些学科从诞生之日起就注定是垃圾学科

【在 n******g 的大作中提到】

: 制造了一批基因组垃圾文章

l******r
发帖数: 18699

高智商暴露贴

【在 l****m 的大作中提到】

: 智商暴露贴

h********s
发帖数: 20

你稍微读一下CRISPR的研究历史就知道自己这个结论有多么无知了，没有对间隔序列的
跨物种比对，Francisco Mojica就不可能在2005年提出CRISPR是细菌获得性免疫机制的
假说，也可能就没有后来用于基因编辑的故事了。

【在 n******g 的大作中提到】

: 制造了一批基因组垃圾文章

P****R
发帖数: 22479

【在 h********s 的大作中提到】

: 你稍微读一下CRISPR的研究历史就知道自己这个结论有多么无知了，没有对间隔序列的
: 跨物种比对，Francisco Mojica就不可能在2005年提出CRISPR是细菌获得性免疫机制的
: 假说，也可能就没有后来用于基因编辑的故事了。

c******o
发帖数: 1184

致病基因这个词有些大了，相关基因比较靠谱

【在 v*******e 的大作中提到】

: 有用，7、8千种孟德尔遗传的病，绝大多数已经找到致病基因。着要是用以前的
: pedigree、linkage做，不知道要做多少年。

x****6
发帖数: 4339

不同意，我认为问题在于生物个体的复杂性造成两个问题：数据噪音，生物过程本来就
是充满噪音的。如果输入数据不可靠，AI也分析不出什么来；数据的分辨率不够，一个
细胞在不同条件、同一个条件不同时间的行为是变化的，而且一群细胞里还有异质性。
组学不可能捕获这么细致的信息，至少目前还不太可能。

【在 d*****g 的大作中提到】

: 估计是指临床和市场应用单纯基因组转录组蛋白组还远远不够需要更高级的模拟分
: 析而这个层次需要的计算分析应该大幅超出目前的状态
: 瓶颈应该在计算方

t*****z
发帖数: 1598

你的认识已经out了。哪有数据没有噪音的？降噪就是生物信息学研究的重点之一。噪
音当然影响结果（所谓garbage in, garbage out），但是生信绝非有一点噪音就玩不
转的。
你列举的细胞状态的不同参数自然也会影响实验结果，但是高通量实验加生信可以让你
用multivariate anova研究多变量的相关性，可以用principle coordinate analysis
可视化高维度数据的clustering pattern。这些岂是跑胶能跑出来的？
反过来，生信研究还能指导实验进步，特别是高通量实验的设计。比方说，用哪种
library prep kit能得到什么样的quality的genome assembly。

【在 x****6 的大作中提到】

: 不同意，我认为问题在于生物个体的复杂性造成两个问题：数据噪音，生物过程本来就
: 是充满噪音的。如果输入数据不可靠，AI也分析不出什么来；数据的分辨率不够，一个
: 细胞在不同条件、同一个条件不同时间的行为是变化的，而且一群细胞里还有异质性。
: 组学不可能捕获这么细致的信息，至少目前还不太可能。

a********p
发帖数: 52

现在最大的问题就是停留在correlation水平上，但是各种生物过程和调控本身是动力
学过程，像本质上的gene expression dynamics, noise, non-linear dynamics,
network and emergent property 都不是靠生物信息学和统计可解的

analysis

【在 t*****z 的大作中提到】

: 你的认识已经out了。哪有数据没有噪音的？降噪就是生物信息学研究的重点之一。噪
: 音当然影响结果（所谓garbage in, garbage out），但是生信绝非有一点噪音就玩不
: 转的。
: 你列举的细胞状态的不同参数自然也会影响实验结果，但是高通量实验加生信可以让你
: 用multivariate anova研究多变量的相关性，可以用principle coordinate analysis
: 可视化高维度数据的clustering pattern。这些岂是跑胶能跑出来的？
: 反过来，生信研究还能指导实验进步，特别是高通量实验的设计。比方说，用哪种
: library prep kit能得到什么样的quality的genome assembly。

相关主题
● 饶毅指责共享性科研令人遗憾	● 有谁知道这种图怎么画吗？
● 比较基因组学问题请教	● 关于肠道菌群宏基因组测序
● mouse的ChIPseq结果却map到human基因组，咋回事？	● 请推荐细菌基因组测序公司，谢谢！
进入Biology版参与讨论

x****6
发帖数: 4339

上面那位为我解释得很清楚了。我再稍微补充一些：
从纯统计的角度，生信的统计工具的本质就是在噪音里找pattern。但是问题的关键是
生物里的噪音很有可能不是white noise, 其背后是有生物机制的，比如很多动态过程
能够造成看上去是噪音的结果/表型。生命过程的本质是“远离平衡的带噪音动态过程
”。这种过程被一小部分凝聚态物理学家专门研究。现在他们连最基本的数学框架都还
莫衷一是，物理学家都是摸着石头过河的时候，我们离深刻理解生命现象背后的原理还
差得很远。
好，在生物的语境里空谈物理也许太不着调，那我们就来谈谈生物的现实。生信里面炙
手可热的GWAS,热了几十年了，除了出了一堆学术文章以外，有没有带给我们关于生命
和健康的以前没有过的认识（science）或者在攻克某种疾病中起到决定性作用（
medicine）?
我承认组学、大数据、AI对生物学研究的意义，但是反对hype。它们的意义至少在目前
为止，是为实验提供方向、缩小实验搜索空间的辅助手段；当然在某些遗传病的诊断和
预防上，它取得了非常成功的应用。
欢迎继续辩论！

analysis

【在 t*****z 的大作中提到】

a********p
发帖数: 52

了解correlation很重要，但不是终极目的。过度的沉浸于寻找correlation而忽视本身
的物理事实只能把这个学科引向一条错路。这里又会有不少人会反驳说我们研究的是生
物又不是物理。可是，生物研究的基本对象，像生化反应和分子相互作用，哪一个又不
是一个个具体的物理过程呢？现在刚启动的human cell atlas项目，毫无疑问又会给学
生信的兄弟们带来巨大的机遇，但是最终能在多大程度上促进我们了解生物过程，我觉
得还很难说。用天文学来打个比方，是数天上有多少颗星星重要呢还是理解像万有引力
定律这些普遍遵守的规则重要呢？

【在 x****6 的大作中提到】

: 上面那位为我解释得很清楚了。我再稍微补充一些：
: 从纯统计的角度，生信的统计工具的本质就是在噪音里找pattern。但是问题的关键是
: 生物里的噪音很有可能不是white noise, 其背后是有生物机制的，比如很多动态过程
: 能够造成看上去是噪音的结果/表型。生命过程的本质是“远离平衡的带噪音动态过程
: ”。这种过程被一小部分凝聚态物理学家专门研究。现在他们连最基本的数学框架都还
: 莫衷一是，物理学家都是摸着石头过河的时候，我们离深刻理解生命现象背后的原理还
: 差得很远。
: 好，在生物的语境里空谈物理也许太不着调，那我们就来谈谈生物的现实。生信里面炙
: 手可热的GWAS,热了几十年了，除了出了一堆学术文章以外，有没有带给我们关于生命
: 和健康的以前没有过的认识（science）或者在攻克某种疾病中起到决定性作用（

s******s
发帖数: 13035

你是要砸我饭碗啊，哈哈
correlation水平不够么？为啥一定要研究到本质上？现在都讲转化医学，
有解决问题就好。这个和大数据的概念一样，不用纠结物理模型，直接
用数据堆，噪音自然减少，信号自动出来。当然生物里面复杂一点，很
多不是白噪音而是bias, 光靠堆数据还不够

【在 a********p 的大作中提到】

: 现在最大的问题就是停留在correlation水平上，但是各种生物过程和调控本身是动力
: 学过程，像本质上的gene expression dynamics, noise, non-linear dynamics,
: network and emergent property 都不是靠生物信息学和统计可解的
:
: analysis

c******o
发帖数: 1184

从学问的角度不能更同意
但是现在的资本和经费更青睐于不求甚解，这也是现在机器学习流行的一个副产品

【在 a********p 的大作中提到】

: 了解correlation很重要，但不是终极目的。过度的沉浸于寻找correlation而忽视本身
: 的物理事实只能把这个学科引向一条错路。这里又会有不少人会反驳说我们研究的是生
: 物又不是物理。可是，生物研究的基本对象，像生化反应和分子相互作用，哪一个又不
: 是一个个具体的物理过程呢？现在刚启动的human cell atlas项目，毫无疑问又会给学
: 生信的兄弟们带来巨大的机遇，但是最终能在多大程度上促进我们了解生物过程，我觉
: 得还很难说。用天文学来打个比方，是数天上有多少颗星星重要呢还是理解像万有引力
: 定律这些普遍遵守的规则重要呢？

c********e
发帖数: 598

How 机器学习 works in 生物研究?

t*****z
发帖数: 1598

早就普及了。用SVM、random forest这些方法来cluster生物大数据已经是很常见的应
用。

: How 机器学习 works in 生物研究?

【在 c********e 的大作中提到】

: How 机器学习 works in 生物研究?

c********e
发帖数: 598

I did not mean those.
Now it is time for transfer learning.

【在 t*****z 的大作中提到】

: 早就普及了。用SVM、random forest这些方法来cluster生物大数据已经是很常见的应
: 用。
:
:
: How 机器学习 works in 生物研究?
:

t*****z
发帖数: 1598

确实，无须求其甚解，也足以治病救人，悬壶济世了。按照量子力学的观点，事物本身
是无意义的，事物的表现才是一切。
就算真的要探究机理，生信中通过对metabolite flux的modeling来构建pathway的技术
也已经发展得挺好了。
最简单的，你下载个基因组，往kegg上一丢，立马给你一副副pathway map。谁都可以
尝试。
从genome到transcriptome到proteome到metabolome，加上靠谱的metadata，机器能分
析出来的机理不要太多。

: 从学问的角度不能更同意

: 但是现在的资本和经费更青睐于不求甚解，这也是现在机器学习流行的一个副产品

【在 c******o 的大作中提到】

: 从学问的角度不能更同意
: 但是现在的资本和经费更青睐于不求甚解，这也是现在机器学习流行的一个副产品

t*****z
发帖数: 1598

这个我不会，也不知道在生物界是否已经有广泛的应用。
Craig venter已能通过人的DNA序列推测人的长相，不知道用了什么learning技术？

: I did not mean those.

: Now it is time for transfer learning.

【在 c********e 的大作中提到】

:
: I did not mean those.
: Now it is time for transfer learning.

t*****z
发帖数: 1598

生信学家的工作就是高屋建瓴，一览无余，先找到correlation，如果有条件，就挑几
个p-value最小的，安排些个实验员去试一试。
就好像司马懿观察武侯八卦阵，自信已经洞察其变化，遂唤出三员偏将，教他们从A门
杀入，从B门杀出，再从C门杀入，便可破这八卦阵。

: 了解correlation很重要，但不是终极目的。过度的沉浸于寻找correlation而忽
视本身

: 的物理事实只能把这个学科引向一条错路。这里又会有不少人会反驳说我们研究
的是生

: 物又不是物理。可是，生物研究的基本对象，像生化反应和分子相互作用，哪一
个又不

: 是一个个具体的物理过程呢？现在刚启动的human cell atlas项目，毫无疑问又
会给学

: 生信的兄弟们带来巨大的机遇，但是最终能在多大程度上促进我们了解生物过程
，我觉

: 得还很难说。用天文学来打个比方，是数天上有多少颗星星重要呢还是理解像万
有引力

: 定律这些普遍遵守的规则重要呢？

【在 a********p 的大作中提到】

相关主题
● 请推荐微生物基因组测序gap closure服务的公司	● 海龟同济这样的大学看来性价比不错
● 国内现在很多所谓大文章都是测序	● 请推荐测序和分析的公司
● 也来说说GWAS	● 真的没有什么值得自豪的
进入Biology版参与讨论

s******s
发帖数: 13035

最土的做法，把那些已经知道和长相有关的marker, 基因列出来，
然后做个neuronetwork就行了，可以直接图片学习，也可以分器官，分参数。
大数据的好处是，不管model有多土，其实数据量上去了，结果都能不错。

【在 t*****z 的大作中提到】

: 这个我不会，也不知道在生物界是否已经有广泛的应用。
: Craig venter已能通过人的DNA序列推测人的长相，不知道用了什么learning技术？
:
:
: I did not mean those.
:
: Now it is time for transfer learning.
:

a********p
发帖数: 52

我本人是计算生物学和生物信息专业毕业的，生物信息学多少还是学了一些，只是后来
走上了计算和定量生物学的道路。没有要贬低生物信息的意思，他毕竟给我们带来了很
多新的信息。但是，这些信息本质上是定性的，有真有假，多少程度是可靠的又多少程
度是片面的，如果没有从另外一个更严谨的角度去验证还真不知道。后来做定量生物学
，用系统微分方程建模和单细胞定量测量的方法研究哺乳动物细胞周期G1/S
transition这个老问题，竟然解出了跟经典理论完全不一样的模型。新模型考虑了物理
事实，定量可预测，并且解决了老模型难以调和的矛盾之处。科学毕竟要进步，生信的
同学们在瞧不起跑胶屌低通量的同时，是不是也该好好思考一下自己的局限又在哪里呢？

【在 s******s 的大作中提到】

: 你是要砸我饭碗啊，哈哈
: correlation水平不够么？为啥一定要研究到本质上？现在都讲转化医学，
: 有解决问题就好。这个和大数据的概念一样，不用纠结物理模型，直接
: 用数据堆，噪音自然减少，信号自动出来。当然生物里面复杂一点，很
: 多不是白噪音而是bias, 光靠堆数据还不够

(共1页)

进入Biology版参与讨论

相关主题
● 关于肠道菌群宏基因组测序	● 第三代测序是什么东西?
● 请推荐细菌基因组测序公司，谢谢！	● J. Bacteriol 上好多测序的文章!!!
● 请推荐微生物基因组测序gap closure服务的公司	● 搞下一代基因组测序怎么样？有一个老板在招千老，请教各位高人。
● 国内现在很多所谓大文章都是测序	● “我国自主研发的DNA测序仪”
● 也来说说GWAS	● 乔帮主的癌细胞基因组被测序了
● 海龟同济这样的大学看来性价比不错	● 深度测序的精确度会随被测的目的基因改变吗？
● 请推荐测序和分析的公司	● 千人基因组测序的文章出来了，通讯作者是Gil A. McVean, 和王俊说的不一样
● 真的没有什么值得自豪的	● 饶毅指责共享性科研令人遗憾

相关话题的讨论汇总
话题: 生物话题: br话题: 生信话题: 研究话题: 噪音

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天