P*****6 发帖数: 273 | 1 请问各位大牛,有人知道data mining 的技术在bioinformatics上的应用效果如何?随着一个样品的各种类型的测序结果越多,high dimension curse 应该更大了。我觉得即使是sparse 的各种算法也只能改进一小部分。看理论分析和simulation,个人认为算法的改进对最终的predict error的改进从生物医学的角度其实显著性并不高。Bayesian statistics 整合多个database会有不会有较大改进? |
L********d 发帖数: 3820 | 2 bioinfo不就是一直在用data mining的各种技术么?
算法再怎么改都比不过你的数据量多有用,high dimension curse主要是data数量不够
要想build一个好predictor,有足够精确的training sample才是王道
bayesian statistics和classic方法的区别就是bayesian combine了prior knowledge和
observations,什么叫综合了很多databases?
bayesian methods早就已经广泛并大量地应用在bioinfo中了
随着一个样品的各种类型的测序结果越多,high dimension curse 应该更大了。我觉
得即使是sparse 的各种算法也只能改进一小部分。看理论分析和simulation,个人认
为算法的改进对最终的predic
【在 P*****6 的大作中提到】 : 请问各位大牛,有人知道data mining 的技术在bioinformatics上的应用效果如何?随着一个样品的各种类型的测序结果越多,high dimension curse 应该更大了。我觉得即使是sparse 的各种算法也只能改进一小部分。看理论分析和simulation,个人认为算法的改进对最终的predict error的改进从生物医学的角度其实显著性并不高。Bayesian statistics 整合多个database会有不会有较大改进?
|
P*****6 发帖数: 273 | 3 感谢楼上的回答,我也觉得足够的training sample至关重要。Bayesian statistics
我没有用过,正想用,不知道效果如何。我说综合了多个databases的意思跟你的一样
。 prior knowledge 更科学。
knowledge和
【在 L********d 的大作中提到】 : bioinfo不就是一直在用data mining的各种技术么? : 算法再怎么改都比不过你的数据量多有用,high dimension curse主要是data数量不够 : 要想build一个好predictor,有足够精确的training sample才是王道 : bayesian statistics和classic方法的区别就是bayesian combine了prior knowledge和 : observations,什么叫综合了很多databases? : bayesian methods早就已经广泛并大量地应用在bioinfo中了 : : 随着一个样品的各种类型的测序结果越多,high dimension curse 应该更大了。我觉 : 得即使是sparse 的各种算法也只能改进一小部分。看理论分析和simulation,个人认 : 为算法的改进对最终的predic
|