由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - data science如何进阶呢?
相关主题
请推荐data science 在线学习的programData Engineer Summer Intern at NEC Labs America, Princeton
讲个找数据科学工作的捷径 aka 刷Kaggle题迅速入门data scient (转载)请教insight health data的面试
请教Data incubator的challenge装不了scipy 包,提示没装MKL
data analysis part time jobfresh PhD 求职求内推,非常感谢!
有没有人一起组队做kaggle?发个面经吧[Data Scientist]
python用起来没有matlab好使,尤其是数据处理版上有推荐的data scientist的面经吗?
求推荐scikit-learn初级project, 含codeHastie/Tibs 的新书下载 (转载)
data scientist position分析股票应该用那种算法?
相关话题的讨论汇总
话题: data话题: learning话题: science话题: 进阶话题: machine
进入DataSciences版参与讨论
1 (共1页)
f*****n
发帖数: 499
1
小弟我从生物信息phd想转到data science
自己做过的有NGS-genomics之类的研究
也做过基于clinical feature 用ML进行phenotype prediction的研究
熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
learn)这一套
学习了bishop的PRML,当然也补课了multi calculus,和线性代数
也刷过一些kaggle
刷kaggle和自己的phenotype prediction的套路都是:
feature engineering, data cleaning, machine learning data training, test
prediction, data visulization
请问掌握这些我算是入门了吗?
如果入门了的话,如何进阶呢?
是继续加深我的machine learning/数学的基础知识,以及加强python coding能力 (
我的自学当然不能跟科班比)
还是继续学习新的东西,比如mapreduce,Hadoop,NLP,deep learning之类的?
我有想过data science和CS两条出路,我觉得CS工作更多,而且基本上刷题就可以,目
标明确
但我对data sci更有兴趣,而且跟我的bioinformatics背景更加match
另外我觉得是不是data sci就那么些套路,比较简单?(或许我想错了?)
谢谢大家
m******n
发帖数: 453
2
开始刷题
因为DS的面试要刷题
f*****n
发帖数: 499
3
您说的刷题是刷leetcode
还是kaggle


: 开始刷题

: 因为DS的面试要刷题



【在 m******n 的大作中提到】
: 开始刷题
: 因为DS的面试要刷题

N**N
发帖数: 1713
4
我觉得你会的已经很多了
可以看一些工作的要求,决定自己喜欢哪类,然后根据技术要求以及别人的面试经验决
定下面做什么

【在 f*****n 的大作中提到】
: 小弟我从生物信息phd想转到data science
: 自己做过的有NGS-genomics之类的研究
: 也做过基于clinical feature 用ML进行phenotype prediction的研究
: 熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
: learn)这一套
: 学习了bishop的PRML,当然也补课了multi calculus,和线性代数
: 也刷过一些kaggle
: 刷kaggle和自己的phenotype prediction的套路都是:
: feature engineering, data cleaning, machine learning data training, test
: prediction, data visulization

t******o
发帖数: 61
5
多交流 多练忽悠 多参加活动 多联系校友帮忙递简历
技术够可以了
精力放在别地方
f*****n
发帖数: 499
6
我只能说入门,都了解一些,不是睁眼瞎
不要说machine learning,哪怕是python pandas,numpy我都不敢说精通,只能说碰到
问题就google解决
更不要说machine learning里那些高深的数学了。。。

【在 N**N 的大作中提到】
: 我觉得你会的已经很多了
: 可以看一些工作的要求,决定自己喜欢哪类,然后根据技术要求以及别人的面试经验决
: 定下面做什么

f*******6
发帖数: 56
7
自己多收收网上DATA SCIENTIST, 尤其是MACHINE LEARNING的面试题,看自己会多少
,就知道自己现在的分量。

【在 f*****n 的大作中提到】
: 小弟我从生物信息phd想转到data science
: 自己做过的有NGS-genomics之类的研究
: 也做过基于clinical feature 用ML进行phenotype prediction的研究
: 熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
: learn)这一套
: 学习了bishop的PRML,当然也补课了multi calculus,和线性代数
: 也刷过一些kaggle
: 刷kaggle和自己的phenotype prediction的套路都是:
: feature engineering, data cleaning, machine learning data training, test
: prediction, data visulization

1 (共1页)
进入DataSciences版参与讨论
相关主题
分析股票应该用那种算法?有没有人一起组队做kaggle?
PRML书上附录697页的矩阵求导是不是写错了?python用起来没有matlab好使,尤其是数据处理
有人读过Bishop的Pattern Recognition and Machine Learning么?求推荐scikit-learn初级project, 含code
请问DS的面试主要要准备什么?data scientist position
请推荐data science 在线学习的programData Engineer Summer Intern at NEC Labs America, Princeton
讲个找数据科学工作的捷径 aka 刷Kaggle题迅速入门data scient (转载)请教insight health data的面试
请教Data incubator的challenge装不了scipy 包,提示没装MKL
data analysis part time jobfresh PhD 求职求内推,非常感谢!
相关话题的讨论汇总
话题: data话题: learning话题: science话题: 进阶话题: machine