由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 请教Data incubator的challenge
相关主题
data science如何进阶呢?data analysis part time job
讲个找数据科学工作的捷径 aka 刷Kaggle题迅速入门data scient (转载)发个面经吧[Data Scientist]
有没有人一起组队做kaggle?版上有推荐的data scientist的面经吗?
请推荐data science 在线学习的program借道同问,big data/data science到底是什么?
python用起来没有matlab好使,尤其是数据处理关于 data incubator'Scholars Program
有没有人想报Cloudera的Data Scientist Certificate的物理PHD想转data science求指导
装不了scipy 包,提示没装MKL有人去上过insight data science吗?
fresh PhD 求职求内推,非常感谢!coursera data science certificate 管用吗?
相关话题的讨论汇总
话题: data话题: incubator话题: challenge话题: project话题: ml
进入DataSciences版参与讨论
1 (共1页)
f*****n
发帖数: 499
1
随便提交了一下data incubator的申请,没想到发邮件说入围了25%可以做challenge,
具体时间是4.27 ~ 5.1
我查了一下,这个challenge貌似主要是propose project,然后会有一些statistics的
题目。
我想请教这个challenge,是可以随便自己找data做ML project么?还是必须用他们推
荐的data source?
另外,我其实压根没报啥希望,因为data incubator是面向所有专业的,要跟一堆数学
物理的人抢offer,我觉得比较够呛(我自己本科生物)。随便看了看过去的fellow,
都是什么斯坦福物理phd之类的,觉得希望不大,不晓得是否值得尝试一下?
谢谢
m******n
发帖数: 453
2
基本没有希望,如果你是那种转行的新人的话
能拿到fellow的人,都是那种早已经coding很熟,ML很熟,在Kaggle上面混迹过很久的人

【在 f*****n 的大作中提到】
: 随便提交了一下data incubator的申请,没想到发邮件说入围了25%可以做challenge,
: 具体时间是4.27 ~ 5.1
: 我查了一下,这个challenge貌似主要是propose project,然后会有一些statistics的
: 题目。
: 我想请教这个challenge,是可以随便自己找data做ML project么?还是必须用他们推
: 荐的data source?
: 另外,我其实压根没报啥希望,因为data incubator是面向所有专业的,要跟一堆数学
: 物理的人抢offer,我觉得比较够呛(我自己本科生物)。随便看了看过去的fellow,
: 都是什么斯坦福物理phd之类的,觉得希望不大,不晓得是否值得尝试一下?
: 谢谢

y******2
发帖数: 326
3
本科生就不要想了,最少cs或数学硕士,其他的要博士。要会Python 的pandas和numpy
library。会有一些分析数据的题,所以你会SQL也行。简单的统计学知识。主要是你
要有个project。到他们网站找免费的数据,做个完整的项目。你自己的数据也行,不
过必须是开放的,你拿实验室的数据不行。youtude弄个2分钟的视频讲一下你的项目。
别因为是生物的就灰心,我也是生物出来的。

【在 f*****n 的大作中提到】
: 随便提交了一下data incubator的申请,没想到发邮件说入围了25%可以做challenge,
: 具体时间是4.27 ~ 5.1
: 我查了一下,这个challenge貌似主要是propose project,然后会有一些statistics的
: 题目。
: 我想请教这个challenge,是可以随便自己找data做ML project么?还是必须用他们推
: 荐的data source?
: 另外,我其实压根没报啥希望,因为data incubator是面向所有专业的,要跟一堆数学
: 物理的人抢offer,我觉得比较够呛(我自己本科生物)。随便看了看过去的fellow,
: 都是什么斯坦福物理phd之类的,觉得希望不大,不晓得是否值得尝试一下?
: 谢谢

x****u
发帖数: 44466
4
处理数据只要有文科基础统计学知识足够,工具进步了而已,这活就是Friends里面钱
德拉干的。

numpy

【在 y******2 的大作中提到】
: 本科生就不要想了,最少cs或数学硕士,其他的要博士。要会Python 的pandas和numpy
: library。会有一些分析数据的题,所以你会SQL也行。简单的统计学知识。主要是你
: 要有个project。到他们网站找免费的数据,做个完整的项目。你自己的数据也行,不
: 过必须是开放的,你拿实验室的数据不行。youtude弄个2分钟的视频讲一下你的项目。
: 别因为是生物的就灰心,我也是生物出来的。

f*****n
发帖数: 499
5
恩。多谢。你说的我基本都会。就当锻炼学习了。
我的project基本快做完了,调取互联网API data做transformation,visualization和
ML。因为是互联网数据,所以也做了点NLP,text vectorization。
也算是第一次学习API data的training,挺开心的,就算上不了也觉得很多收获
另外,貌似这个DI强烈推荐heroku;一定要用heroku app么?我只会github做website

numpy

【在 y******2 的大作中提到】
: 本科生就不要想了,最少cs或数学硕士,其他的要博士。要会Python 的pandas和numpy
: library。会有一些分析数据的题,所以你会SQL也行。简单的统计学知识。主要是你
: 要有个project。到他们网站找免费的数据,做个完整的项目。你自己的数据也行,不
: 过必须是开放的,你拿实验室的数据不行。youtude弄个2分钟的视频讲一下你的项目。
: 别因为是生物的就灰心,我也是生物出来的。

y******2
发帖数: 326
6
keroku能用python flask做backend,github只是单页。heroku不难,会用git和python
就没问题,现在tutorial 很多。
f*****n
发帖数: 499
7
多谢指点
看来还是需要不断学习;
另外,我花了全力准备了一个自认为挺fancy的project
原本以为stats和big data题目应该很简单。stats的确很简单,但big data好纠结啊
要花很多时间仔细研究数据,那么多columns,时间不够了,所以没做完,7题只做了5
题,而且很多东西非常ambigious,处处陷阱,要求10-digit precision,也不知道他
们最后如何给分
这两道题他们说是optional,但是不是最后其实只录取全做对的牛人呢?
我很担心他们看我没做全对,压根不看我精心准备的project

python

【在 y******2 的大作中提到】
: keroku能用python flask做backend,github只是单页。heroku不难,会用git和python
: 就没问题,现在tutorial 很多。

y******2
发帖数: 326
8
我也没全做完,有两个小题太长。不用太担心,用了Pandas就行。

5

【在 f*****n 的大作中提到】
: 多谢指点
: 看来还是需要不断学习;
: 另外,我花了全力准备了一个自认为挺fancy的project
: 原本以为stats和big data题目应该很简单。stats的确很简单,但big data好纠结啊
: 要花很多时间仔细研究数据,那么多columns,时间不够了,所以没做完,7题只做了5
: 题,而且很多东西非常ambigious,处处陷阱,要求10-digit precision,也不知道他
: 们最后如何给分
: 这两道题他们说是optional,但是不是最后其实只录取全做对的牛人呢?
: 我很担心他们看我没做全对,压根不看我精心准备的project
:

f*****n
发帖数: 499
9
请问大牛,您是被录取进过data incubator么?
我insight health面试被拒,当然我觉得不冤枉,我的确很多经验规矩不懂,经过一次
就长进了很多
那个data incubator,貌似实在太难,打听了一圈几乎没人录取fellow,如果您曾经进
去过,那就实在太牛了。

【在 y******2 的大作中提到】
: 我也没全做完,有两个小题太长。不用太担心,用了Pandas就行。
:
: 5

1 (共1页)
进入DataSciences版参与讨论
相关主题
coursera data science certificate 管用吗?python用起来没有matlab好使,尤其是数据处理
请问为什么有的data analyst的工作要求会用excel呢?有没有人想报Cloudera的Data Scientist Certificate的
Data science Online program装不了scipy 包,提示没装MKL
data analyst/scientistfresh PhD 求职求内推,非常感谢!
data science如何进阶呢?data analysis part time job
讲个找数据科学工作的捷径 aka 刷Kaggle题迅速入门data scient (转载)发个面经吧[Data Scientist]
有没有人一起组队做kaggle?版上有推荐的data scientist的面经吗?
请推荐data science 在线学习的program借道同问,big data/data science到底是什么?
相关话题的讨论汇总
话题: data话题: incubator话题: challenge话题: project话题: ml