w***g 发帖数: 5958 | 1 都不是易与之辈。要拿钱太太太难了。
现在还是前四,明天估计就不保了。
我不用上班已经很有优势了,最近两个星期全时间搞。
所有的活都推掉了,竟然还是搞不过他们。 |
l*******m 发帖数: 1096 | 2 你和你LP很牛,那些欧洲老时间也很多。还有些疯狂的能开几十个aws instances
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
e*******o 发帖数: 4654 | 3 牛逼
说实话我觉个kaggle拿钱,性价比奇低。
好多人一年干的活,也顶不上kaggle上5k的project。
适合wdong这样不以挣钱为目的的大牛。
等我下学期学学machine learning, 也去凑凑热闹。
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
e*******o 发帖数: 4654 | 4 话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。 |
n*****3 发帖数: 1584 | 5 能拿个 kaggle master ,
resume 上还是能增色不少奥
【在 e*******o 的大作中提到】 : 话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。
|
e*******o 发帖数: 4654 | 6 wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。
【在 n*****3 的大作中提到】 : 能拿个 kaggle master , : resume 上还是能增色不少奥
|
n******7 发帖数: 12463 | 7 wdong带人玩不?
选个项目
你指挥,我打杂
成不? |
n*****3 发帖数: 1584 | 8 obama 也是有resume 的
【在 e*******o 的大作中提到】 : wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。
|
s*********d 发帖数: 531 | 9 膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚
的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking,
bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向.. |
l*******m 发帖数: 1096 | 10 进10%还是容易的,top10比较费劲
..
【在 s*********d 的大作中提到】 : 膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚 : 的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking, : bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向..
|
|
|
j**********3 发帖数: 3211 | |
n******7 发帖数: 12463 | 12 搜了一下关于kaggle的讨论
wdong不用纠结了,你和第一名的差距可能只是noise造成的
https://www.reddit.com/r/MachineLearning/comments/1v59e6/is_kag
way_to_get_noticed_by/
Ranking in the top 5 requires some experience/skill, but also luck. Very
often, the difference between the First and Fifth person is dataset noise.
This is why the positions rearrange so much when the hold out data is
released at the end of the competition.
不过这哥们儿又说:
Ranking in the top 20 or so for most competitions is fairly easy which is
why no one would notice or care. Most blackbox methods can put you in that
range when used correctly.
我怀疑他说的percentile |
n******7 发帖数: 12463 | 13 thousands of hours... 这真是一年的工作时间了
I was active in contests before I got my full-time job as well (won a couple
of machine learning TC marathons and was top 20 in the netflix prize until
a couple months before the end when I started working and didn't have time)
- basically it was a tiny plus but nobody actively reached out to me, not to
mention it took thousands of hours of my time. Of course it did make the
interview itself a piece of cake. If I was hiring that would be part of how
I recruit. |
e*******o 发帖数: 4654 | 14 没性价比可言
除非enjoy这个过程
: thousands of hours... 这真是一年的工作时间了
: I was active in contests before I got my full-time job as well (won a
couple
: of machine learning TC marathons and was top 20 in the netflix prize
until
: a couple months before the end when I started working and didn't have
time)
: - basically it was a tiny plus but nobody actively reached out to me,
not to
: mention it took thousands of hours of my time. Of course it did make
the
: interview itself a piece of cake. If I was hiring that would be part
of how
: I recruit.
【在 n******7 的大作中提到】 : thousands of hours... 这真是一年的工作时间了 : I was active in contests before I got my full-time job as well (won a couple : of machine learning TC marathons and was top 20 in the netflix prize until : a couple months before the end when I started working and didn't have time) : - basically it was a tiny plus but nobody actively reached out to me, not to : mention it took thousands of hours of my time. Of course it did make the : interview itself a piece of cake. If I was hiring that would be part of how : I recruit.
|
s*********n 发帖数: 34 | |
n******7 发帖数: 12463 | 16 我本来想每天2小时,搞几个月就差不多了
不知道为什么要这么多时间
1000小时就够从头搞篇方法的bioinfo文章了
这还包括data processing, performance evaluation & comparison, manuscript
writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的?
可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比
已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。
a
prize
have
,
【在 e*******o 的大作中提到】 : 没性价比可言 : 除非enjoy这个过程 : : : thousands of hours... 这真是一年的工作时间了 : : I was active in contests before I got my full-time job as well (won a : couple : : of machine learning TC marathons and was top 20 in the netflix prize : until : : a couple months before the end when I started working and didn't have : time)
|
e*******o 发帖数: 4654 | 17 哈哈。
搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平
都不如你。
kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多
像wdong这样的phd,吃饱撑了,就是玩玩。
的?
【在 n******7 的大作中提到】 : 我本来想每天2小时,搞几个月就差不多了 : 不知道为什么要这么多时间 : 1000小时就够从头搞篇方法的bioinfo文章了 : 这还包括data processing, performance evaluation & comparison, manuscript : writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的? : 可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比 : 已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。 : : a : prize
|
w***g 发帖数: 5958 | 18 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
而且还有我LD这个超强队友。
无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
很有一分钱逼死英雄汉的感觉。
【在 e*******o 的大作中提到】 : 哈哈。 : 搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平 : 都不如你。 : kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多 : 像wdong这样的phd,吃饱撑了,就是玩玩。 : : 的?
|
l******n 发帖数: 9344 | 19 这就是学术界的做法,为了0.1%争个你死我活。为了这0.1%你要花90%的时间,工业应
用里谁会这样?
【在 w***g 的大作中提到】 : 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。 : 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。 : 而且还有我LD这个超强队友。 : 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内 : 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。 : 很有一分钱逼死英雄汉的感觉。
|
l*******m 发帖数: 1096 | 20 加油,你前面的是千年老四
【在 w***g 的大作中提到】 : 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。 : 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。 : 而且还有我LD这个超强队友。 : 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内 : 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。 : 很有一分钱逼死英雄汉的感觉。
|
|
|
w***g 发帖数: 5958 | 21 确实是千年老四,笑死我了。
【在 l*******m 的大作中提到】 : 加油,你前面的是千年老四
|
n******7 发帖数: 12463 | 22 我很好奇的查了一下这个竞赛以及排名
非常非常惊讶
明白你为啥会涉及bioinfo了
只能说,世界太小了
做人一定要多行善事,广结善缘。。。
【在 w***g 的大作中提到】 : 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。 : 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。 : 而且还有我LD这个超强队友。 : 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内 : 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。 : 很有一分钱逼死英雄汉的感觉。
|
g****s 发帖数: 340 | |
e*******o 发帖数: 4654 | 24 生信确实有很多可搞的地方。
我目前的实验室搞到病人CSF中的一些 sample,测序,基本上没怎么好好用。这还是比
较top的医学院
给我的那点钱,我也没很大动力去搞。学术界我看这么下去,没啥好未来。
【在 n******7 的大作中提到】 : 我很好奇的查了一下这个竞赛以及排名 : 非常非常惊讶 : 明白你为啥会涉及bioinfo了 : 只能说,世界太小了 : 做人一定要多行善事,广结善缘。。。
|
W***o 发帖数: 6519 | 25 这比赛要到14号呢,wdong 加油,要挺住!!! |
l*******m 发帖数: 1096 | 26 话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄
就是一个,他用.net + cuda
【在 w***g 的大作中提到】 : 确实是千年老四,笑死我了。
|
w***g 发帖数: 5958 | 27 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
前面提交190个版本的很可能已经overfit排行榜了。
这人似乎也是自己有个business,所以上真名打广告来了。
【在 l*******m 的大作中提到】 : 话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄 : 就是一个,他用.net + cuda
|
w***g 发帖数: 5958 | 28 在别人手下冲锋陷阵确实没法调动人积极性。
钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
都打不过了。
现在正式宣告所有的办法都已经想尽了。freeze code了。
明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
第一应该还是python的。这次完了我也要全面转python了。
要有同学有兴趣我到时候把代码开源了。
【在 n******7 的大作中提到】 : 我很好奇的查了一下这个竞赛以及排名 : 非常非常惊讶 : 明白你为啥会涉及bioinfo了 : 只能说,世界太小了 : 做人一定要多行善事,广结善缘。。。
|
n******7 发帖数: 12463 | 29 学术界可以发论文
startup可以分股份
其他的确实动力不大了
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
n******7 发帖数: 12463 | 30 kaggle 应该有完全blind的dataset做最后评估吧
不然暴力提交无数版本就行了
【在 w***g 的大作中提到】 : 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。 : 前面提交190个版本的很可能已经overfit排行榜了。 : 这人似乎也是自己有个business,所以上真名打广告来了。
|
|
|
e*******o 发帖数: 4654 | 31 说的真对
做的好反而对自己没好处 一个活本来三天做好 你做了三分钟 老板慢慢觉得 只应该付
你三分钟的钱
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C 版本。本来想借此役给C 打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
l******n 发帖数: 9344 | 32 很牛,顶住
能问下是自己写的算法还是现成的算法tuning的?
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
n******7 发帖数: 12463 | 33 感兴趣,到时候好好学习一下
我用java搞了一年的统计计算啥的
觉得静态语言debug真好,就是java的统计/代数包太差了
经常有东西要自己看paper实现
正想开始学习C++
请问你转python是觉得C++ 做prototype效率太低吗?
不过python的各种库支持确实非常非常齐全
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
w***g 发帖数: 5958 | 34 sklean里面东西很全,deep learning的软件大多也支持python。
C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛
反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的
python比较占便宜。
【在 n******7 的大作中提到】 : 感兴趣,到时候好好学习一下 : 我用java搞了一年的统计计算啥的 : 觉得静态语言debug真好,就是java的统计/代数包太差了 : 经常有东西要自己看paper实现 : 正想开始学习C++ : 请问你转python是觉得C++ 做prototype效率太低吗? : 不过python的各种库支持确实非常非常齐全
|
w***g 发帖数: 5958 | 35 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
现成算法tuning的话大家都会,很难进前几名吧。
【在 l******n 的大作中提到】 : 很牛,顶住 : 能问下是自己写的算法还是现成的算法tuning的?
|
h*****2 发帖数: 2070 | 36 能不能简单介绍一下,你们解决了什么实际问题?
【在 w***g 的大作中提到】 : 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。 : 现成算法tuning的话大家都会,很难进前几名吧。
|
l******n 发帖数: 9344 | 37 厉害。其实这题和现在很多公司做的biomarker发面的研究很类似,我觉得如果这里结
果很好,说不定在biomarker预测疾病上很有借鉴作用
【在 w***g 的大作中提到】 : 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。 : 现成算法tuning的话大家都会,很难进前几名吧。
|
n******7 发帖数: 12463 | 38 明白了
那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
不过总体确实不错了
考虑的python的 user base,应该会越来越好
要是python能强制type,debug能更给力些就完美了
跑半天报个错退出太痛苦了
【在 w***g 的大作中提到】 : sklean里面东西很全,deep learning的软件大多也支持python。 : C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛 : 反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的 : python比较占便宜。
|
w***g 发帖数: 5958 | 39 python跑半天推出我也深恶痛绝。这个应该通过写test case可以部分解决。
C++还有个恶心问题是编译实在太慢。我现在编译一次要好几分钟。
【在 n******7 的大作中提到】 : 明白了 : 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少 : sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方 : 不过总体确实不错了 : 考虑的python的 user base,应该会越来越好 : 要是python能强制type,debug能更给力些就完美了 : 跑半天报个错退出太痛苦了
|
a*f 发帖数: 1790 | 40 python的缩进坑还没填?
【在 n******7 的大作中提到】 : 明白了 : 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少 : sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方 : 不过总体确实不错了 : 考虑的python的 user base,应该会越来越好 : 要是python能强制type,debug能更给力些就完美了 : 跑半天报个错退出太痛苦了
|
|
|
a*f 发帖数: 1790 | 41 kaggle现在有没有什么简单上手的project可以练习练习?现在的比赛是不是都集中在
数据预处理算法和learning算法上面?
【在 w***g 的大作中提到】 : 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。 : 前面提交190个版本的很可能已经overfit排行榜了。 : 这人似乎也是自己有个business,所以上真名打广告来了。
|
s*****r 发帖数: 550 | 42 kaggle 到底是怎么运作的啊?
是说第一名才能拿到钱么?
还有就是已经结束的比赛,是不是code不能share啊?
wiki上说 “ the competition host pays the prize money in exchange for "a
worldwide, perpetual, irrevocable and royalty free license [...] to use the
winning Entry", ”
可是如果我想用别人的算法,我从哪里下载他们的source code那
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
d*******r 发帖数: 3299 | 43 只有民间组织出好的盲审community+制度,才能不鸟学校的山头+门阀文化...
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
s***o 发帖数: 2191 | |
a*f 发帖数: 1790 | 45 用Java做的一个三层网络运行了一下Customer Satisfaction,三十秒左右就内存溢出
了,是不是需要把不相关的column用算法先滤掉?
java.lang.OutOfMemoryError: GC overhead limit exceeded
java.lang.OutOfMemoryError: Java heap space |
p**2 发帖数: 613 | 46 进来膜拜下大牛,俺周末吹了个牛逼,
拿了5k,完全没技术含量,
就是把2B用WP+plugin做的shopping cart
导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
客户很happy,大家都很愉快,除了2B很生气。
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
w***g 发帖数: 5958 | 47 你这个才真叫牛,不但拿了钱,别人还高兴。
【在 p**2 的大作中提到】 : 进来膜拜下大牛,俺周末吹了个牛逼, : 拿了5k,完全没技术含量, : 就是把2B用WP+plugin做的shopping cart : 导入到我自己home made的shopping cart里去了,界面很PP,速度很快, : 客户很happy,大家都很愉快,除了2B很生气。
|
l*********s 发帖数: 5409 | 48 做马工可惜了啊
【在 p**2 的大作中提到】 : 进来膜拜下大牛,俺周末吹了个牛逼, : 拿了5k,完全没技术含量, : 就是把2B用WP+plugin做的shopping cart : 导入到我自己home made的shopping cart里去了,界面很PP,速度很快, : 客户很happy,大家都很愉快,除了2B很生气。
|
ET 发帖数: 10701 | 49 给我介绍点活吧/我也擅长做shopping cart
【在 p**2 的大作中提到】 : 进来膜拜下大牛,俺周末吹了个牛逼, : 拿了5k,完全没技术含量, : 就是把2B用WP+plugin做的shopping cart : 导入到我自己home made的shopping cart里去了,界面很PP,速度很快, : 客户很happy,大家都很愉快,除了2B很生气。
|
p**2 发帖数: 613 | 50 俺忽了个悠,又被楼上各路大神嘲笑了。
其实谈了一阵了,然后客户周末才决定弃用WP+Plugin,
俺也是小打小闹,勉强混个奶粉钱,如果哪天接到大活,一定分享。
【在 w***g 的大作中提到】 : 你这个才真叫牛,不但拿了钱,别人还高兴。
|
|
|
w***g 发帖数: 5958 | 51 刚才提交的时候可能犯了个在错误,估计要功亏一篑了。
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
K***s 发帖数: 2063 | 52 膜拜
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
v*******e 发帖数: 11604 | 53 python 3.5 有gradual typing,可以试试看,把心得告诉我们。
【在 n******7 的大作中提到】 : 明白了 : 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少 : sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方 : 不过总体确实不错了 : 考虑的python的 user base,应该会越来越好 : 要是python能强制type,debug能更给力些就完美了 : 跑半天报个错退出太痛苦了
|
l****u 发帖数: 1764 | 54 我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?
【在 a*f 的大作中提到】 : python的缩进坑还没填?
|
f********3 发帖数: 20 | |
n******7 发帖数: 12463 | 56 这也怪python?
;键坏了好多语言就不能写了吧
{}键坏了就更多语言不能写了吧
还有,你的回车键坏了怎么办?
【在 l****u 的大作中提到】 : 我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?
|
n******7 发帖数: 12463 | 57 这个估计改不了了
也还好
编辑器都能处理
也就是影响一下代码文件大小
【在 a*f 的大作中提到】 : python的缩进坑还没填?
|
n******7 发帖数: 12463 | 58 看起来不错
我得现研究一下python 3.x的库支持如何了
【在 v*******e 的大作中提到】 : python 3.5 有gradual typing,可以试试看,把心得告诉我们。
|
s***o 发帖数: 2191 | 59 排第二了。不过好像排名重新计算了。咋回事?
【在 w***g 的大作中提到】 : 刚才提交的时候可能犯了个在错误,估计要功亏一篑了。
|
n******7 发帖数: 12463 | 60 好像很多team挂了
【在 s***o 的大作中提到】 : 排第二了。不过好像排名重新计算了。咋回事?
|
|
|
l****u 发帖数: 1764 | 61 只要对齐了就行, 空格也可以么?
我发现windows下一般的文本编辑器的tab缩进的距离好像和linux下vim的tab相差好大
【在 f********3 的大作中提到】 : 可以多敲几个空格嘛。。。
|
l****u 发帖数: 1764 | 62 没有回车也能写吧,只是比较难看
【在 n******7 的大作中提到】 : 这也怪python? : ;键坏了好多语言就不能写了吧 : {}键坏了就更多语言不能写了吧 : 还有,你的回车键坏了怎么办?
|
w***g 发帖数: 5958 | 63 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。
【在 n******7 的大作中提到】 : 好像很多team挂了
|
K***s 发帖数: 2063 | 64 希望大师得奖,然后给大家开个课讲讲
【在 w***g 的大作中提到】 : 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的, : 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。
|
n******7 发帖数: 12463 | 65 你好像在这1%test set上稳排第二了
之前的第二掉了不少
之前的第三更是不见了,可见确实overfit了
好像是前三名都有钱?写着"in the money"
【在 w***g 的大作中提到】 : 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的, : 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。
|
w***g 发帖数: 5958 | 66 因为之前那个版本leader board的ground truth release了,
那部分数据可以用来做训练集,所以有一部分人还在拿那个
数据和原有的数据合起来训练。去年第一名那组号称要训练
到deadline为止,所以还有不少牛组还没提交。
之前第二那组不知道怎么回事,感觉不正常。
【在 n******7 的大作中提到】 : 你好像在这1%test set上稳排第二了 : 之前的第二掉了不少 : 之前的第三更是不见了,可见确实overfit了 : 好像是前三名都有钱?写着"in the money"
|
w***g 发帖数: 5958 | 67 都不是易与之辈。要拿钱太太太难了。
现在还是前四,明天估计就不保了。
我不用上班已经很有优势了,最近两个星期全时间搞。
所有的活都推掉了,竟然还是搞不过他们。 |
l*******m 发帖数: 1096 | 68 你和你LP很牛,那些欧洲老时间也很多。还有些疯狂的能开几十个aws instances
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
e*******o 发帖数: 4654 | 69 牛逼
说实话我觉个kaggle拿钱,性价比奇低。
好多人一年干的活,也顶不上kaggle上5k的project。
适合wdong这样不以挣钱为目的的大牛。
等我下学期学学machine learning, 也去凑凑热闹。
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
e*******o 发帖数: 4654 | 70 话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。 |
|
|
n*****3 发帖数: 1584 | 71 能拿个 kaggle master ,
resume 上还是能增色不少奥
【在 e*******o 的大作中提到】 : 话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。
|
e*******o 发帖数: 4654 | 72 wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。
【在 n*****3 的大作中提到】 : 能拿个 kaggle master , : resume 上还是能增色不少奥
|
n******7 发帖数: 12463 | 73 wdong带人玩不?
选个项目
你指挥,我打杂
成不? |
n*****3 发帖数: 1584 | 74 obama 也是有resume 的
【在 e*******o 的大作中提到】 : wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。
|
s*********d 发帖数: 531 | 75 膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚
的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking,
bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向.. |
l*******m 发帖数: 1096 | 76 进10%还是容易的,top10比较费劲
..
【在 s*********d 的大作中提到】 : 膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚 : 的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking, : bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向..
|
j**********3 发帖数: 3211 | |
n******7 发帖数: 12463 | 78 搜了一下关于kaggle的讨论
wdong不用纠结了,你和第一名的差距可能只是noise造成的
https://www.reddit.com/r/MachineLearning/comments/1v59e6/is_kag
way_to_get_noticed_by/
Ranking in the top 5 requires some experience/skill, but also luck. Very
often, the difference between the First and Fifth person is dataset noise.
This is why the positions rearrange so much when the hold out data is
released at the end of the competition.
不过这哥们儿又说:
Ranking in the top 20 or so for most competitions is fairly easy which is
why no one would notice or care. Most blackbox methods can put you in that
range when used correctly.
我怀疑他说的percentile |
n******7 发帖数: 12463 | 79 thousands of hours... 这真是一年的工作时间了
I was active in contests before I got my full-time job as well (won a couple
of machine learning TC marathons and was top 20 in the netflix prize until
a couple months before the end when I started working and didn't have time)
- basically it was a tiny plus but nobody actively reached out to me, not to
mention it took thousands of hours of my time. Of course it did make the
interview itself a piece of cake. If I was hiring that would be part of how
I recruit. |
e*******o 发帖数: 4654 | 80 没性价比可言
除非enjoy这个过程
: thousands of hours... 这真是一年的工作时间了
: I was active in contests before I got my full-time job as well (won a
couple
: of machine learning TC marathons and was top 20 in the netflix prize
until
: a couple months before the end when I started working and didn't have
time)
: - basically it was a tiny plus but nobody actively reached out to me,
not to
: mention it took thousands of hours of my time. Of course it did make
the
: interview itself a piece of cake. If I was hiring that would be part
of how
: I recruit.
【在 n******7 的大作中提到】 : thousands of hours... 这真是一年的工作时间了 : I was active in contests before I got my full-time job as well (won a couple : of machine learning TC marathons and was top 20 in the netflix prize until : a couple months before the end when I started working and didn't have time) : - basically it was a tiny plus but nobody actively reached out to me, not to : mention it took thousands of hours of my time. Of course it did make the : interview itself a piece of cake. If I was hiring that would be part of how : I recruit.
|
|
|
s*********n 发帖数: 34 | |
n******7 发帖数: 12463 | 82 我本来想每天2小时,搞几个月就差不多了
不知道为什么要这么多时间
1000小时就够从头搞篇方法的bioinfo文章了
这还包括data processing, performance evaluation & comparison, manuscript
writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的?
可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比
已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。
a
prize
have
,
【在 e*******o 的大作中提到】 : 没性价比可言 : 除非enjoy这个过程 : : : thousands of hours... 这真是一年的工作时间了 : : I was active in contests before I got my full-time job as well (won a : couple : : of machine learning TC marathons and was top 20 in the netflix prize : until : : a couple months before the end when I started working and didn't have : time)
|
e*******o 发帖数: 4654 | 83 哈哈。
搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平
都不如你。
kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多
像wdong这样的phd,吃饱撑了,就是玩玩。
的?
【在 n******7 的大作中提到】 : 我本来想每天2小时,搞几个月就差不多了 : 不知道为什么要这么多时间 : 1000小时就够从头搞篇方法的bioinfo文章了 : 这还包括data processing, performance evaluation & comparison, manuscript : writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的? : 可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比 : 已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。 : : a : prize
|
w***g 发帖数: 5958 | 84 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
而且还有我LD这个超强队友。
无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
很有一分钱逼死英雄汉的感觉。
【在 e*******o 的大作中提到】 : 哈哈。 : 搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平 : 都不如你。 : kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多 : 像wdong这样的phd,吃饱撑了,就是玩玩。 : : 的?
|
l******n 发帖数: 9344 | 85 这就是学术界的做法,为了0.1%争个你死我活。为了这0.1%你要花90%的时间,工业应
用里谁会这样?
【在 w***g 的大作中提到】 : 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。 : 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。 : 而且还有我LD这个超强队友。 : 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内 : 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。 : 很有一分钱逼死英雄汉的感觉。
|
l*******m 发帖数: 1096 | 86 加油,你前面的是千年老四
【在 w***g 的大作中提到】 : 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。 : 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。 : 而且还有我LD这个超强队友。 : 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内 : 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。 : 很有一分钱逼死英雄汉的感觉。
|
w***g 发帖数: 5958 | 87 确实是千年老四,笑死我了。
【在 l*******m 的大作中提到】 : 加油,你前面的是千年老四
|
n******7 发帖数: 12463 | 88 我很好奇的查了一下这个竞赛以及排名
非常非常惊讶
明白你为啥会涉及bioinfo了
只能说,世界太小了
做人一定要多行善事,广结善缘。。。
【在 w***g 的大作中提到】 : 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。 : 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。 : 而且还有我LD这个超强队友。 : 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内 : 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。 : 很有一分钱逼死英雄汉的感觉。
|
g****s 发帖数: 340 | |
e*******o 发帖数: 4654 | 90 生信确实有很多可搞的地方。
我目前的实验室搞到病人CSF中的一些 sample,测序,基本上没怎么好好用。这还是比
较top的医学院
给我的那点钱,我也没很大动力去搞。学术界我看这么下去,没啥好未来。
【在 n******7 的大作中提到】 : 我很好奇的查了一下这个竞赛以及排名 : 非常非常惊讶 : 明白你为啥会涉及bioinfo了 : 只能说,世界太小了 : 做人一定要多行善事,广结善缘。。。
|
|
|
W***o 发帖数: 6519 | 91 这比赛要到14号呢,wdong 加油,要挺住!!! |
l*******m 发帖数: 1096 | 92 话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄
就是一个,他用.net + cuda
【在 w***g 的大作中提到】 : 确实是千年老四,笑死我了。
|
w***g 发帖数: 5958 | 93 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
前面提交190个版本的很可能已经overfit排行榜了。
这人似乎也是自己有个business,所以上真名打广告来了。
【在 l*******m 的大作中提到】 : 话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄 : 就是一个,他用.net + cuda
|
w***g 发帖数: 5958 | 94 在别人手下冲锋陷阵确实没法调动人积极性。
钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
都打不过了。
现在正式宣告所有的办法都已经想尽了。freeze code了。
明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
第一应该还是python的。这次完了我也要全面转python了。
要有同学有兴趣我到时候把代码开源了。
【在 n******7 的大作中提到】 : 我很好奇的查了一下这个竞赛以及排名 : 非常非常惊讶 : 明白你为啥会涉及bioinfo了 : 只能说,世界太小了 : 做人一定要多行善事,广结善缘。。。
|
n******7 发帖数: 12463 | 95 学术界可以发论文
startup可以分股份
其他的确实动力不大了
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
n******7 发帖数: 12463 | 96 kaggle 应该有完全blind的dataset做最后评估吧
不然暴力提交无数版本就行了
【在 w***g 的大作中提到】 : 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。 : 前面提交190个版本的很可能已经overfit排行榜了。 : 这人似乎也是自己有个business,所以上真名打广告来了。
|
e*******o 发帖数: 4654 | 97 说的真对
做的好反而对自己没好处 一个活本来三天做好 你做了三分钟 老板慢慢觉得 只应该付
你三分钟的钱
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C 版本。本来想借此役给C 打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
l******n 发帖数: 9344 | 98 很牛,顶住
能问下是自己写的算法还是现成的算法tuning的?
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
n******7 发帖数: 12463 | 99 感兴趣,到时候好好学习一下
我用java搞了一年的统计计算啥的
觉得静态语言debug真好,就是java的统计/代数包太差了
经常有东西要自己看paper实现
正想开始学习C++
请问你转python是觉得C++ 做prototype效率太低吗?
不过python的各种库支持确实非常非常齐全
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
w***g 发帖数: 5958 | 100 sklean里面东西很全,deep learning的软件大多也支持python。
C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛
反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的
python比较占便宜。
【在 n******7 的大作中提到】 : 感兴趣,到时候好好学习一下 : 我用java搞了一年的统计计算啥的 : 觉得静态语言debug真好,就是java的统计/代数包太差了 : 经常有东西要自己看paper实现 : 正想开始学习C++ : 请问你转python是觉得C++ 做prototype效率太低吗? : 不过python的各种库支持确实非常非常齐全
|
|
|
w***g 发帖数: 5958 | 101 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
现成算法tuning的话大家都会,很难进前几名吧。
【在 l******n 的大作中提到】 : 很牛,顶住 : 能问下是自己写的算法还是现成的算法tuning的?
|
h*****2 发帖数: 2070 | 102 能不能简单介绍一下,你们解决了什么实际问题?
【在 w***g 的大作中提到】 : 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。 : 现成算法tuning的话大家都会,很难进前几名吧。
|
l******n 发帖数: 9344 | 103 厉害。其实这题和现在很多公司做的biomarker发面的研究很类似,我觉得如果这里结
果很好,说不定在biomarker预测疾病上很有借鉴作用
【在 w***g 的大作中提到】 : 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。 : 现成算法tuning的话大家都会,很难进前几名吧。
|
n******7 发帖数: 12463 | 104 明白了
那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
不过总体确实不错了
考虑的python的 user base,应该会越来越好
要是python能强制type,debug能更给力些就完美了
跑半天报个错退出太痛苦了
【在 w***g 的大作中提到】 : sklean里面东西很全,deep learning的软件大多也支持python。 : C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛 : 反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的 : python比较占便宜。
|
w***g 发帖数: 5958 | 105 python跑半天推出我也深恶痛绝。这个应该通过写test case可以部分解决。
C++还有个恶心问题是编译实在太慢。我现在编译一次要好几分钟。
【在 n******7 的大作中提到】 : 明白了 : 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少 : sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方 : 不过总体确实不错了 : 考虑的python的 user base,应该会越来越好 : 要是python能强制type,debug能更给力些就完美了 : 跑半天报个错退出太痛苦了
|
a*f 发帖数: 1790 | 106 python的缩进坑还没填?
【在 n******7 的大作中提到】 : 明白了 : 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少 : sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方 : 不过总体确实不错了 : 考虑的python的 user base,应该会越来越好 : 要是python能强制type,debug能更给力些就完美了 : 跑半天报个错退出太痛苦了
|
a*f 发帖数: 1790 | 107 kaggle现在有没有什么简单上手的project可以练习练习?现在的比赛是不是都集中在
数据预处理算法和learning算法上面?
【在 w***g 的大作中提到】 : 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。 : 前面提交190个版本的很可能已经overfit排行榜了。 : 这人似乎也是自己有个business,所以上真名打广告来了。
|
s*****r 发帖数: 550 | 108 kaggle 到底是怎么运作的啊?
是说第一名才能拿到钱么?
还有就是已经结束的比赛,是不是code不能share啊?
wiki上说 “ the competition host pays the prize money in exchange for "a
worldwide, perpetual, irrevocable and royalty free license [...] to use the
winning Entry", ”
可是如果我想用别人的算法,我从哪里下载他们的source code那
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
d*******r 发帖数: 3299 | 109 只有民间组织出好的盲审community+制度,才能不鸟学校的山头+门阀文化...
【在 w***g 的大作中提到】 : 在别人手下冲锋陷阵确实没法调动人积极性。 : 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了 : 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物 : 都打不过了。 : 现在正式宣告所有的办法都已经想尽了。freeze code了。 : 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。 : 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。 : 第一应该还是python的。这次完了我也要全面转python了。 : 要有同学有兴趣我到时候把代码开源了。
|
s***o 发帖数: 2191 | |
|
|
a*f 发帖数: 1790 | 111 用Java做的一个三层网络运行了一下Customer Satisfaction,三十秒左右就内存溢出
了,是不是需要把不相关的column用算法先滤掉?
java.lang.OutOfMemoryError: GC overhead limit exceeded
java.lang.OutOfMemoryError: Java heap space |
p**2 发帖数: 613 | 112 进来膜拜下大牛,俺周末吹了个牛逼,
拿了5k,完全没技术含量,
就是把2B用WP+plugin做的shopping cart
导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
客户很happy,大家都很愉快,除了2B很生气。
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
w***g 发帖数: 5958 | 113 你这个才真叫牛,不但拿了钱,别人还高兴。
【在 p**2 的大作中提到】 : 进来膜拜下大牛,俺周末吹了个牛逼, : 拿了5k,完全没技术含量, : 就是把2B用WP+plugin做的shopping cart : 导入到我自己home made的shopping cart里去了,界面很PP,速度很快, : 客户很happy,大家都很愉快,除了2B很生气。
|
l*********s 发帖数: 5409 | 114 做马工可惜了啊
【在 p**2 的大作中提到】 : 进来膜拜下大牛,俺周末吹了个牛逼, : 拿了5k,完全没技术含量, : 就是把2B用WP+plugin做的shopping cart : 导入到我自己home made的shopping cart里去了,界面很PP,速度很快, : 客户很happy,大家都很愉快,除了2B很生气。
|
ET 发帖数: 10701 | 115 给我介绍点活吧/我也擅长做shopping cart
【在 p**2 的大作中提到】 : 进来膜拜下大牛,俺周末吹了个牛逼, : 拿了5k,完全没技术含量, : 就是把2B用WP+plugin做的shopping cart : 导入到我自己home made的shopping cart里去了,界面很PP,速度很快, : 客户很happy,大家都很愉快,除了2B很生气。
|
p**2 发帖数: 613 | 116 俺忽了个悠,又被楼上各路大神嘲笑了。
其实谈了一阵了,然后客户周末才决定弃用WP+Plugin,
俺也是小打小闹,勉强混个奶粉钱,如果哪天接到大活,一定分享。
【在 w***g 的大作中提到】 : 你这个才真叫牛,不但拿了钱,别人还高兴。
|
w***g 发帖数: 5958 | 117 刚才提交的时候可能犯了个在错误,估计要功亏一篑了。
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
K***s 发帖数: 2063 | 118 膜拜
【在 w***g 的大作中提到】 : 都不是易与之辈。要拿钱太太太难了。 : 现在还是前四,明天估计就不保了。 : 我不用上班已经很有优势了,最近两个星期全时间搞。 : 所有的活都推掉了,竟然还是搞不过他们。
|
v*******e 发帖数: 11604 | 119 python 3.5 有gradual typing,可以试试看,把心得告诉我们。
【在 n******7 的大作中提到】 : 明白了 : 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少 : sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方 : 不过总体确实不错了 : 考虑的python的 user base,应该会越来越好 : 要是python能强制type,debug能更给力些就完美了 : 跑半天报个错退出太痛苦了
|
l****u 发帖数: 1764 | 120 我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?
【在 a*f 的大作中提到】 : python的缩进坑还没填?
|
|
|
f********3 发帖数: 20 | |
n******7 发帖数: 12463 | 122 这也怪python?
;键坏了好多语言就不能写了吧
{}键坏了就更多语言不能写了吧
还有,你的回车键坏了怎么办?
【在 l****u 的大作中提到】 : 我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?
|
n******7 发帖数: 12463 | 123 这个估计改不了了
也还好
编辑器都能处理
也就是影响一下代码文件大小
【在 a*f 的大作中提到】 : python的缩进坑还没填?
|
n******7 发帖数: 12463 | 124 看起来不错
我得现研究一下python 3.x的库支持如何了
【在 v*******e 的大作中提到】 : python 3.5 有gradual typing,可以试试看,把心得告诉我们。
|
s***o 发帖数: 2191 | 125 排第二了。不过好像排名重新计算了。咋回事?
【在 w***g 的大作中提到】 : 刚才提交的时候可能犯了个在错误,估计要功亏一篑了。
|
n******7 发帖数: 12463 | 126 好像很多team挂了
【在 s***o 的大作中提到】 : 排第二了。不过好像排名重新计算了。咋回事?
|
l****u 发帖数: 1764 | 127 只要对齐了就行, 空格也可以么?
我发现windows下一般的文本编辑器的tab缩进的距离好像和linux下vim的tab相差好大
【在 f********3 的大作中提到】 : 可以多敲几个空格嘛。。。
|
l****u 发帖数: 1764 | 128 没有回车也能写吧,只是比较难看
【在 n******7 的大作中提到】 : 这也怪python? : ;键坏了好多语言就不能写了吧 : {}键坏了就更多语言不能写了吧 : 还有,你的回车键坏了怎么办?
|
w***g 发帖数: 5958 | 129 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。
【在 n******7 的大作中提到】 : 好像很多team挂了
|
K***s 发帖数: 2063 | 130 希望大师得奖,然后给大家开个课讲讲
【在 w***g 的大作中提到】 : 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的, : 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。
|
|
|
n******7 发帖数: 12463 | 131 你好像在这1%test set上稳排第二了
之前的第二掉了不少
之前的第三更是不见了,可见确实overfit了
好像是前三名都有钱?写着"in the money"
【在 w***g 的大作中提到】 : 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的, : 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。
|
w***g 发帖数: 5958 | 132 因为之前那个版本leader board的ground truth release了,
那部分数据可以用来做训练集,所以有一部分人还在拿那个
数据和原有的数据合起来训练。去年第一名那组号称要训练
到deadline为止,所以还有不少牛组还没提交。
之前第二那组不知道怎么回事,感觉不正常。
【在 n******7 的大作中提到】 : 你好像在这1%test set上稳排第二了 : 之前的第二掉了不少 : 之前的第三更是不见了,可见确实overfit了 : 好像是前三名都有钱?写着"in the money"
|
K***s 发帖数: 2063 | 133 跌到第六了。
加油啊
【在 w***g 的大作中提到】 : 因为之前那个版本leader board的ground truth release了, : 那部分数据可以用来做训练集,所以有一部分人还在拿那个 : 数据和原有的数据合起来训练。去年第一名那组号称要训练 : 到deadline为止,所以还有不少牛组还没提交。 : 之前第二那组不知道怎么回事,感觉不正常。
|
w***g 发帖数: 5958 | 134 正常情况我们应该能进前十。按规则上星期一以后就不能再调参数了的,
现在我觉得规则已经失效了。应该还有人在对着测试数据调。
明天排名应该还会大调整。
【在 K***s 的大作中提到】 : 跌到第六了。 : 加油啊
|
l*******m 发帖数: 1096 | 135 别瞎叫,没有双十字是拿不着奖的
【在 K***s 的大作中提到】 : 跌到第六了。 : 加油啊
|
w***g 发帖数: 5958 | 136 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。
kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial,
但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。
我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了
几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。
【在 l*******m 的大作中提到】 : 别瞎叫,没有双十字是拿不着奖的
|
ET 发帖数: 10701 | 137 我还search 了下这个 xu bing, 很年轻的university of alberta的硕士生。北邮毕
业的。
你觉得他功底不错?
【在 w***g 的大作中提到】 : 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。 : kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial, : 但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。 : 我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了 : 几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。
|
n******7 发帖数: 12463 | 138 show me the money
感觉是玩SC的
你第一次玩就top 10,已经很NB了
比赛结束了麻烦给大家show下黑科技
我们长长见识
【在 w***g 的大作中提到】 : 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。 : kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial, : 但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。 : 我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了 : 几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。
|
I******y 发帖数: 176 | |
w***g 发帖数: 5958 | 140 结果出来了,只排第9,真是无脸见江东父老啊。
【在 I******y 的大作中提到】 : mark 牛人贴~~~
|
|
|
s***o 发帖数: 2191 | 141 这个数代表什么,应该不是速度吧? C++还跑不过python>?
【在 w***g 的大作中提到】 : 结果出来了,只排第9,真是无脸见江东父老啊。
|
b***i 发帖数: 3043 | 142 这个到底干啥的?你给大家介绍一下?
【在 w***g 的大作中提到】 : 结果出来了,只排第9,真是无脸见江东父老啊。
|
l*******m 发帖数: 1096 | 143 可能ensemble不够多?cnn上套rnn的?
【在 w***g 的大作中提到】 : 结果出来了,只排第9,真是无脸见江东父老啊。
|
w***g 发帖数: 5958 | 144 就是输入一系列心脏的CT图片,要求把其中一个心室的大小算出来。
我没上ensemble。很肯能是攀错科技枝了。
【在 b***i 的大作中提到】 : 这个到底干啥的?你给大家介绍一下?
|
n******7 发帖数: 12463 | 145 还是几个老家伙厉害
历史成绩都不错
这个alex的搭档是他gf吧
这下可以求婚了
【在 w***g 的大作中提到】 : 结果出来了,只排第9,真是无脸见江东父老啊。
|
n******7 发帖数: 12463 | 146 Continuous Ranked Probability Score (CRPS)
https://www.kaggle.com/c/second-annual-data-science-bowl/detail
【在 s***o 的大作中提到】 : 这个数代表什么,应该不是速度吧? C++还跑不过python>?
|
n******7 发帖数: 12463 | 147 Keras.io 确实有些low啊
之前排第三,现在掉到快50了
琢磨这么一大帮人就忙着overfitting 刷战绩啊
想起以前有个人,每次CS战绩一不好,就立马退出清零重来
不熟悉的人一看这哥们儿老是杀人比被杀多,以为很厉害
【在 w***g 的大作中提到】 : 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。 : kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial, : 但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。 : 我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了 : 几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。
|
w***g 发帖数: 5958 | 148 上个图。因为原图太大,扣了一部分下来,并且转成了gif。心脏那部分有个虚线,
就是预测的内容。大致都能画个八九不离十,但是因为人长得很不一样,扫描效果
也不一样,所以各种corner case很多,全都要做准比较难。这个case我随便找
的,可以看到其实白色的部分没有全都圈进去,所以不是最准。给的groundtruth
和需要预测的是医生标注的心脏最大和最小时的体积,数据是心脏不同位置的切面
时间序列。每个切面预测了最大/最小圈以后算成面积,然后按位置累计起来变成
体积。
我等着看前几名的解法,应该会有有意思的东西。
【在 w***g 的大作中提到】 : 就是输入一系列心脏的CT图片,要求把其中一个心室的大小算出来。 : 我没上ensemble。很肯能是攀错科技枝了。
|
e*******o 发帖数: 4654 | 149 前10都很牛了。
本版应该没有可以跟wdong过招的了。
【在 w***g 的大作中提到】 : 结果出来了,只排第9,真是无脸见江东父老啊。
|
w***g 发帖数: 5958 | 150 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了
segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个
contour画得好了。应该神经网络走到底的!
机器战胜人类的又一个实例! |
|
|
K***s 发帖数: 2063 | 151 太牛了
【在 w***g 的大作中提到】 : 上个图。因为原图太大,扣了一部分下来,并且转成了gif。心脏那部分有个虚线, : 就是预测的内容。大致都能画个八九不离十,但是因为人长得很不一样,扫描效果 : 也不一样,所以各种corner case很多,全都要做准比较难。这个case我随便找 : 的,可以看到其实白色的部分没有全都圈进去,所以不是最准。给的groundtruth : 和需要预测的是医生标注的心脏最大和最小时的体积,数据是心脏不同位置的切面 : 时间序列。每个切面预测了最大/最小圈以后算成面积,然后按位置累计起来变成 : 体积。 : 我等着看前几名的解法,应该会有有意思的东西。
|
l*******m 发帖数: 1096 | 152 现在好像大家dropout用得少了,啥理由?
【在 w***g 的大作中提到】 : 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了 : segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个 : contour画得好了。应该神经网络走到底的! : 机器战胜人类的又一个实例!
|
n*****3 发帖数: 1584 | 153 link?
【在 w***g 的大作中提到】 : 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了 : segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个 : contour画得好了。应该神经网络走到底的! : 机器战胜人类的又一个实例!
|
n******7 发帖数: 12463 | |
p**r 发帖数: 5853 | 155 大神能推荐个神经网络的入门教程看看?
【在 w***g 的大作中提到】 : 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了 : segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个 : contour画得好了。应该神经网络走到底的! : 机器战胜人类的又一个实例!
|
n*****3 发帖数: 1584 | |
n******7 发帖数: 12463 | 157 要GPU
玩不了了
【在 n*****3 的大作中提到】 : thanks!!
|
N*****m 发帖数: 42603 | 158 我啥都擅长,也介绍给我吧
【在 ET 的大作中提到】 : 给我介绍点活吧/我也擅长做shopping cart
|
t********e 发帖数: 1169 | 159 知道陈天奇这些既能拿奖又能造轮子让别人拿奖的有多牛逼了吧 |
h*i 发帖数: 3446 | 160 是啊。这明显是个知觉问题,目前知觉问题就是NN最好用。
其实很多看似推理的问题其实可以转成知觉问题,比如下棋啥的。
【在 w***g 的大作中提到】 : 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了 : segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个 : contour画得好了。应该神经网络走到底的! : 机器战胜人类的又一个实例!
|