由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 说说最近的一次面试,兼告诫国人
相关主题
求Google 的 Data Science 有关的位置内推 (转载)最近想做音频数据分析, 但是不知道怎么入手啊..
How to Start the Career as Data Scientistsan bruno ds position
【真心请教】选master project课题 - 有包子 (转载)工作机会 data scientist@experian datalab, San Diego (转载)
我觉得neural network应用范围不大啊关于data smoothing的问题
问一下python 或者是 R 里面 gradient boosting model 的问题Neural Network面试的时候会怎么问啊?
请问如何完全跳到data scientist/analyst, 还有多大差距?这里有做optimization的么?请教个问题。
请教:现在那些package实现gradient boosting tree比较好?40道经典DS/ML面试题解答,求指导
How to prepare for the DS interview?回馈本版~ 最近面的面经和收集来的面经~
相关话题的讨论汇总
话题: boosting话题: manager话题: hiring话题: 面试话题: offer
进入DataSciences版参与讨论
1 (共1页)
m******a
发帖数: 77
1
是IT里排名较靠前的一家
两年前曾参加过它的一次 SUMMIT
觉得他们作 ONLINE TRACKING 虽然很强
但分析和模型这块不敢恭维
那天突然接到他们HR电话问要不要去看看
想看看他们在作什么新东西,就去了
此前和他们招聘经理聊了一个多小时
他们有两个大项目
其中一个我三年前就在前雇主那儿作过了,并申请了专利
另一个刚刚在现公司申请了专利,并写了篇文章,已被一家需要同行评审的杂志接收发表,
我觉得像我这种背景,只要愿意去,八层得给我了
面试日程表寄来后,我曾犹豫过
因为面试是安排在午饭后一点开始
知道这边有很多STARTUP爱借面试的名义去问或偷别人的解决方案
同时吝啬得连一顿午饭都不舍得管,
觉得他们没诚意
本想临时放他们鸽子
转念一想,前一阵他们公司在对待员工等方面的排名一直很靠前
也是挺有名的大公司,又决定去了
第一个聊的是一个小箩卜头,
问了一个题目,用了一堆他那个背景习惯用的名词
开始不知道他在说啥
等弄清他的问题后,发现那题4年前就被问到过
后来被收到我给别人讲课的材料中
自然难不倒我
第二个聊的是他们的VP TECHNOLOGY, HIRING MANAGER 的头
主要是聊他们要上的大项目中的一个
感觉可能是和HIRING MANAGER商量过的有分工
他们两人各问一个
反正文章要发了,就把大意介绍了一下,
走时要带走文章,没让,说等正式发表后再给
但能感觉他很满意
接下来和HIRING MANAGER聊
是接着前两天电话中没及说完的东西
虽然感觉HIRING MANAGER很满意我的作法
因为已经在前公司的PRODUCTION上转了几年了,并且有效
东西不可能有问题,所以很自信
但HIRING MANAGER自己的解决方案明显有问题
但没给他指出来 - 我是来面试,没义务干别的
面过这两人后,就知道OFFER肯定是我的了
在原公司的时候也参与过招人,知道很多时候对招人起决定作用的其实也就那么一两个
接下来面的两个中国同胞说实话让我不太爽
自己的理解,让他们参与面试的目的无非是让他们看看合不合群
这两哥们一副不难到在下不罢休的架式
非得找个什么地方要显得比我高,能教训我一把
从前有过面试中途起身走人的经历
因为实在看不贯那混蛋同胞的傲慢
不想再玩第二次,并且想着既然已经OFFER在握了
没必要再把它因此给扔了,所以耐着性子应付这两哥们
说实话,我前两天还在面试人
见到人家资历比我深,我根本是一当学生的态度去请教别人
这两哥们资历明显浅多了
说到GRADIENT BOOSTING, 给他讲是BOOST RESIDUAL
居然没听懂,
接着问我GRADIENT BOOSTING 和RANDOM FOREST的差别
这个问题本身就有点怪
只能答我自己的理解RANDOM FOREST象是算法的算法
因为你可以把它用在任何一个算法上
给他讲RANDOM FOREST本质上是取样你的变量 - X VARIABLE
BAGGING 是取样你的样本 - SAMPLE YOUR SAMPLE
又没听懂, 于是只能说你自己去写一遍就明白了
不知道这两中国同胞哥们的面试报告是说好还是不好
反正,两天后HR告诉我HIRING MANAGER决定给OFFER
总的PACKAGE $200K 左右
我说我的期望是$250K
其实我是想被他们拒,或拒了他们
原因很简单,
HIRING MANAGER 和他的老板都是印度人
这两同胞哥们的态度不像很合作的亲善
另外,去之前已经拿到别的OFFER
最后想告诫一些同胞们
首先得认清自己的位置
别太拿自己当回事
本人也参与过很多面试
见到来的国人兄弟
觉得不让过就对不起人家
甚至最后因为各种原因没给OFFER就觉得挺对不起人
如果所有国人都能像在下一样
感觉国人占领这个领域太容易了
因为作这行的现在基本都是中国人
d******4
发帖数: 132
2
ding!那两个国人太不上路了,傻的要命!
d******4
发帖数: 132
3
这两个家伙看来什么都不懂啊。
基本的boosting就是stagewise 的方法,在resudiual上做的。
gradient的方法是数值计算方法,和random forest不是一个类型的东西。
大牛你去收拾一下这两个家伙。教他们好好做人。

表,

【在 m******a 的大作中提到】
: 是IT里排名较靠前的一家
: 两年前曾参加过它的一次 SUMMIT
: 觉得他们作 ONLINE TRACKING 虽然很强
: 但分析和模型这块不敢恭维
: 那天突然接到他们HR电话问要不要去看看
: 想看看他们在作什么新东西,就去了
: 此前和他们招聘经理聊了一个多小时
: 他们有两个大项目
: 其中一个我三年前就在前雇主那儿作过了,并申请了专利
: 另一个刚刚在现公司申请了专利,并写了篇文章,已被一家需要同行评审的杂志接收发表,

c***z
发帖数: 6348
4
向大牛你学习
中国人真的不应该刁难中国人,大家混得都不容易
就算你混上去了,下面没人,照样斗不过抱团的
m******a
发帖数: 77
5
互相学习
看过版主很多贴子,知道版主也是好人
本人面试原则
1. 比本人资历丰富的,借机学习,目的不在试而在证 - 确信东西确实是被面者自己作的
2. 比本人资历浅的,不重基础,只重态度,只要愿学,爱学,这一行人人能作,没什么难的
3. 和本人资历差不多,同 1, 兼看 2 - 确信不是混子

【在 c***z 的大作中提到】
: 向大牛你学习
: 中国人真的不应该刁难中国人,大家混得都不容易
: 就算你混上去了,下面没人,照样斗不过抱团的

b*****o
发帖数: 715
6
Gradient boosting和random forest这个问题我不觉得奇怪。在现实中,GB和RF就是两
个互相竞争的算法,而且形式还真有点像,都是additive,只不过一个adaptive,一个
是non-adaptive。
楼主的回答实在太跳跃了。RF有两个idea,一个是bagging,还有一个就是帖子里提到
的每个split可以做stochastic fraction的sample。我看了两遍才明白楼主是在说这个。
不过就我的愚见,其实这个idea还真不是两个算法的区别所在,因为gradient
boosting里也完全可以用这个trick的。有些版本的实现,GB和RF就都是有这个参数的。

表,

【在 m******a 的大作中提到】
: 是IT里排名较靠前的一家
: 两年前曾参加过它的一次 SUMMIT
: 觉得他们作 ONLINE TRACKING 虽然很强
: 但分析和模型这块不敢恭维
: 那天突然接到他们HR电话问要不要去看看
: 想看看他们在作什么新东西,就去了
: 此前和他们招聘经理聊了一个多小时
: 他们有两个大项目
: 其中一个我三年前就在前雇主那儿作过了,并申请了专利
: 另一个刚刚在现公司申请了专利,并写了篇文章,已被一家需要同行评审的杂志接收发表,

b*********k
发帖数: 335
7
all our Chinese people should unite together.
based on the LZ statements, two observations are
fact 1.
the manager of the hiring manager and the hiring manager are
lao yin?
fact 2.
most of the experts in this fields are Chinese.
Isn't it ironic?
o**********e
发帖数: 18403
8
“知道这边有很多STARTUP爱借面试的名义去问或偷别人的解决方案”
大牛很小心, 赞。 不用给烙印送弹药。
这两同胞。。。 唉。
大家都拉同胞到BBS
受教育吧。
烙印喜欢拿”轮回“来忽悠
低种姓贱民。
实际上职场才是真正的“轮回”。
“三年河东,三年河西”,
互相帮助,建立默契信任,
共同提高,开拓传承是真。
l*******m
发帖数: 1096
9
其实lz也太把自己当回事了,哈哈。

【在 b*********k 的大作中提到】
: all our Chinese people should unite together.
: based on the LZ statements, two observations are
: fact 1.
: the manager of the hiring manager and the hiring manager are
: lao yin?
: fact 2.
: most of the experts in this fields are Chinese.
: Isn't it ironic?

s***x
发帖数: 293
10
LZ写的很好哈,有些人不抓机会损损人就心痒痒,好像自己很NB似的。

【在 l*******m 的大作中提到】
: 其实lz也太把自己当回事了,哈哈。
相关主题
请问如何完全跳到data scientist/analyst, 还有多大差距?最近想做音频数据分析, 但是不知道怎么入手啊..
请教:现在那些package实现gradient boosting tree比较好?san bruno ds position
How to prepare for the DS interview?工作机会 data scientist@experian datalab, San Diego (转载)
进入DataSciences版参与讨论
h*****7
发帖数: 6781
11
entry level的都那样,越不行越把自己当回事,待几年就好了
请问你的专利署名是公司还是你个人?还是都有,受益怎么分配?

表,

【在 m******a 的大作中提到】
: 是IT里排名较靠前的一家
: 两年前曾参加过它的一次 SUMMIT
: 觉得他们作 ONLINE TRACKING 虽然很强
: 但分析和模型这块不敢恭维
: 那天突然接到他们HR电话问要不要去看看
: 想看看他们在作什么新东西,就去了
: 此前和他们招聘经理聊了一个多小时
: 他们有两个大项目
: 其中一个我三年前就在前雇主那儿作过了,并申请了专利
: 另一个刚刚在现公司申请了专利,并写了篇文章,已被一家需要同行评审的杂志接收发表,

c*****v
发帖数: 839
12
一次去面试,同胞全程英语面完,出来我用中文问一个问题,他居然是英文回答。
m******a
发帖数: 77
13
所以说它像是算法的算法
因为你可以把它用在很多算法上

个。
的。

【在 b*****o 的大作中提到】
: Gradient boosting和random forest这个问题我不觉得奇怪。在现实中,GB和RF就是两
: 个互相竞争的算法,而且形式还真有点像,都是additive,只不过一个adaptive,一个
: 是non-adaptive。
: 楼主的回答实在太跳跃了。RF有两个idea,一个是bagging,还有一个就是帖子里提到
: 的每个split可以做stochastic fraction的sample。我看了两遍才明白楼主是在说这个。
: 不过就我的愚见,其实这个idea还真不是两个算法的区别所在,因为gradient
: boosting里也完全可以用这个trick的。有些版本的实现,GB和RF就都是有这个参数的。
:
: 表,

m******a
发帖数: 77
14
在公司工作期间申请专利
应该都是个人名义申请
但属公司所有
这个应该在OFFER中或相关规定中写着
通常公司会给你一千或两千块钱作为奖励
THAT IS ALL!
平心而论,
专利放在简历中只是好看一点而已
其实绝大多数专利很水
所以感觉通过评审发表的文章更可靠一些

【在 h*****7 的大作中提到】
: entry level的都那样,越不行越把自己当回事,待几年就好了
: 请问你的专利署名是公司还是你个人?还是都有,受益怎么分配?
:
: 表,

m******a
发帖数: 77
15
阁下没见过更绝的
面我的时候全英文
后来进了公司
自始至终都英文
俨然一老外

【在 c*****v 的大作中提到】
: 一次去面试,同胞全程英语面完,出来我用中文问一个问题,他居然是英文回答。
D**u
发帖数: 288
16
恭喜楼主拿offer,也不用太计较,相信是个例,印象中大多数国人都是很愿意互相帮
忙的。
顺便楼主能介绍一下平常工作的性质,和skill set么?比如需要用java或者c++
implement ML的algorithm么,还是多用python和r做prototype?还有是做data 还是
text processing,social data还是其他什么的
先谢了,对后来人会有很大帮助
d********u
发帖数: 5383
17
面试全程说英文很正常,难道你要人全程说中文?自己不觉得很野鸡吗?当然,我同意
偶尔说中文没什么问题,比如说你没听明白问题,我可以用中文解释,甚至提示。一句
不会也确实太谨慎了些。
也许那哥们就不会说中文?我见过这样的,确实不会说,虽然长得比很多国人还国人。

【在 m******a 的大作中提到】
: 阁下没见过更绝的
: 面我的时候全英文
: 后来进了公司
: 自始至终都英文
: 俨然一老外

m******a
发帖数: 77
18
先后换过几家公司
总体讲,作过很多东西,如模型,优化,分析
文本数据,NLP,搜索,产品推荐等
最多用的是 SQL, SAS, 也用PERL, C++, UNIX SHELL, 会点JAVA, 但很少用
写过很多 MAPREDUCE JOB, 也写过PIG, 会HIVE (NOTHING, 因为基本同SQL)
自己用C++实现过一些算法,如BOOSTING, DECISION TREE, KNN, MCMC 等等
但都是自己玩,拿KAGGLE上的数据来检验过,PERFORMANCE 还行,甚至好过有些商业软件
你会PYTHON 和 R 应该好过 PERL + SAS
其实还有比SAS 和 R 更高级的东西,
但公司里会SAS 和 R其一足够

【在 D**u 的大作中提到】
: 恭喜楼主拿offer,也不用太计较,相信是个例,印象中大多数国人都是很愿意互相帮
: 忙的。
: 顺便楼主能介绍一下平常工作的性质,和skill set么?比如需要用java或者c++
: implement ML的algorithm么,还是多用python和r做prototype?还有是做data 还是
: text processing,social data还是其他什么的
: 先谢了,对后来人会有很大帮助

t*********u
发帖数: 26311
19
lz能不能讲讲ml到底需要会到什么程序?



【在 m******a 的大作中提到】
: 先后换过几家公司
: 总体讲,作过很多东西,如模型,优化,分析
: 文本数据,NLP,搜索,产品推荐等
: 最多用的是 SQL, SAS, 也用PERL, C++, UNIX SHELL, 会点JAVA, 但很少用
: 写过很多 MAPREDUCE JOB, 也写过PIG, 会HIVE (NOTHING, 因为基本同SQL)
: 自己用C++实现过一些算法,如BOOSTING, DECISION TREE, KNN, MCMC 等等
: 但都是自己玩,拿KAGGLE上的数据来检验过,PERFORMANCE 还行,甚至好过有些商业软件
: 你会PYTHON 和 R 应该好过 PERL + SAS
: 其实还有比SAS 和 R 更高级的东西,
: 但公司里会SAS 和 R其一足够

B***i
发帖数: 724
20
LZ 太自以为是了。
就你这种态度对待interviewer 还拿到offer, 说明同胞至少没有为难你, review 写
得不会太难看。如果四个面试者中两个都是negative的意见, 大部分公司还是不会给
offer的。
gradient boosting 和 random forest 得主要差别我猜他们主要是想听到 boosting
和bagging 区别。
相关主题
关于data smoothing的问题40道经典DS/ML面试题解答,求指导
Neural Network面试的时候会怎么问啊?回馈本版~ 最近面的面经和收集来的面经~
这里有做optimization的么?请教个问题。转行数据挖掘和机器学习
进入DataSciences版参与讨论
N******n
发帖数: 3003
21
这个就像你投文章,reviewer要求给你提很多意见,但是一看就知道不是很专业的问题。
n****g
发帖数: 14743
22
不错啊。

表,

【在 m******a 的大作中提到】
: 是IT里排名较靠前的一家
: 两年前曾参加过它的一次 SUMMIT
: 觉得他们作 ONLINE TRACKING 虽然很强
: 但分析和模型这块不敢恭维
: 那天突然接到他们HR电话问要不要去看看
: 想看看他们在作什么新东西,就去了
: 此前和他们招聘经理聊了一个多小时
: 他们有两个大项目
: 其中一个我三年前就在前雇主那儿作过了,并申请了专利
: 另一个刚刚在现公司申请了专利,并写了篇文章,已被一家需要同行评审的杂志接收发表,

s*******n
发帖数: 360
23
是你自己不够专业。

【在 c*****v 的大作中提到】
: 一次去面试,同胞全程英语面完,出来我用中文问一个问题,他居然是英文回答。
w*s
发帖数: 7227
24
老李你怎么也在这儿混,请问大盘什么时候开跌?

【在 h*****7 的大作中提到】
: entry level的都那样,越不行越把自己当回事,待几年就好了
: 请问你的专利署名是公司还是你个人?还是都有,受益怎么分配?
:
: 表,

d*****n
发帖数: 3084
25
这个确实是有些中国人非常bitch。
俺是无原则招中国人,虽然偶尔会出现来了以后连招呼都不愿意打的,我后来发现是
asshole。但是,顶多不说话,我这行业老人好混,不怕后生,怎么也比阿三强。
o**a
发帖数: 1315
26
绝对同意,同胞就是同胞,怎么着也比呵三强。

【在 d*****n 的大作中提到】
: 这个确实是有些中国人非常bitch。
: 俺是无原则招中国人,虽然偶尔会出现来了以后连招呼都不愿意打的,我后来发现是
: asshole。但是,顶多不说话,我这行业老人好混,不怕后生,怎么也比阿三强。

c*****v
发帖数: 839
27
这你就是胡扯了,我和你都不是一个专业的。

【在 s*******n 的大作中提到】
: 是你自己不够专业。
T*****u
发帖数: 7103
28
是啊,总比阿三和米国人强。国人即使挖你墙角,也没有阿三米国人干脆利索。

【在 d*****n 的大作中提到】
: 这个确实是有些中国人非常bitch。
: 俺是无原则招中国人,虽然偶尔会出现来了以后连招呼都不愿意打的,我后来发现是
: asshole。但是,顶多不说话,我这行业老人好混,不怕后生,怎么也比阿三强。

d******g
发帖数: 346
29
Don't be too harsh on others, but strict with yourself.
y******o
发帖数: 921
30
这结构,能分下段落吗,像是在写诗啊
相关主题
有关Stochastic Gradient DescentHow to Start the Career as Data Scientist
DS需要会的手艺 真不少【真心请教】选master project课题 - 有包子 (转载)
求Google 的 Data Science 有关的位置内推 (转载)我觉得neural network应用范围不大啊
进入DataSciences版参与讨论
h*****7
发帖数: 6781
31
你说我是老李,其实我也在找老李,老李是个传说,我们都爱老李

【在 w*s 的大作中提到】
: 老李你怎么也在这儿混,请问大盘什么时候开跌?
w**p
发帖数: 4080
32
我觉得也是。不要在技术上难为中国人,只要这人肯学,上进,谦虚。
当然楼主大牛就更不应该刁难了。
楼主其实也别这么介意那俩中国人啦。最后不也给你offer了么。有些中国人确实不太
注重礼貌或有点装逼,但是人其实不坏,不要一棍子就打死。这种人也是有合作的可能
的,说白了,总比烙印好。
i*e
发帖数: 352
33
good summary

【在 b*********k 的大作中提到】
: all our Chinese people should unite together.
: based on the LZ statements, two observations are
: fact 1.
: the manager of the hiring manager and the hiring manager are
: lao yin?
: fact 2.
: most of the experts in this fields are Chinese.
: Isn't it ironic?

v**********9
发帖数: 11
34
从帖子中可以看出楼主确实是大牛,非常佩服!
看完之后也有很多体会,这里跟大家分享一下:
楼主是大牛,有才的人有些傲气,这太正常不过了。所以技术公司对管理的要求才要更
高。两位同胞出现在面试环节实属多余,不认为他们的review可以在决策时候占有多大
比重, 毕竟在讨论的时候肯定是看manager 的脸色形式啦。这种级别的面试,VP 和
hiring manager 就可以了,初级技术筛选实在没有必要,如果真要看看能不能合群,
把华人项目经理拉出来聊聊就可以啦。个人认为能否把人才融入团队是公司管理层最需
要下功夫做的功课,而不应该依赖于团队成员本身的性格。
另外,个人觉得不需要对两位同胞太苛刻啦,毕竟资历尚浅,需要抓住机会表现自己,
其实他们问楼主问题不是为了要考倒楼主,主要是想证明自己懂这个技术,在站稳脚跟
阶段,是非常艰难的,这份高级岗位的offer 楼主可能没有看在眼里,可是对于两位同
胞来说,目前的工作都可能就意味着everything 啦。能帮就帮吧,相信楼主在反馈的
时候如果说他们非常优秀,会对他们帮助很大的。如果他们不懂得如何做人的话,那也
只会影响他们自己的人生了。
在美华人不容易,希望像楼主这样的大牛多分享您的经历,帮助大家提高专业水平,更
是为大家指明应该如何努力。
祝愿楼主能找到一份称心如意的工作,个感觉您需要的不是工作,而是一个partner,
也许到了自己创业的时候啦!
Good luck!
m**********n
发帖数: 118
35
非常赞同

【在 m******a 的大作中提到】
: 互相学习
: 看过版主很多贴子,知道版主也是好人
: 本人面试原则
: 1. 比本人资历丰富的,借机学习,目的不在试而在证 - 确信东西确实是被面者自己作的
: 2. 比本人资历浅的,不重基础,只重态度,只要愿学,爱学,这一行人人能作,没什么难的
: 3. 和本人资历差不多,同 1, 兼看 2 - 确信不是混子

a***g
发帖数: 2761
36
不能无原则的招
有的你罩不住,就给代沟里去了
还是要摸摸人品

【在 d*****n 的大作中提到】
: 这个确实是有些中国人非常bitch。
: 俺是无原则招中国人,虽然偶尔会出现来了以后连招呼都不愿意打的,我后来发现是
: asshole。但是,顶多不说话,我这行业老人好混,不怕后生,怎么也比阿三强。

q*b
发帖数: 897
37
我碰到一个,面后间隙在公共走廊里继续用中文问我技术问题。。。

【在 m******a 的大作中提到】
: 阁下没见过更绝的
: 面我的时候全英文
: 后来进了公司
: 自始至终都英文
: 俨然一老外

a********c
发帖数: 3657
38
搭车问一下,现在市价是多少钱啊?感觉lz很牛啊,offer才200k,感觉跟一般马工差
不多。。。
我手里有些hedge fund的contract position,想问问应该给多少合适?
w**********y
发帖数: 1691
39
公平的来看,基于楼主的描述,没觉得面试官有什么问题,而更多的可能是楼主觉得自
己很牛而对方资历浅一开始就先入为主的有情绪
你描述的问题可能性很多,
不同背景的人术语不同会导致问题,比如跟计算机的人说state space 跟统计的人说
HMM 跟金融的人说Kalman filter 大家可能都会很混淆 就跟你举的第一个面试官的例
子一样.
boosting residual 这个说法我还真是没听说过 虽然你在这里一解释大家都知道你想
说什么
还有所谓的算法的算法, 从来没听说过也不觉得是对RF的很好描述 ,这两个model 我
都写过而且改进过
再加上你英语可能也不完美 我不觉得一定是对方没水平 可能就是压根没听懂你说的所
谓术语或者你的英语
面试本来就是要去按照对方的水平去猜测对方期待的答案然后做出最好的回应 而不是
展示自己的渊博和水平高 学会怎么与人沟通比多学几个model 更重要

【在 B***i 的大作中提到】
: LZ 太自以为是了。
: 就你这种态度对待interviewer 还拿到offer, 说明同胞至少没有为难你, review 写
: 得不会太难看。如果四个面试者中两个都是negative的意见, 大部分公司还是不会给
: offer的。
: gradient boosting 和 random forest 得主要差别我猜他们主要是想听到 boosting
: 和bagging 区别。

w**********y
发帖数: 1691
40
对于gradient 和random forest 那个问题,有可能别人期待的答案是关于noisy data,
low variance的. 也可能对方期待的是哪个更适合做分布式计算的
相关主题
我觉得neural network应用范围不大啊请教:现在那些package实现gradient boosting tree比较好?
问一下python 或者是 R 里面 gradient boosting model 的问题How to prepare for the DS interview?
请问如何完全跳到data scientist/analyst, 还有多大差距?最近想做音频数据分析, 但是不知道怎么入手啊..
进入DataSciences版参与讨论
m******a
发帖数: 77
41
接受批评!
关于 BOOST RESIDUAL 一说, 请参见前面 DATA2014 兄的回贴
遵照VICTOR前辈的建议, 在这儿多说两句, 同一篇文章, 每个人的理解可能都不一样
本人学 GRADIENT BOOSTING, 读的是这篇
http://statweb.stanford.edu/~jhf/ftp/trebst.pdf
看看他的公式 6-10 或者更简单, 他的 ALGORITHM 2
就应该很清楚他是在 BOOST RESIDUAL - 试图每一步都减少RESIDUAL
兄台既然已经写过, 想必理解必然正确, 不过可能是从另一个角度
另外, 本人理解, HMM 和 KALMAN FILTER 还是有差别的,
至少在程序算法实现和应用上, 一分立, 一连续 - 没见谁拿 KALMAN FILTER 去作 NLP
模型,
也没见谁拿 HMM 去预测股价吧 - 除非是我孤陋寡闻, 虽然都可归为态空间模型
还有, 通常说的BOOSTING, 如ADA, EPSILON, 和GRADIENT BOOSTING, 有些细微差别
也可能兄台提及的是通常的BOOSTING
通常的BOOSTING和BANDIT又有些相象, 个人理解其实是同一个东西, 但往反方向BOOST
而已
正好知道两个关于 HMM 和 KALMAN FILTER 的极好的讲稿, 那天翻出来也在这儿列出来
能让人一看就明白, 省很多时间,
正好也写过 KALMAN FILTER, 一维的, 只是为了玩一下加深理解
个人经验, 记得好象某个大人物也说过, 看懂不叫懂, 能弄到用计算机算出来并算对才
叫懂
很多时候看文章, 觉得已经懂了, 真去拿程序实现时, 发现到处都是问题
最后, 你可以把RANDOM FOREST 或 BAGGING 用在 LOGISTIC REGRESSION, ANN, TREE
等等上面
没谁规定那东西只能用在 TREE 上, 所以我说它象是算法的算法, 直白而已

【在 w**********y 的大作中提到】
: 公平的来看,基于楼主的描述,没觉得面试官有什么问题,而更多的可能是楼主觉得自
: 己很牛而对方资历浅一开始就先入为主的有情绪
: 你描述的问题可能性很多,
: 不同背景的人术语不同会导致问题,比如跟计算机的人说state space 跟统计的人说
: HMM 跟金融的人说Kalman filter 大家可能都会很混淆 就跟你举的第一个面试官的例
: 子一样.
: boosting residual 这个说法我还真是没听说过 虽然你在这里一解释大家都知道你想
: 说什么
: 还有所谓的算法的算法, 从来没听说过也不觉得是对RF的很好描述 ,这两个model 我
: 都写过而且改进过

w**********y
发帖数: 1691
42
手机上不方便 简要回复一下吧
只要学过booting的都知道每一步是在re fit residuals 你我知道 你的面试官应该也
知道
其实这个说法其实也不严谨不深究了
算法的算法或者boost residual 都是你的用词很可能别人是没听懂你的用词 我的意思
是你通过这个不能说明面试官不懂 而可能你是否该改进表达方式
RF和boosting 的区别不包括 你说的"算法的算法"。 boosting 可以跟spline,
quantile regression 等等一起用 前面也有人讲过baggging也不是他们的区别
HMM做金融不一定要预测股价,而更多的是做regime switch. 更实际的应用我一哥们在
journal of trading 上面有论文 我自己也在用
HMM只能近似解continue latent variable 上课时老师都会讲,我举例子是说大家用语
不同而没说说他们完全一样

NLP

【在 m******a 的大作中提到】
: 接受批评!
: 关于 BOOST RESIDUAL 一说, 请参见前面 DATA2014 兄的回贴
: 遵照VICTOR前辈的建议, 在这儿多说两句, 同一篇文章, 每个人的理解可能都不一样
: 本人学 GRADIENT BOOSTING, 读的是这篇
: http://statweb.stanford.edu/~jhf/ftp/trebst.pdf
: 看看他的公式 6-10 或者更简单, 他的 ALGORITHM 2
: 就应该很清楚他是在 BOOST RESIDUAL - 试图每一步都减少RESIDUAL
: 兄台既然已经写过, 想必理解必然正确, 不过可能是从另一个角度
: 另外, 本人理解, HMM 和 KALMAN FILTER 还是有差别的,
: 至少在程序算法实现和应用上, 一分立, 一连续 - 没见谁拿 KALMAN FILTER 去作 NLP

1 (共1页)
进入DataSciences版参与讨论
相关主题
回馈本版~ 最近面的面经和收集来的面经~问一下python 或者是 R 里面 gradient boosting model 的问题
转行数据挖掘和机器学习请问如何完全跳到data scientist/analyst, 还有多大差距?
有关Stochastic Gradient Descent请教:现在那些package实现gradient boosting tree比较好?
DS需要会的手艺 真不少How to prepare for the DS interview?
求Google 的 Data Science 有关的位置内推 (转载)最近想做音频数据分析, 但是不知道怎么入手啊..
How to Start the Career as Data Scientistsan bruno ds position
【真心请教】选master project课题 - 有包子 (转载)工作机会 data scientist@experian datalab, San Diego (转载)
我觉得neural network应用范围不大啊关于data smoothing的问题
相关话题的讨论汇总
话题: boosting话题: manager话题: hiring话题: 面试话题: offer