由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 梦想公司onsite,壮烈牺牲.发面经
相关主题
Logistic model中 ROC曲线里面AUC 值太低怎么办?报两个offer-updated-附面试心得 (转载)
有没有人被批评过model too good to be true?请教一个R里的survivalROC问题!
[R] ROC curve怎么指定cutoffs?请问一个ROC AUC 问题?
R-square of logistic regression请教一个R的问题!
proc logistic: how to build 2 X 2 classification tableHow to test the difference between two C statistics (want the P
想问一个关于评价prediction performance的问题c-statistic是什么啊?
急需帮助,关于比较ROC的问题。谁来解释解释c-statistic为什么等于AUC
roc curve in RHow to express cut-off value
相关话题的讨论汇总
话题: auc话题: sas话题: roc话题: model话题: 公司
进入Statistics版参与讨论
1 (共1页)
N****n
发帖数: 1208
1
攒人品。
版上某著名统计软件公司,具体哪个就不说了。
统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
fraud/default detection。
前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
具体内容记不太清了,每个人问的都不同。大概内容如下:
1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
方法。
对某些变量,问得很细,比如意义,为什么这样CATEGORIZE。
2. 一般常见的模型问题,如何处理,如何才能改进MODEL。有了MODEL,公司应该怎么
用。我做的那个PRESENTATION TOPIC,实际上很烂,很多东西我都没考虑太细,跟信用
卡又一点不沾边,就CLASSIFICATION算法还能类似点,做的回归和分类树。只能人家问
,我现想,有些都解释不太通。
3. 一些prediction 问题,怎么EVALUATION 预测得准不准确。(MSE,
MISCLASSIFICATION RATE, ETC)
4. 概率题,BRAINTEASER (这个清醒的时候还好,一天满满行程中突然来这么一出,
还真反应迟钝了,我就答的不是很好)
5. 给出一组RAW TRANSACTION DATA,不用任何工具,问你能看出些什么。我主要从
PATTERN,OUTLIER,PERIODITICY上解释,再结合实际意义,比如周末销售量为什么比
平时小。节假日临近,就会增多,等等。
6. 组里在做的一些问题,结合简历上的经历,看能不能提出建设性的想法。
总体感觉,面的一般,没啥出彩的。但我越来越觉得,这个职位事先已经定好人了。因
为从交通安排,到面试官来晚,再到有人没SHOW UP,再到最后的大老板一边儿玩手机
一边和我说话,最后还提前半个小时草草收场。我觉得,要么我被深深的鄙视了,要么
就事先已经定好人选了,我就是当分母来了。
PS:纯TECHNICAL问题,BEHAVIOR的一个字儿没提。大家有什么问题可以问,看能不能
想起来点。
A*******s
发帖数: 3942
2
pat... 碰到这个也没办法了,
看起来的确是他们不太重视这个面试。
加油,offer应该马上来了。

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

n*****n
发帖数: 3123
3
patpat

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

s*********e
发帖数: 944
4

先谢谢分享onsite! 给你转了10块伪币:)
有onsite总是好的。
能分享一下前2轮电话面试大概问了些什么吗?

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

a******n
发帖数: 11246
5
我也是上周onsite后悲剧。
被你这么一说我觉得我也有被内定淘汰的嫌疑。
那天一早见recruiter的时候,她说她之前把
我和另外一个candidate安排重了,前一天晚上才发现。
另外,你是星期几面试的?我是周五,据说是
最容易被淘汰的一天 -,=

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

p*********o
发帖数: 138
6
thanks for sharing........
A*******s
发帖数: 3942
7
说说问题3。我不太懂fraud detection,但是这种binary classcification的问题,在
实践里普遍更关注的是rank ordering。所以ROC,AUC的概念是一定一定要提到的。
尤其是fraud这种rare event/highly unbalanced data,基于misclassification rate
来直接优化问题会很大,likelihood好像也不会很好,oversampling的手段虽然会有改
善,但是也有限。现在有不少研究是把AUC当优化目标的,据说效果要好不少。但是难
度很大,因为loss function不是连续的。

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

v******i
发帖数: 1246
8
啊? 已经牺牲了?

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

v******i
发帖数: 1246
9
看你描述 这个面试过程挺tough的 对脑力体力要求都挺高
而且很可能是已经有人选了
不过说明你的背景还是挺强的
某软件公司电面都没给过我那

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

a******n
发帖数: 11246
10
顶大牛!!学习了。
AUC是不是ROC curve里的area under curve的缩写?

rate
card
他的

【在 A*******s 的大作中提到】
: 说说问题3。我不太懂fraud detection,但是这种binary classcification的问题,在
: 实践里普遍更关注的是rank ordering。所以ROC,AUC的概念是一定一定要提到的。
: 尤其是fraud这种rare event/highly unbalanced data,基于misclassification rate
: 来直接优化问题会很大,likelihood好像也不会很好,oversampling的手段虽然会有改
: 善,但是也有限。现在有不少研究是把AUC当优化目标的,据说效果要好不少。但是难
: 度很大,因为loss function不是连续的。

相关主题
想问一个关于评价prediction performance的问题报两个offer-updated-附面试心得 (转载)
急需帮助,关于比较ROC的问题。请教一个R里的survivalROC问题!
roc curve in R请问一个ROC AUC 问题?
进入Statistics版参与讨论
a******n
发帖数: 11246
11
我也是,艹。投了无数简历才两个公司给我店面 :(

card
他的

【在 v******i 的大作中提到】
: 看你描述 这个面试过程挺tough的 对脑力体力要求都挺高
: 而且很可能是已经有人选了
: 不过说明你的背景还是挺强的
: 某软件公司电面都没给过我那

v******i
发帖数: 1246
12
你是fdu的那个安吉笋吗。。。。

【在 a******n 的大作中提到】
: 我也是,艹。投了无数简历才两个公司给我店面 :(
:
: card
: 他的

A*******s
发帖数: 3942
13
对,auc就是area under curve
不是大牛啊,这些关于ranking的paper很多我都看不大懂,因为statistical learning
theory的内容很多,我就记住了一些结论而已。

【在 a******n 的大作中提到】
: 顶大牛!!学习了。
: AUC是不是ROC curve里的area under curve的缩写?
:
: rate
: card
: 他的

s*********e
发帖数: 944
14

恕我后知后觉。
能说说是哪个软件公司吗?软件公司怎么会做 credit card
fraud/default detection?
谢谢

【在 v******i 的大作中提到】
: 看你描述 这个面试过程挺tough的 对脑力体力要求都挺高
: 而且很可能是已经有人选了
: 不过说明你的背景还是挺强的
: 某软件公司电面都没给过我那

A*******s
发帖数: 3942
15
一般来说软件公司都搞consulting的。

【在 s*********e 的大作中提到】
:
: 恕我后知后觉。
: 能说说是哪个软件公司吗?软件公司怎么会做 credit card
: fraud/default detection?
: 谢谢

a******n
发帖数: 11246
16
thanks。
总之觉得你的好几个帖子都对我有帮助。
我前一阵面一个做fraud detect的小组,就问了不少roc的东西。
要是早点看到你这帖子我就提一下最大化auc神马的了...

learning

【在 A*******s 的大作中提到】
: 对,auc就是area under curve
: 不是大牛啊,这些关于ranking的paper很多我都看不大懂,因为statistical learning
: theory的内容很多,我就记住了一些结论而已。

A*******s
发帖数: 3942
17
业界应该还没怎么应用这个auc优化的东东吧
paper说的天花乱坠,不知道有没有吹的成分
希望版上有经验的大牛可以说说。

【在 a******n 的大作中提到】
: thanks。
: 总之觉得你的好几个帖子都对我有帮助。
: 我前一阵面一个做fraud detect的小组,就问了不少roc的东西。
: 要是早点看到你这帖子我就提一下最大化auc神马的了...
:
: learning

p*****o
发帖数: 543
18
amazon? or fico?
l*********s
发帖数: 5409
19
RE

【在 v******i 的大作中提到】
: 看你描述 这个面试过程挺tough的 对脑力体力要求都挺高
: 而且很可能是已经有人选了
: 不过说明你的背景还是挺强的
: 某软件公司电面都没给过我那

s********e
发帖数: 323
20
我之前面试的时候也是,面试官迟到,有人不show up,还有安排错meeting room,但
是没觉得怎么不妥,但是面完第三天就给拒信了。后来想来确实也是事先就有人选了。

【在 N****n 的大作中提到】
: 攒人品。
: 版上某著名统计软件公司,具体哪个就不说了。
: 统计小硕,还在校,职位是Analytical Modeling Staff, 目前组里是做credit card
: fraud/default detection。
: 前面两轮电话面试,基本全TECHNICAL问题,各一个小时。
: ONSITE,先是一个小时PRESENTATION,然后Q&A部分。
: 之后,每一个小时都有两个面试官,问各种不同方面的问题。总共10几个组员。
: 具体内容记不太清了,每个人问的都不同。大概内容如下:
: 1. 我PRESENTATION的内容,MODEL,数据收集过程,为什么这样做,为什么不用其他的
: 方法。

相关主题
请教一个R的问题!谁来解释解释c-statistic为什么等于AUC
How to test the difference between two C statistics (want the PHow to express cut-off value
c-statistic是什么啊?Another question about ROC
进入Statistics版参与讨论
D******n
发帖数: 2836
21
logistic最好,lol。

【在 A*******s 的大作中提到】
: 业界应该还没怎么应用这个auc优化的东东吧
: paper说的天花乱坠,不知道有没有吹的成分
: 希望版上有经验的大牛可以说说。

p********a
发帖数: 5352
22
再接再厉!失败几次后离成功就不远了
p********a
发帖数: 5352
23
20个包子已发!
A*******s
发帖数: 3942
24
logistic是造成干统计的龙蛇混杂的原因之一啊
这个东西简单又好用,
即使完全不懂统计的,
培训一个星期就会用proc logistic了
统计懂得再多的也木有用
很难搞的出比logstict好的东东

【在 D******n 的大作中提到】
: logistic最好,lol。
n*********y
发帖数: 474
25
SAS吧?牛公司。。。
N****n
发帖数: 1208
26
Hi. 不好意思。没来得及回复。
前两轮大概问的是:简历上做过的PROJECT中,跟他们最接近的一个,让我简单描述一
下,什么问题什么数据用什么方法做出什么结果。还有问题改进。
BRAINTEASER问了好几个,估计是考反应。基本是概率题,不需要高深的技术知识,但
求思路。
SAS考了几个基本的操作,基本的PROC。MERGE FILES,MACRO,PROC FREQ, PROC MEANS
,几个基本回归模型,贝叶斯,ETC 。。。

【在 s*********e 的大作中提到】
:
: 恕我后知后觉。
: 能说说是哪个软件公司吗?软件公司怎么会做 credit card
: fraud/default detection?
: 谢谢

N****n
发帖数: 1208
27
师傅啊!!!!!!八戒又给你丢人了!!!!!!!
求介绍工作!!!!!!

【在 A*******s 的大作中提到】
: pat... 碰到这个也没办法了,
: 看起来的确是他们不太重视这个面试。
: 加油,offer应该马上来了。

w*****e
发帖数: 806
28
pat pat...offer 就要来了。。
N****n
发帖数: 1208
29
我刚开始也以为AUC越大越好。。。。
但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
次听说这个。。。。

【在 A*******s 的大作中提到】
: 业界应该还没怎么应用这个auc优化的东东吧
: paper说的天花乱坠,不知道有没有吹的成分
: 希望版上有经验的大牛可以说说。

N****n
发帖数: 1208
30
你长的太好看了,人家不敢面试你,怕引起公司大乱 。。。。。。。。

【在 v******i 的大作中提到】
: 看你描述 这个面试过程挺tough的 对脑力体力要求都挺高
: 而且很可能是已经有人选了
: 不过说明你的背景还是挺强的
: 某软件公司电面都没给过我那

相关主题
R help: Direction of ROC in R有没有人被批评过model too good to be true?
sensitivity and specificity[R] ROC curve怎么指定cutoffs?
Logistic model中 ROC曲线里面AUC 值太低怎么办?R-square of logistic regression
进入Statistics版参与讨论
D******n
发帖数: 2836
31
这个两个说法没有太大区别吧,除非你对“原理对角线”下个精准的定义。但是这样又
多引入了一个量。
AUC(ROC)的好处是在于所谓的不受positve(negative) rate的影响。在drug screen里
面也有用,还有其变体,bedroc,RIE。
我做过比较,当然只是在我的data里面,logistic是比不过ROC的,但是对1,0 进行一下
weighting的话,就无敌了。

【在 N****n 的大作中提到】
: 我刚开始也以为AUC越大越好。。。。
: 但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
: 次听说这个。。。。

N****n
发帖数: 1208
32
说的远离,是有可能在对角线以下。。。就是AUC<0.5。 他们说,那是因为MODEL的是P
(1-Y),不太理解,望指点。

screen里
一下

【在 D******n 的大作中提到】
: 这个两个说法没有太大区别吧,除非你对“原理对角线”下个精准的定义。但是这样又
: 多引入了一个量。
: AUC(ROC)的好处是在于所谓的不受positve(negative) rate的影响。在drug screen里
: 面也有用,还有其变体,bedroc,RIE。
: 我做过比较,当然只是在我的data里面,logistic是比不过ROC的,但是对1,0 进行一下
: weighting的话,就无敌了。

D******n
发帖数: 2836
33
理论上,没有一个model是应该稳定的below 0.5的,因为只要它below 0.5,把predict
ion flip一下就可以了。这跟著名的“阴晴天气预报总能above 0.5 success rate”问
题差不多,lol。
如果看到roc完全在对角线以下,那就要检查以下model有啥问题了,因为那比flip a c
oin还要糟糕。

是P

【在 N****n 的大作中提到】
: 说的远离,是有可能在对角线以下。。。就是AUC<0.5。 他们说,那是因为MODEL的是P
: (1-Y),不太理解,望指点。
:
: screen里
: 一下

A*******s
发帖数: 3942
34
这个说法应该和KS有关。在ROC的图上面,ROC离对角线在Y方向上的最大距离就是KS值。
一般来说AUC越大越好,不过如果俩classifier/ranker的ROC曲线有相交的地方,就得
用iso performance lines来看哪个更符合实际的需求。笼统地说ROC CURVE离对角线越
远越好不太精确。看这篇文章
http://citeseer.ist.psu.edu/viewdoc/download;jsessionid=0EE0968

【在 N****n 的大作中提到】
: 我刚开始也以为AUC越大越好。。。。
: 但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
: 次听说这个。。。。

A*******s
发帖数: 3942
35
被sas鄙视太正常啦,我当初也被他们鄙视了,哼哼!
被sas鄙视完一般offer就来了,哈

【在 N****n 的大作中提到】
: 师傅啊!!!!!!八戒又给你丢人了!!!!!!!
: 求介绍工作!!!!!!

A*******s
发帖数: 3942
36
logistic比不过ROC是什么意思?

screen里
一下

【在 D******n 的大作中提到】
: 这个两个说法没有太大区别吧,除非你对“原理对角线”下个精准的定义。但是这样又
: 多引入了一个量。
: AUC(ROC)的好处是在于所谓的不受positve(negative) rate的影响。在drug screen里
: 面也有用,还有其变体,bedroc,RIE。
: 我做过比较,当然只是在我的data里面,logistic是比不过ROC的,但是对1,0 进行一下
: weighting的话,就无敌了。

D******n
发帖数: 2836
37
可以直接maximize AUC.

【在 A*******s 的大作中提到】
: logistic比不过ROC是什么意思?
:
: screen里
: 一下

A*******s
发帖数: 3942
38
用的是啥model?
另外,对于这种rare event,怎么确定logit regression里面的weight?

【在 D******n 的大作中提到】
: 可以直接maximize AUC.
D******n
发帖数: 2836
39
用的还是一样的model,lol。当然还有其他的。
那个weight,可以用percentage,可以直接subsample,weight也不用。
有些拍脑袋就是了。不过还work了。

【在 A*******s 的大作中提到】
: 用的是啥model?
: 另外,对于这种rare event,怎么确定logit regression里面的weight?

A*******s
发帖数: 3942
40
auc maximization的model有不少吧,好像比较有名的是rankboost,还有一些SVM
variants。

【在 D******n 的大作中提到】
: 用的还是一样的model,lol。当然还有其他的。
: 那个weight,可以用percentage,可以直接subsample,weight也不用。
: 有些拍脑袋就是了。不过还work了。

相关主题
R-square of logistic regression急需帮助,关于比较ROC的问题。
proc logistic: how to build 2 X 2 classification tableroc curve in R
想问一个关于评价prediction performance的问题报两个offer-updated-附面试心得 (转载)
进入Statistics版参与讨论
a******n
发帖数: 11246
41
这个不是显然马?。。。不然人家问你roc怎么看,也是这么说呀。
左上角那个点,等于永远不犯错。对角线上,等于随机选择。

【在 N****n 的大作中提到】
: 我刚开始也以为AUC越大越好。。。。
: 但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
: 次听说这个。。。。

o****o
发帖数: 8077
42
abs(AUC) ?

【在 N****n 的大作中提到】
: 我刚开始也以为AUC越大越好。。。。
: 但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
: 次听说这个。。。。

w********5
发帖数: 72
43
我是周五,据说是
reason?
b**********i
发帖数: 1059
44
这个统计软件公司有这么dream的好吗
N****n
发帖数: 1208
45
对于水平很挫,傻叉一样的选手,已经很好了。

【在 b**********i 的大作中提到】
: 这个统计软件公司有这么dream的好吗
A*******s
发帖数: 3942
46
i heard they can watch porn in office, ha ha

【在 b**********i 的大作中提到】
: 这个统计软件公司有这么dream的好吗
l***a
发帖数: 12410
47
rare event的直接用logistic也不好吧,至少得有over sampling一步吧

【在 D******n 的大作中提到】
: logistic最好,lol。
s******r
发帖数: 1524
48
Once I worked with them. They, or at least some of them write the code in a
such dream way that I can never understand why they did that. I got so shock
of their style. Job-security SAS code makes more sense. I would never be
able to write as their style unless in the dream.

【在 b**********i 的大作中提到】
: 这个统计软件公司有这么dream的好吗
c****s
发帖数: 395
49
I think it is the same thing.
if the areas are large, usually bc they are far from diagonal
nowadays the hirng people are very mean.

【在 N****n 的大作中提到】
: 我刚开始也以为AUC越大越好。。。。
: 但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
: 次听说这个。。。。

c****s
发帖数: 395
50
is this a praise?

a
shock

【在 s******r 的大作中提到】
: Once I worked with them. They, or at least some of them write the code in a
: such dream way that I can never understand why they did that. I got so shock
: of their style. Job-security SAS code makes more sense. I would never be
: able to write as their style unless in the dream.

相关主题
请教一个R里的survivalROC问题!How to test the difference between two C statistics (want the P
请问一个ROC AUC 问题?c-statistic是什么啊?
请教一个R的问题!谁来解释解释c-statistic为什么等于AUC
进入Statistics版参与讨论
N****n
发帖数: 1208
51
Your message has been forwarded to Actuaries' wives and kids ........

【在 A*******s 的大作中提到】
: i heard they can watch porn in office, ha ha
s******r
发帖数: 1524
52
Anyone with one semester class or 3+ month code experience would not do that
. I have to admit it is creative, even really unbelievable stupid creative.
I can understand if they did maybe for job security. But I have to say they
go too far.
So for a very long time, I do not trust the ppl from that company.

【在 c****s 的大作中提到】
: is this a praise?
:
: a
: shock

D******n
发帖数: 2836
53
u meant the SAS coding style or the C coding style to create SAS?

that
.
they

【在 s******r 的大作中提到】
: Anyone with one semester class or 3+ month code experience would not do that
: . I have to admit it is creative, even really unbelievable stupid creative.
: I can understand if they did maybe for job security. But I have to say they
: go too far.
: So for a very long time, I do not trust the ppl from that company.

s******r
发帖数: 1524
54
SAS coding style

【在 D******n 的大作中提到】
: u meant the SAS coding style or the C coding style to create SAS?
:
: that
: .
: they

A*******s
发帖数: 3942
55
俺老板对这公司的某些consultants印象也很不好,觉得他们太强势。
不过话说回来,在垄断公司干活就是好啊,别的公司的consultants都得对客户点头哈
腰的,就他们家的站着赚钱。所以,我太想和他们同流合污了。

that
.
they

【在 s******r 的大作中提到】
: Anyone with one semester class or 3+ month code experience would not do that
: . I have to admit it is creative, even really unbelievable stupid creative.
: I can understand if they did maybe for job security. But I have to say they
: go too far.
: So for a very long time, I do not trust the ppl from that company.

o****o
发帖数: 8077
56
any sample code pieces?

that
.
they

【在 s******r 的大作中提到】
: Anyone with one semester class or 3+ month code experience would not do that
: . I have to admit it is creative, even really unbelievable stupid creative.
: I can understand if they did maybe for job security. But I have to say they
: go too far.
: So for a very long time, I do not trust the ppl from that company.

s******r
发帖数: 1524
57
For one thing,
they match 200+ million record to itself by hash table. By using proc sql or
data step, we got result in 1 hour. And their code take 25+ hours. After two months hard working, they successfully drop the processing to 23 hours.
For another thing, while call a macro function with parameters, I would call
directly, if necessary, I would put something in log.
The way they did,
%do i = 1 %to 3;
%sum(&i);
%end;
They would create 3 text files, text1.txt -- text3.txt
each one contains
%sum(1);
o****o
发帖数: 8077
58
hehe, interesting
why the hell ur boss hire those guys?
office politics?
T****n
发帖数: 2195
59
楼全让你弄歪了,你负责介绍工作。。。。。。。

or
two months hard working, they successfully drop the processing to 23 hours.
call

【在 s******r 的大作中提到】
: For one thing,
: they match 200+ million record to itself by hash table. By using proc sql or
: data step, we got result in 1 hour. And their code take 25+ hours. After two months hard working, they successfully drop the processing to 23 hours.
: For another thing, while call a macro function with parameters, I would call
: directly, if necessary, I would put something in log.
: The way they did,
: %do i = 1 %to 3;
: %sum(&i);
: %end;
: They would create 3 text files, text1.txt -- text3.txt

c*****t
发帖数: 1712
60
haha, so dream!
相关主题
How to express cut-off valuesensitivity and specificity
Another question about ROCLogistic model中 ROC曲线里面AUC 值太低怎么办?
R help: Direction of ROC in R有没有人被批评过model too good to be true?
进入Statistics版参与讨论
c*****t
发帖数: 1712
61
lz 别泄气。等你好消息
s******r
发帖数: 1524
62
冤枉,白菜帮子 和Actuaries歪的,我就是一打酱油的。好吧,LZ要高兴的话,可以发个
resume给我,组里没有fresh的位置,不过看看resume,毁毁人还是可以的.
上回说到某著名公司和我们做项目,要价1个mm,包括一个server和SAS code.我们的头不
太懂,一想业界第一的公司,多半不差,就从了.我本来在忙别的,不过这个项目很重要的,
而结果优实在不如人意,就被抓差了.我其实要证明一点SAS一样可以在1到2个小时完成.
我把结果show给了他们,他们终于不情愿的放弃了hash而改用我们的结构,一分钱也没给
我们,前几个月忙活的钱还算.前后4个月吧,processing time 终于降到了两个小时,而
由于development时间太多,cost已经上升到1.2+个mm.要知道他们可是一共两个人,每个
人$200/hour.
但和我们的结果依旧不相符.不能说他们一定错了,可我实在一点信心也没有了.我和经
理说,应该终止合作asap,否则我不认为我们会在一年内拿到任何有意义的结果.
合作结束了,简单说,我们花了$1.2+M,五个月的时间,买了一个server,用我们自己的方
案作完了.

【在 T****n 的大作中提到】
: 楼全让你弄歪了,你负责介绍工作。。。。。。。
:
: or
: two months hard working, they successfully drop the processing to 23 hours.
: call

l***a
发帖数: 12410
63
什么原因导致hash反而更慢?

的,
成.

【在 s******r 的大作中提到】
: 冤枉,白菜帮子 和Actuaries歪的,我就是一打酱油的。好吧,LZ要高兴的话,可以发个
: resume给我,组里没有fresh的位置,不过看看resume,毁毁人还是可以的.
: 上回说到某著名公司和我们做项目,要价1个mm,包括一个server和SAS code.我们的头不
: 太懂,一想业界第一的公司,多半不差,就从了.我本来在忙别的,不过这个项目很重要的,
: 而结果优实在不如人意,就被抓差了.我其实要证明一点SAS一样可以在1到2个小时完成.
: 我把结果show给了他们,他们终于不情愿的放弃了hash而改用我们的结构,一分钱也没给
: 我们,前几个月忙活的钱还算.前后4个月吧,processing time 终于降到了两个小时,而
: 由于development时间太多,cost已经上升到1.2+个mm.要知道他们可是一共两个人,每个
: 人$200/hour.
: 但和我们的结果依旧不相符.不能说他们一定错了,可我实在一点信心也没有了.我和经

s******r
发帖数: 1524
64
我想hash应该用在小table match 大table. 当把一个大table 放进hash,一是占用大量
memory,而是建立index也花时间.

【在 l***a 的大作中提到】
: 什么原因导致hash反而更慢?
:
: 的,
: 成.

N****n
发帖数: 1208
65
LZ是个大白痴,快要出家了。
她披上婚纱那一刻,我也披上了袈裟 。。。

【在 c*****t 的大作中提到】
: lz 别泄气。等你好消息
N****n
发帖数: 1208
66
你又埋汰他们了。
我也想埋汰,因为公司高层全被印度人占领了。。。。。。。。。那还有个好?
面试的时候,组里唯一的中国人,说有事没来。

的,
成.

【在 s******r 的大作中提到】
: 冤枉,白菜帮子 和Actuaries歪的,我就是一打酱油的。好吧,LZ要高兴的话,可以发个
: resume给我,组里没有fresh的位置,不过看看resume,毁毁人还是可以的.
: 上回说到某著名公司和我们做项目,要价1个mm,包括一个server和SAS code.我们的头不
: 太懂,一想业界第一的公司,多半不差,就从了.我本来在忙别的,不过这个项目很重要的,
: 而结果优实在不如人意,就被抓差了.我其实要证明一点SAS一样可以在1到2个小时完成.
: 我把结果show给了他们,他们终于不情愿的放弃了hash而改用我们的结构,一分钱也没给
: 我们,前几个月忙活的钱还算.前后4个月吧,processing time 终于降到了两个小时,而
: 由于development时间太多,cost已经上升到1.2+个mm.要知道他们可是一共两个人,每个
: 人$200/hour.
: 但和我们的结果依旧不相符.不能说他们一定错了,可我实在一点信心也没有了.我和经

D******n
发帖数: 2836
67
没看明白。
人家是SAS,你为何要证明SAS。

的,
成.

【在 s******r 的大作中提到】
: 冤枉,白菜帮子 和Actuaries歪的,我就是一打酱油的。好吧,LZ要高兴的话,可以发个
: resume给我,组里没有fresh的位置,不过看看resume,毁毁人还是可以的.
: 上回说到某著名公司和我们做项目,要价1个mm,包括一个server和SAS code.我们的头不
: 太懂,一想业界第一的公司,多半不差,就从了.我本来在忙别的,不过这个项目很重要的,
: 而结果优实在不如人意,就被抓差了.我其实要证明一点SAS一样可以在1到2个小时完成.
: 我把结果show给了他们,他们终于不情愿的放弃了hash而改用我们的结构,一分钱也没给
: 我们,前几个月忙活的钱还算.前后4个月吧,processing time 终于降到了两个小时,而
: 由于development时间太多,cost已经上升到1.2+个mm.要知道他们可是一共两个人,每个
: 人$200/hour.
: 但和我们的结果依旧不相符.不能说他们一定错了,可我实在一点信心也没有了.我和经

P****D
发帖数: 11146
68
这两个明明是一回事啊!
如此鸡蛋里挑骨头,果然内定了不打算要你。

【在 N****n 的大作中提到】
: 我刚开始也以为AUC越大越好。。。。
: 但他们不那么说,那个面试的说,ROC CURVE离对角线越远越好。。。。我说,我头一
: 次听说这个。。。。

P****D
发帖数: 11146
69
太正常了。我有朋友在一公司负责数据库工作,他们公司跟贵公司一样脑残。
而且正常来说,你们花了那么多钱,对方应该提供后续支持的。现在既然是用你们自己
的方案作了,估计支持也没有了吧。

【在 s******r 的大作中提到】
: 我想hash应该用在小table match 大table. 当把一个大table 放进hash,一是占用大量
: memory,而是建立index也花时间.

g********r
发帖数: 8017
70
从小经理的角度,这个钱不白花。跟defensive medicine一个道理。要是项目又什么问
题,大经理问小经理:你都干了啥?小经理可以理直气壮地说:“我雇了最好的公司花
了很多钱,这已经是最好的结果了。”然后他就没有过失了。要是一开始就用内部方案
,到时候大经理可以说“好小子,为了省几个小钱惹麻烦!你被解雇了!”

【在 P****D 的大作中提到】
: 太正常了。我有朋友在一公司负责数据库工作,他们公司跟贵公司一样脑残。
: 而且正常来说,你们花了那么多钱,对方应该提供后续支持的。现在既然是用你们自己
: 的方案作了,估计支持也没有了吧。

相关主题
有没有人被批评过model too good to be true?proc logistic: how to build 2 X 2 classification table
[R] ROC curve怎么指定cutoffs?想问一个关于评价prediction performance的问题
R-square of logistic regression急需帮助,关于比较ROC的问题。
进入Statistics版参与讨论
b*******y
发帖数: 289
71
我也碰到过这种情况,最后还是拿到offer了。面试失败,最主要的是总结自己在面试
过程中的经验教训,这种无谓的猜测没必要。

【在 a******n 的大作中提到】
: 我也是上周onsite后悲剧。
: 被你这么一说我觉得我也有被内定淘汰的嫌疑。
: 那天一早见recruiter的时候,她说她之前把
: 我和另外一个candidate安排重了,前一天晚上才发现。
: 另外,你是星期几面试的?我是周五,据说是
: 最容易被淘汰的一天 -,=

b*******y
发帖数: 289
72
很多consulting公司的statistician面试都是这样的。

【在 v******i 的大作中提到】
: 看你描述 这个面试过程挺tough的 对脑力体力要求都挺高
: 而且很可能是已经有人选了
: 不过说明你的背景还是挺强的
: 某软件公司电面都没给过我那

b*******y
发帖数: 289
73
AUC用的还是挺多的吧。做scorecard的时候不也用的吗。marketing一般就用KS比较多。

【在 A*******s 的大作中提到】
: 业界应该还没怎么应用这个auc优化的东东吧
: paper说的天花乱坠,不知道有没有吹的成分
: 希望版上有经验的大牛可以说说。

b*******y
发帖数: 289
74
据说他家福利超级好。

【在 A*******s 的大作中提到】
: 俺老板对这公司的某些consultants印象也很不好,觉得他们太强势。
: 不过话说回来,在垄断公司干活就是好啊,别的公司的consultants都得对客户点头哈
: 腰的,就他们家的站着赚钱。所以,我太想和他们同流合污了。
:
: that
: .
: they

A*******s
发帖数: 3942
75
i was talking about AUC-maximization models.

多。

【在 b*******y 的大作中提到】
: AUC用的还是挺多的吧。做scorecard的时候不也用的吗。marketing一般就用KS比较多。
N****n
发帖数: 1208
76
email! Check email!

【在 A*******s 的大作中提到】
: i was talking about AUC-maximization models.
:
: 多。

a******n
发帖数: 11246
77
对对,仙子mm说得对,我还是要从自身找原因...

【在 b*******y 的大作中提到】
: 我也碰到过这种情况,最后还是拿到offer了。面试失败,最主要的是总结自己在面试
: 过程中的经验教训,这种无谓的猜测没必要。

1 (共1页)
进入Statistics版参与讨论
相关主题
How to express cut-off valueproc logistic: how to build 2 X 2 classification table
Another question about ROC想问一个关于评价prediction performance的问题
R help: Direction of ROC in R急需帮助,关于比较ROC的问题。
sensitivity and specificityroc curve in R
Logistic model中 ROC曲线里面AUC 值太低怎么办?报两个offer-updated-附面试心得 (转载)
有没有人被批评过model too good to be true?请教一个R里的survivalROC问题!
[R] ROC curve怎么指定cutoffs?请问一个ROC AUC 问题?
R-square of logistic regression请教一个R的问题!
相关话题的讨论汇总
话题: auc话题: sas话题: roc话题: model话题: 公司