由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 发个面经吧[Data Scientist]
相关主题
版上有推荐的data scientist的面经吗?data science如何进阶呢?
Hackerrank的測試请教Data incubator的challenge
python用起来没有matlab好使,尤其是数据处理请推荐data science 在线学习的program
讲个找数据科学工作的捷径 aka 刷Kaggle题迅速入门data scient (转载)分享两个data scientist职位的面经
有没有人一起组队做kaggle?请问Leetcode哪里能找到更多的SQL题目?
装不了scipy 包,提示没装MKL有关clustering
fresh PhD 求职求内推,非常感谢!leetcode 里的在两个sorted array里找median 得问题,是不是有什么trick?
data analysis part time job请问为什么有的data analyst的工作要求会用excel呢?
相关话题的讨论汇总
话题: ds话题: 数据结构话题: min话题: data话题: br
进入DataSciences版参与讨论
1 (共1页)
s*********h
发帖数: 6288
1
个人背景:
4年左右经验, 目前工作是startup的DS, predictive model.
面的公司是做hedge fund的很有名的公司。
recruiter找的我,就打算面面看看是不是有什么好机会。
1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
process。这些都比较熟练没什么问题。
另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这些……
2. 二轮一个印度哥们儿面,remote coding,一些概率题和数据结构题,都是python写
的,概率题是x_0 ... x_n-1个independent distribution,随机选一个,选到了x_k,
然后问这个x_k的值比其他的都小的概率是多少。他一开始表达不清楚,我问他是不是
conditioning on knowing k and value of x_k,他说不是,那我说那就是1/10咯,他
说这是iid的情况,然后我追问了半天才明白已经知道了k和x_k的值,所以就是Prod(P(
x_i >= x_k)) for all i != k
数据结构题是做一个Stack,包含一些多余的method,比如return min of stack. 要求
是任何method都是O(1) time complexity. 我对算法其实完全不熟,随便刷了几道
leetcode而已。反正要O(1)只能是都给存着了,pop 和 push都很简单。min的话需要每
push一次就append新的min进去。然后pop了的话就把最上面的min给pop了就行。
3. onsite,两个华人小哥,一个华人姐姐,两个老美。
问题主要集中在数据结构和pandas/numpy
a. two sum of non unique list
b. de-dup using numpy.
c. Last observation carry forward in pandas
d. 一些简单的概率题。问清楚就行了
e. 瞎聊.
前后两个HR处理我的面试。第一个HR非常热情,聊得很开心。第二个HR就是纽约来的
arrogant douchebag. 语气和态度非常不友好,电话从来不约,直接给打过来,发邮件
给他约了时间之后每次迟到5~10分钟。就算是onsite时候他也迟到。
所有技术面的人感觉都很友好,交流基本顺畅,相谈甚欢。感觉每个人都很聪明。这个
公司号称门槛很高,但是DS的门槛不高。但是他们做的东西并不是DS,只是简单的
analysis而已。
仍在考虑要不要接offer。有什么问题的话回帖好了。细节信息可能私信回复。
d****n
发帖数: 12461
2
2s?如果是这样的养老公司可以去。不过有些公司就算了吧。我觉得finance里面的ds
不算ds。

【在 s*********h 的大作中提到】
: 个人背景:
: 4年左右经验, 目前工作是startup的DS, predictive model.
: 面的公司是做hedge fund的很有名的公司。
: recruiter找的我,就打算面面看看是不是有什么好机会。
: 1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
: process。这些都比较熟练没什么问题。
: 另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这些……
: 2. 二轮一个印度哥们儿面,remote coding,一些概率题和数据结构题,都是python写
: 的,概率题是x_0 ... x_n-1个independent distribution,随机选一个,选到了x_k,
: 然后问这个x_k的值比其他的都小的概率是多少。他一开始表达不清楚,我问他是不是

s*********h
发帖数: 6288
3
你说的没有错, finance里面没人做DS

ds

【在 d****n 的大作中提到】
: 2s?如果是这样的养老公司可以去。不过有些公司就算了吧。我觉得finance里面的ds
: 不算ds。

m******r
发帖数: 1033
4
congratulations!
J*******t
发帖数: 148
5
太赞了, 已经拿到hedge fund offer?
n******g
发帖数: 2201
6
我觉得你很牛了 我周围的ds 都是女大妈 只会excel
透露下工资好吗?
[在 staftermath (彦清风) 的大作中提到:]
:个人背景:
:面的公司是做hedge fund的很有名的公司。
:recruiter找的我,就打算面面看看是不是有什么好机会。
:1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
:process。这些都比较熟练没什么问题。
:另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这
些……
:conditioning on knowing k and value of x_k,他说不是,那我说那就是1/10咯,
他说这是iid的情况,然后我追问了半天才明白已经知道了k和x_k的值,所以就是Prod(
P(x_i >= x_k)) for all i != k
:数据结构题是做一个Stack,包含一些多余的method,比如return min of stack. 要
求是任何method都是O(1) time complexity. 我对算法其实完全不熟,随便刷了几道
:leetcode而已。反正要O(1)只能是都给存着了,pop 和 push都很简单。min的话需要
每push一次就append新的min进去。然后pop了的话就把最上面的min给pop了就行。
:问题主要集中在数据结构和pandas/numpy
:..........
m******r
发帖数: 1033
7
然后有次有个大妈跟我说什么是大数据, 说是excel存不下的数据,都叫大数据。

【在 n******g 的大作中提到】
: 我觉得你很牛了 我周围的ds 都是女大妈 只会excel
: 透露下工资好吗?
: [在 staftermath (彦清风) 的大作中提到:]
: :个人背景:
: :面的公司是做hedge fund的很有名的公司。
: :recruiter找的我,就打算面面看看是不是有什么好机会。
: :1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
: :process。这些都比较熟练没什么问题。
: :另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这
: 些……

s*********h
发帖数: 6288
8
工资还在negotiate.
你这是什么Ds…居然用excel…


: 我觉得你很牛了 我周围的ds 都是女大妈 只会excel

: 透露下工资好吗?

: [在 staftermath (彦清风) 的大作中提到:]

: :个人背景:

: :面的公司是做hedge fund的很有名的公司。

: :recruiter找的我,就打算面面看看是不是有什么好机会。

: :1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string

: :process。这些都比较熟练没什么问题。

: :另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这

: 些……



【在 n******g 的大作中提到】
: 我觉得你很牛了 我周围的ds 都是女大妈 只会excel
: 透露下工资好吗?
: [在 staftermath (彦清风) 的大作中提到:]
: :个人背景:
: :面的公司是做hedge fund的很有名的公司。
: :recruiter找的我,就打算面面看看是不是有什么好机会。
: :1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
: :process。这些都比较熟练没什么问题。
: :另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这
: 些……

s*********h
发帖数: 6288
9
话糙理不糙哈哈哈。我觉得内存放不下的就是大数据。


: 然后有次有个大妈跟我说什么是大数据, 说是excel存不下的数据,都叫大数据。



【在 m******r 的大作中提到】
: 然后有次有个大妈跟我说什么是大数据, 说是excel存不下的数据,都叫大数据。
A****n
发帖数: 241
10
恭喜恭喜!
-----------------------------------
Amazon 内推,请发简历和job ID 到 [email protected] 亚马逊的职位都可以通
过内推系统内推。
Data Analyst 工作日常SQL R code 博客分享,工科转行到IT工作经历。
http://everydayds.com/
相关主题
装不了scipy 包,提示没装MKLdata science如何进阶呢?
fresh PhD 求职求内推,非常感谢!请教Data incubator的challenge
data analysis part time job请推荐data science 在线学习的program
进入DataSciences版参与讨论
s*********h
发帖数: 6288
11
[Updated]
因为还是决定据了,所以就把公司报个
芝加哥的citadel, security 部门
Final Package 150k base + 45k bonus + 20k signon
我打电话据之后又说可以往165k + 45k bonus + 30k signon努力,不过需要立刻同意
最终考虑之后还是据了。
个人背景:
4年左右经验, 目前工作是startup的DS, predictive model.
面的公司是做hedge fund的很有名的公司。
recruiter找的我,就打算面面看看是不是有什么好机会。
1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
process。这些都比较熟练没什么问题。
另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这些……
2. 二轮一个印度哥们儿面,remote coding,一些概率题和数据结构题,都是python写
的,概率题是x_0 ... x_n-1个independent distribution,随机选一个,选到了x_k,
然后问这个x_k的值比其他的都小的概率是多少。他一开始表达不清楚,我问他是不是
conditioning on knowing k and value of x_k,他说不是,那我说那就是1/10咯,他
说这是iid的情况,然后我追问了半天才明白已经知道了k和x_k的值,所以就是Prod(P(
x_i >= x_k)) for all i != k
数据结构题是做一个Stack,包含一些多余的method,比如return min of stack. 要求
是任何method都是O(1) time complexity. 我对算法其实完全不熟,随便刷了几道
leetcode而已。反正要O(1)只能是都给存着了,pop 和 push都很简单。min的话需要每
push一次就append新的min进去。然后pop了的话就把最上面的min给pop了就行。
3. onsite,两个华人小哥,一个华人姐姐,两个老美。
问题主要集中在数据结构和pandas/numpy
a. two sum of non unique list
b. de-dup using numpy.
c. Last observation carry forward in pandas
d. 一些简单的概率题。问清楚就行了
e. 瞎聊.
前后两个HR处理我的面试。第一个HR非常热情,聊得很开心。第二个HR就是纽约来的
arrogant douchebag. 语气和态度非常不友好,电话从来不约,直接给打过来,发邮件
给他约了时间之后每次迟到5~10分钟。就算是onsite时候他也迟到。
所有技术面的人感觉都很友好,交流基本顺畅,相谈甚欢。感觉每个人都很聪明。这个
公司号称门槛很高,但是DS的门槛不高。但是他们做的东西并不是DS,只是简单的
analysis而已。
仍在考虑要不要接offer。有什么问题的话回帖好了。细节信息可能私信回复。
d****n
发帖数: 12461
12
2s?如果是这样的养老公司可以去。不过有些公司就算了吧。我觉得finance里面的ds
不算ds。

【在 s*********h 的大作中提到】
: 个人背景:
: 4年左右经验, 目前工作是startup的DS, predictive model.
: 面的公司是做hedge fund的很有名的公司。
: recruiter找的我,就打算面面看看是不是有什么好机会。
: 1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
: process。这些都比较熟练没什么问题。
: 另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这些……
: 2. 二轮一个印度哥们儿面,remote coding,一些概率题和数据结构题,都是python写
: 的,概率题是x_0 ... x_n-1个independent distribution,随机选一个,选到了x_k,
: 然后问这个x_k的值比其他的都小的概率是多少。他一开始表达不清楚,我问他是不是

s*********h
发帖数: 6288
13
你说的没有错, finance里面没人做DS

ds

【在 d****n 的大作中提到】
: 2s?如果是这样的养老公司可以去。不过有些公司就算了吧。我觉得finance里面的ds
: 不算ds。

m******r
发帖数: 1033
14
congratulations!
J*******t
发帖数: 148
15
太赞了, 已经拿到hedge fund offer?
n******g
发帖数: 2201
16
我觉得你很牛了 我周围的ds 都是女大妈 只会excel
透露下工资好吗?
[在 staftermath (彦清风) 的大作中提到:]
:个人背景:
:面的公司是做hedge fund的很有名的公司。
:recruiter找的我,就打算面面看看是不是有什么好机会。
:1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
:process。这些都比较熟练没什么问题。
:另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这
些……
:conditioning on knowing k and value of x_k,他说不是,那我说那就是1/10咯,
他说这是iid的情况,然后我追问了半天才明白已经知道了k和x_k的值,所以就是Prod(
P(x_i >= x_k)) for all i != k
:数据结构题是做一个Stack,包含一些多余的method,比如return min of stack. 要
求是任何method都是O(1) time complexity. 我对算法其实完全不熟,随便刷了几道
:leetcode而已。反正要O(1)只能是都给存着了,pop 和 push都很简单。min的话需要
每push一次就append新的min进去。然后pop了的话就把最上面的min给pop了就行。
:问题主要集中在数据结构和pandas/numpy
:..........
m******r
发帖数: 1033
17
然后有次有个大妈跟我说什么是大数据, 说是excel存不下的数据,都叫大数据。

【在 n******g 的大作中提到】
: 我觉得你很牛了 我周围的ds 都是女大妈 只会excel
: 透露下工资好吗?
: [在 staftermath (彦清风) 的大作中提到:]
: :个人背景:
: :面的公司是做hedge fund的很有名的公司。
: :recruiter找的我,就打算面面看看是不是有什么好机会。
: :1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
: :process。这些都比较熟练没什么问题。
: :另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这
: 些……

s*********h
发帖数: 6288
18
工资还在negotiate.
你这是什么Ds…居然用excel…


: 我觉得你很牛了 我周围的ds 都是女大妈 只会excel

: 透露下工资好吗?

: [在 staftermath (彦清风) 的大作中提到:]

: :个人背景:

: :面的公司是做hedge fund的很有名的公司。

: :recruiter找的我,就打算面面看看是不是有什么好机会。

: :1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string

: :process。这些都比较熟练没什么问题。

: :另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这

: 些……



【在 n******g 的大作中提到】
: 我觉得你很牛了 我周围的ds 都是女大妈 只会excel
: 透露下工资好吗?
: [在 staftermath (彦清风) 的大作中提到:]
: :个人背景:
: :面的公司是做hedge fund的很有名的公司。
: :recruiter找的我,就打算面面看看是不是有什么好机会。
: :1. 一轮OA, hackerrank的测试题,包括简单的python数据结构题,IO和string
: :process。这些都比较熟练没什么问题。
: :另外有一些unix cmd.现场搜搜就能找到…… 不是十分确定为什么要问这
: 些……

s*********h
发帖数: 6288
19
话糙理不糙哈哈哈。我觉得内存放不下的就是大数据。


: 然后有次有个大妈跟我说什么是大数据, 说是excel存不下的数据,都叫大数据。



【在 m******r 的大作中提到】
: 然后有次有个大妈跟我说什么是大数据, 说是excel存不下的数据,都叫大数据。
A****n
发帖数: 241
20
恭喜恭喜!
-----------------------------------
长期Amazon 内推,各种职位各个地区都可以,请发简历和自己没有申请过的job ID,
详情见
http://everydayds.com/2017/11/18/%e9%95%bf%e6%9c%9famazon-%e5%86%85%e6%8e%a8/
亚马逊的职位都可以通过内推系统内推,如果自己已经申请过,请不要发给我内推,因
为内推系统无法提交。
---------------------------------------------------------
Data Analyst 工作日常SQL R code 博客分享,工科转行到IT工作经历。
http://everydayds.com/
S*******h
发帖数: 7021
21
X********u
发帖数: 1
22
厉害厉害,恭喜恭喜
1 (共1页)
进入DataSciences版参与讨论
相关主题
请问为什么有的data analyst的工作要求会用excel呢?有没有人一起组队做kaggle?
numpy有polyfit, 有没有直接的函数返回polyfit的误差 (转载)装不了scipy 包,提示没装MKL
data science 的coding skill requirement 跟码工比如何?fresh PhD 求职求内推,非常感谢!
j2ee的人现在都转行搞big data,ml了?data analysis part time job
版上有推荐的data scientist的面经吗?data science如何进阶呢?
Hackerrank的測試请教Data incubator的challenge
python用起来没有matlab好使,尤其是数据处理请推荐data science 在线学习的program
讲个找数据科学工作的捷径 aka 刷Kaggle题迅速入门data scient (转载)分享两个data scientist职位的面经
相关话题的讨论汇总
话题: ds话题: 数据结构话题: min话题: data话题: br