c****m 发帖数: 179 | 1 拖了好几天,HR突然说很close,但是我有一题的答案不是面试官要的,也不告诉我哪
道题。就悲剧了。
面试预计45分钟,只用了不到半个小时,虽然面试官迟到了时间也还够用的。
问的题目是怎么generate lottery 的号码,uniform sampling。 我说用shuffle
我觉得他对我的回答都表达了ok,great的肯定意思。不是很明白为什么说我答的不对
。而且也是讨论式答题,要是有什么要求,能当时提出来,肯定就纠正了。郁闷。 |
z*********8 发帖数: 2070 | 2 题目意思不是很清楚
为什么要shuffle?是要保证一定有人中奖吗? |
B*****g 发帖数: 34098 | 3 就是拿出6个数要保持同样概率?
【在 z*********8 的大作中提到】 : 题目意思不是很清楚 : 为什么要shuffle?是要保证一定有人中奖吗?
|
c****m 发帖数: 179 | 4 对的。然后由此拓展了一下,但是都是uniformly sample
【在 B*****g 的大作中提到】 : 就是拿出6个数要保持同样概率?
|
t*********h 发帖数: 941 | 5 能不能展开说说? 每个位置的数字sample一下不行?
【在 c****m 的大作中提到】 : 拖了好几天,HR突然说很close,但是我有一题的答案不是面试官要的,也不告诉我哪 : 道题。就悲剧了。 : 面试预计45分钟,只用了不到半个小时,虽然面试官迟到了时间也还够用的。 : 问的题目是怎么generate lottery 的号码,uniform sampling。 我说用shuffle : 我觉得他对我的回答都表达了ok,great的肯定意思。不是很明白为什么说我答的不对 : 。而且也是讨论式答题,要是有什么要求,能当时提出来,肯定就纠正了。郁闷。
|
g***j 发帖数: 1275 | 6 恩,展开烁烁
【在 t*********h 的大作中提到】 : 能不能展开说说? 每个位置的数字sample一下不行?
|
c****m 发帖数: 179 | 7 我就是这么说的。
either每个位置直接无放回sampling
or直接shuff所有数,然后取前k个。
【在 t*********h 的大作中提到】 : 能不能展开说说? 每个位置的数字sample一下不行?
|
c****m 发帖数: 179 | 8 扩展是说有没有办法调整N和k就是N中选k,在保证公平的条件下,让每个人得奖的难度
加大? 有没有可能让每个人获奖的概率不会太低。
反正被据的无厘头,我就全说了。 |
c****m 发帖数: 179 | 9 其他的问题,就是对着简历扯扯淡(十分钟),data structure 101之类的。 |
c****m 发帖数: 179 | 10 给的feedback是有关于fair probability的问题答案不是他想要的。。。有问题早说啊
。。。一路yes,有意思吗。。。白人面试官还是太伪善了,不漏声色,还不如遇到一
个smart的geek直接chanllege我,哪怕说的难听点,至少也给了机会去搞正确答案啊。 |
|
|
l*n 发帖数: 529 | 11 你这么做应该是对的,反正java的shuffling就是knuth shuffle。也许他想要的是你提
到knuth的大名?
【在 c****m 的大作中提到】 : 我就是这么说的。 : either每个位置直接无放回sampling : or直接shuff所有数,然后取前k个。
|
l*n 发帖数: 529 | 12 这个是通过增减N或者k来调整二项式系数的占比?
【在 c****m 的大作中提到】 : 扩展是说有没有办法调整N和k就是N中选k,在保证公平的条件下,让每个人得奖的难度 : 加大? 有没有可能让每个人获奖的概率不会太低。 : 反正被据的无厘头,我就全说了。
|
l*n 发帖数: 529 | 13 那啥,你有没签署nda,没有能不能说的问题。
【在 c****m 的大作中提到】 : 扩展是说有没有办法调整N和k就是N中选k,在保证公平的条件下,让每个人得奖的难度 : 加大? 有没有可能让每个人获奖的概率不会太低。 : 反正被据的无厘头,我就全说了。
|
c****m 发帖数: 179 | 14 给的feedback是有关于fair probability的问题答案不是他想要的。。。有问题早说啊
。。。一路yes,有意思吗。。。白人面试官还是太伪善了,不漏声色,还不如遇到一
个smart的geek直接chanllege我,哪怕说的难听点,至少也给了机会去搞正确答案啊。 |
l*n 发帖数: 529 | 15 风怒了?
【在 c****m 的大作中提到】 : 给的feedback是有关于fair probability的问题答案不是他想要的。。。有问题早说啊 : 。。。一路yes,有意思吗。。。白人面试官还是太伪善了,不漏声色,还不如遇到一 : 个smart的geek直接chanllege我,哪怕说的难听点,至少也给了机会去搞正确答案啊。
|
c****m 发帖数: 179 | 16 给的feedback是有关于fair probability的问题答案不是他想要的。。。有问题早说啊
。。。一路yes,有意思吗。。。白人面试官还是太伪善了,不漏声色,还不如遇到一
个smart的geek直接chanllege我,哪怕说的难听点,至少也给了机会去搞正确答案啊。 |
c****m 发帖数: 179 | 17 我给他描述了knuth shuffle算法啊,他不要求我coding那个,然后他说挺好的。
【在 l*n 的大作中提到】 : 你这么做应该是对的,反正java的shuffling就是knuth shuffle。也许他想要的是你提 : 到knuth的大名?
|
t*********h 发帖数: 941 | 18 shuffle和random sample还是不一样的 我感觉shuffle的话是给出一个random
permutation 这个lottery号码有什么限制没有
【在 c****m 的大作中提到】 : 我就是这么说的。 : either每个位置直接无放回sampling : or直接shuff所有数,然后取前k个。
|
m****9 发帖数: 492 | 19 只有我觉得shuffling和不放回sample给出的数目不是uniformly sampled?难道不是应
该放回
的sampling嘛?
扩展的问题没太明白,假设人数固定,每个的选择都是random的,每个数字都有等量的
人选择,每个人被选中的概率是K/N,要调整就是改变K/N的值? |
d***n 发帖数: 832 | |
|
|
c****m 发帖数: 179 | 21 好吧,我和LD重新过了一遍知道为什么了。他其实是想要销量和C(n,k)之间的明确关
系,所以他说yes什么的也没错,因为答的其实也对,只是没有明确的计算没人中奖的
概率。虽然我说了如何预测销量,但是它和c(n,k)的系数并没有显式计算出来。他要
是问一句就好了,当场算也是ok的。
其它的方面觉得答得还ok,我觉得默认大家都会randomize一下seed吧。 |
m****9 发帖数: 492 | 22 原来还有要增加彩票销量这么一说啊。lz您对问题的表述让我疑惑啊,还是看不明白,
但是感觉你很牛,Good luck!
【在 c****m 的大作中提到】 : 好吧,我和LD重新过了一遍知道为什么了。他其实是想要销量和C(n,k)之间的明确关 : 系,所以他说yes什么的也没错,因为答的其实也对,只是没有明确的计算没人中奖的 : 概率。虽然我说了如何预测销量,但是它和c(n,k)的系数并没有显式计算出来。他要 : 是问一句就好了,当场算也是ok的。 : 其它的方面觉得答得还ok,我觉得默认大家都会randomize一下seed吧。
|
c****m 发帖数: 179 | 23 不是增加销量,是怎么样保证中奖的概率不高也不低。我当时说了答案,只是有的点没
点透。郁闷 |
l*n 发帖数: 529 | 24 你答案是啥?
【在 c****m 的大作中提到】 : 不是增加销量,是怎么样保证中奖的概率不高也不低。我当时说了答案,只是有的点没 : 点透。郁闷
|
c****m 发帖数: 179 | |
n****r 发帖数: 120 | 26 没理解错的话,生成彩票代码,需要涉及号码空间N和中奖号码的个数K,中奖概率应该
为 P(中奖) = K/N。对一个已经从N中选定K的方案来说,销量并不影响每个人的中奖概
率;可是,如果N,K根据销量进行调整,那么销量就和中奖概率发生的依赖关系,比如
增大中奖机会,一种易想到的方法是把销量n代替N,使得中奖号码是从已销售的n个彩
票号码中随机选取;增大K当然也是一种增加中奖概率的方案。
不太理解楼主的C(N, K)的定义 |
c****m 发帖数: 179 | 27 决定攒个rp,电面和昂斯特面经(只包括还记得细节的),希望对machine learning方
向的人有帮助,虽然我个人觉得这种东西靠面经突击不好,不过也在班上看过别人的面
经,还是友好互助一把。
1 machine learning 101 + linear regression 推导, AUC
2 merge sort coding
3 NLP 101 + parsing the query with known name entity (coding)
4 large scale clustering + feature selection
5 Skip list coding + optimize 算法(真心没见过,一个S大的phd一起推了半天才搞
定,挺high的)
6 一个摸球的conditional probability问题。
7 彩票这个问题是要在手机端设计一个fair的彩票系统,可以允许同一个号码被重复购
买,但是不能有k个数字里面不能有重复。 我觉得自己答的没问题,(感觉目前的回
复也没指出问题。。)自己总结了一下有两点可能当时没有明确指出来,应该在每一台
手机上initialize uniform sampler,(我默认了这个,虽然interview时候讨论了一下
advanced topic in random generator)。 第二点就是那个扩展问题,问题是要让彩
票不能太难中也不能太容易中,我没有直接计算没人中的概率,很straightforward,
来显式的link 销量和C(N,K)的关系。 N就是号码总数,k是每个彩票的号码数。
top companies基本都onsite过一轮,觉得不同家的要求真心不一样,即便是data相关
职位。再就是现在bar也高了,我之前受了一些帖子的影响,onsite时习惯故作苦想状
跟interviewer扯一会儿corner case和讲讲思路的蛋,直接把时间浪费了,其实速度才
是王道。 当然我觉得这个事情也是要看运气,看看之前的帖子,有的人面G家喜欢沉思
一会儿再写,有的人贴的official的要求是速度快,都一样拿到了G的offer。即便是著
名的要求bug-free的公司,有的interviewer觉得我偶尔有bug但是optimize算法很快就
给了strong feedback,而有的interviewer就没容忍我走个神。有的家写出来bug-free
的code,才发现他们根本不care这个细节,更注重logic的正确性。
也见过很多人的面试经历,我觉得面试有很多运气成分以及对背景的偏好,这些也是我
们无法左右的。个人体会,却是自己准备的不充分,首先没有面面俱到,经常是准备了
这个,挂在其他方面,这说明自己确实不扎实。再就是最近刷题才体会到以前只看书或
者在eclipse上写,不用OJ非常不好,刷题确实让自己真正感觉到加深了理解,同时训
练了基本功。
运气不在自己这边,才让我发现了自己的基本功不扎实,辜负了很多好友的帮助,呵呵
,自己笨就得多努力,去不了top 公司,希望能做一个有口饭吃的技能合格的码农,能
写点有贡献的代码。 |
m****i 发帖数: 650 | |