c***z 发帖数: 6348 | 1 【 以下文字转载自 Statistics 讨论区 】
发信人: chaoz (面朝大海,吃碗凉皮), 信区: Statistics
标 题: 杂七杂八的一些面经
发信站: BBS 未名空间站 (Sat Sep 28 23:06:01 2013, 美东)
因为我这个人面试得有点乱七八糟,从stat到SDE到PM到DS都有,就一路想到哪里贴到
哪里了,抱歉抱歉。
有意义的题不多,基本上都是设计题性质,给一个case让我做,多半还是open case。
先贴题目,反正答案我自己忘记的差不多了。
Q0:讲讲你最得意的一个project。
Q1:有一组数据,很长,有ID,经纬度,时间4个变量。怎么找出两人是否有一面之缘
。怎么找出所有relationship(定义是在100米范围内一起度过1小时以上)。
Q2:有一组以往marketing campaign的数据,包括使用的关键词集合,目录集合,还有
成功率。怎么决定下次campaign使用哪些关键词。
Q3:怎么找出竞争对手购买了哪些搜索关键词。
Q4:怎么判断两个TB级别的文本是否雷同,是否近似。
Q5:怎么用C实现SQL的join功能。只是思路(hash),没让code。
Q6:三个按钮对应隔壁房间的三盏灯,只能到隔壁房间一次,怎么判断哪个对应哪个。
Q7:怎么用两个正方体(共12面)显示一个月的所有日期。
Q8:怎么最快的在一个大文本里面搜索字符串。
Q9:为什么有时候K means算法不能converge?
Q10:沙滩上有两个一模一样的冰激凌店,由两兄弟经营。为了竞争顾客,他们会把店
开到哪里?
Q11:纽约有多少出租车?他们年收入大概多少?
Q12:某公司在各种marketing channel投入资金,请问怎么计算投资回报?怎么决定最
佳投资方案?
Q13:(唯一的一个code题)计算斐波那契数列。
Q14:怎么设计recommending system,怎么解决cold start 问题。
Q15:假设你既卖toyota又卖lexus,请问应该如何定价?
Q16:怎么解决marketing data里面selection bias问题(从impression到click到
purchase,每次都只有少数人进入下一步)。
Q17:使用decision tree的时候,假设y应该随着x递增,但是cart算法得出的结果有
spike,即某处出现y随着x递减的现象。怎么解决?
Q18:怎么判断sample是否符合预设的population 分布。
Q19:假设盒子里有1000条鞋带,每次拿出两个头系起来,如果形成一个loop就拿出来
,否则放回去。请问预期最后有几个环。
Q20:有一个人口调查问题是家里有几口人,显然最后的结果会有重复,因为4口之家每
个人都会说4。怎么解决?
想起来再加。 | x*****0 发帖数: 452 | | n****o 发帖数: 239 | 3 大牛讲讲思路吧呵呵...
【在 c***z 的大作中提到】 : 【 以下文字转载自 Statistics 讨论区 】 : 发信人: chaoz (面朝大海,吃碗凉皮), 信区: Statistics : 标 题: 杂七杂八的一些面经 : 发信站: BBS 未名空间站 (Sat Sep 28 23:06:01 2013, 美东) : 因为我这个人面试得有点乱七八糟,从stat到SDE到PM到DS都有,就一路想到哪里贴到 : 哪里了,抱歉抱歉。 : 有意义的题不多,基本上都是设计题性质,给一个case让我做,多半还是open case。 : 先贴题目,反正答案我自己忘记的差不多了。 : Q0:讲讲你最得意的一个project。 : Q1:有一组数据,很长,有ID,经纬度,时间4个变量。怎么找出两人是否有一面之缘
| B********4 发帖数: 7156 | 4 chaoz你这些问题我大部分不会。请问何时公布答案?
你去年底说忙着搬家,没空。现在该搬完了吧? |
|