b*****o 发帖数: 715 | 1 对于有machine learning或者data science背景的人,面试出什么题好呢?
我大致可以想到几类题,但都不是很满意:
(1)给一个具体的工业界的问题(比如预测广告的点击率,检测SEO网站等),然后要
面试的人end-to-end说出整个流程。可以根据具体情况和面试者的背景,可以详细展开
某些部分。
(2)扯扯对于各种算法的看法,以及他们各自的优劣和使用场合。比如比较SVM,
AdaBoost, k-NN, Logistic regression, Decision tree等等。然后可以有各种展开。
(3)在有限内存的限制下,海量数据如何实现 unique_count(), top(),quantile(),
sample(),join()等功能。
我对于(1)和(2)不满意是比较难控制面试的进程,而且基本不写code以扯蛋为主。
(3)可以写一些code,但它其实不是machine learning,而且我觉得有点偏难。
不知道各位大牛还有什么好的想法吗? | j*****n 发帖数: 1545 | 2 没啥 machine learning 可问的,还是问算法最好。 算法好的人,machine learning
这些东西不会太难, 大部分都是call API, 1个1个试.
可以推1个公式,问1道算法题, knapsack, skytree 之类的, 写1个小code, 40分钟
就够了 | l******n 发帖数: 9344 | 3 关键是这个人将来干啥?写code,建infostructure,project management,sales?这
个不知道,什么问题都没有意义
【在 b*****o 的大作中提到】 : 对于有machine learning或者data science背景的人,面试出什么题好呢? : 我大致可以想到几类题,但都不是很满意: : (1)给一个具体的工业界的问题(比如预测广告的点击率,检测SEO网站等),然后要 : 面试的人end-to-end说出整个流程。可以根据具体情况和面试者的背景,可以详细展开 : 某些部分。 : (2)扯扯对于各种算法的看法,以及他们各自的优劣和使用场合。比如比较SVM, : AdaBoost, k-NN, Logistic regression, Decision tree等等。然后可以有各种展开。 : (3)在有限内存的限制下,海量数据如何实现 unique_count(), top(),quantile(), : sample(),join()等功能。 : 我对于(1)和(2)不满意是比较难控制面试的进程,而且基本不写code以扯蛋为主。
| b*****o 发帖数: 715 | 4 It's always general hiring for software engineer, but the recruiter asked me
to focus on machine learning for my round.
【在 l******n 的大作中提到】 : 关键是这个人将来干啥?写code,建infostructure,project management,sales?这 : 个不知道,什么问题都没有意义
| l*******m 发帖数: 1096 | 5 我一般问些有关统计的coding, 如(3)。
有时问个概率题
【在 b*****o 的大作中提到】 : 对于有machine learning或者data science背景的人,面试出什么题好呢? : 我大致可以想到几类题,但都不是很满意: : (1)给一个具体的工业界的问题(比如预测广告的点击率,检测SEO网站等),然后要 : 面试的人end-to-end说出整个流程。可以根据具体情况和面试者的背景,可以详细展开 : 某些部分。 : (2)扯扯对于各种算法的看法,以及他们各自的优劣和使用场合。比如比较SVM, : AdaBoost, k-NN, Logistic regression, Decision tree等等。然后可以有各种展开。 : (3)在有限内存的限制下,海量数据如何实现 unique_count(), top(),quantile(), : sample(),join()等功能。 : 我对于(1)和(2)不满意是比较难控制面试的进程,而且基本不写code以扯蛋为主。
|
|