d********w 发帖数: 363 | 1 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10
到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
如何把相似的用户聚合,聚类算法? | y***t 发帖数: 644 | 2 多谢,
第4题是考什么? 是不是相等? 都是0.9? | d********w 发帖数: 363 | 3 是相等,但肯定不是0.9了
【在 y***t 的大作中提到】 : 多谢, : 第4题是考什么? 是不是相等? 都是0.9?
| z*****n 发帖数: 447 | 4 第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫
星中转,再返回地面基站么?卫星也可以有计算能力么 | t********e 发帖数: 143 | 5
10/11
【在 y***t 的大作中提到】 : 多谢, : 第4题是考什么? 是不是相等? 都是0.9?
| d********w 发帖数: 363 | 6 卫星和基站都是有计算能力的,可以想象成卫星是内存,基站是磁盘,就是希望最少的
io次数做一些海量数据的统计。
比如算平均值,可以每个基站算个sum跟个数,传给卫星,就知道总共的平均值了
【在 z*****n 的大作中提到】 : 第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫 : 星中转,再返回地面基站么?卫星也可以有计算能力么
| q****x 发帖数: 7404 | 7 面霸呀。
,估
,
10
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10 : 到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| g**********y 发帖数: 14569 | 8 dongfei你是职业面试家还是怎么回事? :-)
我怎么看你各种公司,各种稀奇古怪的问题都被问到了。
,估
,
10
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10 : 到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| d******y 发帖数: 244 | | d*****y 发帖数: 205 | 10
,估
,
10
1 coffee in orange vs 0.9 orange in coffee
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10 : 到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| | | d********w 发帖数: 363 | 11 其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁
必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x
【在 d******y 的大作中提到】 : 第四题是1/11
| d********w 发帖数: 363 | 12 这话说得。
我很累的,好不好,光三藩机场就跑了四趟
面试是在透支我的体力的
【在 g**********y 的大作中提到】 : dongfei你是职业面试家还是怎么回事? :-) : 我怎么看你各种公司,各种稀奇古怪的问题都被问到了。 : : ,估 : , : 10
| d*****y 发帖数: 205 | 13 从体积为11的杯子(10+1)里倒1/10的东西回到9那里,
总和不是10了,是 10.1(9+11/10),
所以相等是不对的。
【在 d********w 的大作中提到】 : 其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁 : 必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x
| d********w 发帖数: 363 | 14 呵呵,我表达错了,应该是最后两个杯子还是一样的体积
【在 d*****y 的大作中提到】 : 从体积为11的杯子(10+1)里倒1/10的东西回到9那里, : 总和不是10了,是 10.1(9+11/10), : 所以相等是不对的。
| H*****1 发帖数: 4815 | 15 0.090909
1/11
【在 d********w 的大作中提到】 : 是相等,但肯定不是0.9了
| y***t 发帖数: 644 | | s******n 发帖数: 3946 | 17 第4题1:1啊,假设密度一样
最后杯1:Orange=100/11 coffee=10/11,杯2:Orange=10/11 coffee=100/11 | j********x 发帖数: 2330 | | f**********2 发帖数: 2401 | | d********w 发帖数: 363 | 20 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
如何把相似的用户聚合,聚类算法? | | | y***t 发帖数: 644 | 21 多谢,
第4题是考什么? 是不是相等? 都是0.9? | d********w 发帖数: 363 | 22 是相等,但肯定不是0.9了
【在 y***t 的大作中提到】 : 多谢, : 第4题是考什么? 是不是相等? 都是0.9?
| z*****n 发帖数: 447 | 23 第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫
星中转,再返回地面基站么?卫星也可以有计算能力么 | t********e 发帖数: 143 | 24
10/11
【在 y***t 的大作中提到】 : 多谢, : 第4题是考什么? 是不是相等? 都是0.9?
| d********w 发帖数: 363 | 25 卫星和基站都是有计算能力的,可以想象成卫星是内存,基站是磁盘,就是希望最少的
io次数做一些海量数据的统计。
比如算平均值,可以每个基站算个sum跟个数,传给卫星,就知道总共的平均值了
【在 z*****n 的大作中提到】 : 第三题没看懂,基站之间不能通信,如何计算平均值?要各个基站算了之后,返回给卫 : 星中转,再返回地面基站么?卫星也可以有计算能力么
| q****x 发帖数: 7404 | 26 面霸呀。
,估
,
10
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| g**********y 发帖数: 14569 | 27 dongfei你是职业面试家还是怎么回事? :-)
我怎么看你各种公司,各种稀奇古怪的问题都被问到了。
,估
,
10
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| d******y 发帖数: 244 | | d*****y 发帖数: 205 | 29
,估
,
10
1 coffee in orange vs 0.9 orange in coffee
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| d********w 发帖数: 363 | 30 其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁
必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x
【在 d******y 的大作中提到】 : 第四题是1/11
| | | d********w 发帖数: 363 | 31 这话说得。
我很累的,好不好,光三藩机场就跑了四趟
面试是在透支我的体力的
【在 g**********y 的大作中提到】 : dongfei你是职业面试家还是怎么回事? :-) : 我怎么看你各种公司,各种稀奇古怪的问题都被问到了。 : : ,估 : , : 10
| d*****y 发帖数: 205 | 32 从体积为11的杯子(10+1)里倒1/10的东西回到9那里,
总和不是10了,是 10.1(9+11/10),
所以相等是不对的。
【在 d********w 的大作中提到】 : 其实不用具体算的,可以利用对称性,比如假设有x的橙汁在咖啡中,那么剩下的橙汁 : 必然是10-x,而总得体积是不变的10,所以在橙汁中的咖啡也一定是x
| d********w 发帖数: 363 | 33 呵呵,我表达错了,应该是最后两个杯子还是一样的体积
【在 d*****y 的大作中提到】 : 从体积为11的杯子(10+1)里倒1/10的东西回到9那里, : 总和不是10了,是 10.1(9+11/10), : 所以相等是不对的。
| H*****1 发帖数: 4815 | 34 0.090909
1/11
【在 d********w 的大作中提到】 : 是相等,但肯定不是0.9了
| y***t 发帖数: 644 | | s******n 发帖数: 3946 | 36 第4题1:1啊,假设密度一样
最后杯1:Orange=100/11 coffee=10/11,杯2:Orange=10/11 coffee=100/11 | j********x 发帖数: 2330 | | f**********2 发帖数: 2401 | | g*****e 发帖数: 282 | 39 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
--典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
优化,减少read fault
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
--对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
int,所以一般的机器内存也够了。
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
--卫星理解成mem,基站为harddrive,分块load data。归结到多个sort array找
median,经典写起来麻烦题~
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙
汁,最后它们体积仍然是10,问橙汁中的咖啡跟咖啡中的橙汁数量关系
--大家已经讨论了
5. 判断有向图中是否有环
--看书就可以了
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
--这个是machine learning啊,不断调各个vector的权重。具体计算可以是edit
distance。我想非ML方向的扯不了太深的。。。
大家再讨论讨论?
,估
,
橙汁,最后它们体积仍然是10,问橙汁
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| l*****a 发帖数: 559 | 40
,估
需要用到parallel quick sorthttp://www.uio.no/studier/emner/matnat/ifi/INF3380/v10/undervisningsmateriale/inf3380-week12.pdf。
一百台机子,10T * 100 = 1PB.
第一步,本地排序。用external sort。
第二步,partition/merge between machines。一共需要传log100次。
所有步骤都是disk io bound。
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| | | g*****e 发帖数: 282 | 41 dongfeiwww你好,
想请教一道具体的题目,是否方便。第一题。这样的题目以你的经历,需要写成map
reduce pseudo code,还是典型的merge sort/external sort即可?多谢
,估
,
橙汁,最后它们体积仍然是10,问橙汁
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| g*****e 发帖数: 282 | 42 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
--典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
优化,减少read fault
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
--对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
int,所以一般的机器内存也够了。
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
--卫星理解成mem,基站为harddrive,分块load data。归结到多个sort array找
median,经典写起来麻烦题~
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙
汁,最后它们体积仍然是10,问橙汁中的咖啡跟咖啡中的橙汁数量关系
--大家已经讨论了
5. 判断有向图中是否有环
--看书就可以了
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
--这个是machine learning啊,不断调各个vector的权重。具体计算可以是edit
distance。我想非ML方向的扯不了太深的。。。
大家再讨论讨论?
,估
,
橙汁,最后它们体积仍然是10,问橙汁
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| l*****a 发帖数: 559 | 43
,估
需要用到parallel quick sorthttp://www.uio.no/studier/emner/matnat/ifi/INF3380/v10/undervisningsmateriale/inf3380-week12.pdf。
一百台机子,10T * 100 = 1PB.
第一步,本地排序。用external sort。
第二步,partition/merge between machines。一共需要传log100次。
所有步骤都是disk io bound。
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| g*****e 发帖数: 282 | 44 dongfeiwww你好,
想请教一道具体的题目,是否方便。第一题。这样的题目以你的经历,需要写成map
reduce pseudo code,还是典型的merge sort/external sort即可?多谢
,估
,
橙汁,最后它们体积仍然是10,问橙汁
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| c****m 发帖数: 179 | 45 你这第六题的回答还真挺非ML方向的。。。
,估
,
32bit
【在 g*****e 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : --典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的 : 优化,减少read fault : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : --对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit : int,所以一般的机器内存也够了。 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
| b*******s 发帖数: 5216 | 46 相由心生,别人一看就不好意思问简单的 :)
【在 g**********y 的大作中提到】 : dongfei你是职业面试家还是怎么回事? :-) : 我怎么看你各种公司,各种稀奇古怪的问题都被问到了。 : : ,估 : , : 10
| m********a 发帖数: 128 | 47 lz有答案吗?
,估
,
橙汁,最后它们体积仍然是10,问橙汁
【在 d********w 的大作中提到】 : 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估 : 算时间 : 2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude, : latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限 : 3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不 : 能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟 : 基站一样 : 4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁 : 中的咖啡跟咖啡中的橙汁数量关系 : 5. 判断有向图中是否有环
| j**********g 发帖数: 204 | 48 楼主面的啥职位,是和big data有关的吗? |
|