由买买提看人间百态

topics

全部话题 - 话题: urls
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
u**********7
发帖数: 129
1
来自主题: WebRadio版 - 【蓝火海报征稿】几个简单海报
呵呵。。。我弄了个简单的图文教程~
先打开一张图片,看右边~
第一步:点那个指向右上角的图标就是Share this Photo
第二步:出来这个图,然后点BBCode
第三步:旁边尺寸的地方,点向下箭头,可以选择你要的尺寸
第四步:选好尺寸就产生一条code
复制这段code:
[url=https://flic.kr/p/nFqkBW][img]https://farm4.staticflickr.com/3894/
14229584160_fae64dfe6c_c.jpg[/img][/url][url=https://flic.kr/p/nFqkBW]1b[/
url] by [url=https://www.flickr.com/people//]qxqx0617[/url], on Flickr
选中间这段:
https://farm4.staticflickr.com/3894/14229584160_fae64dfe6c_c.jpg
最后去掉s就可以拉~
s*******3
发帖数: 26
S**C
发帖数: 2964
3
李旭现在有求于人,未免存了患得患失之意,越是细想,心情越乱。一年来发生的
诸多事情接踵在眼前浮现,却没一件能理清楚。在屋子中烦躁地兜了半个圈子,信手挥
去,耳畔却传来一声“仙嗡”脆响,低头再看,发现自己的手又拂到了那具古琴上。
[url][/url]
关于琴艺,李旭只是为了应付考试粗略学过几个谱子。当年在易县求学时,他家中
没有余钱置办这高雅之物,而县学里的琴归刘夫子掌管。在刘夫子眼里,像李旭这种既
不识时务,背后又没人撑腰的,早晚都是个回家种地的货,除了授艺时间不得不让他“
玷污”高雅外,平素想摸一摸琴弦都是万无可能。
[url][/url]
想起当年求学时的情景,李旭淡淡叹了一口气。当年事情烦恼也罢,快乐也好,都
已经成为了一个隽永的回忆。市侩的刘夫子,博学的杨夫子,还有一群志向远大胸无沟
壑的快乐少年,曾经是那样近,回忆起来又是那样远。
[url][/url]
不知不觉中,他信手调正的琴弦,双手轻轻地在弦上拨动起来。蔡邕的《秋思》是
有心功名的学子必修之曲,模模糊糊地,李旭感觉自己还记得谱子的大概。一时想不起
来的,就随意弹去,虽然曲不对谱,一颗烦乱的心却随着琴声慢慢停止了躁动。
h***7
发帖数: 1
4
来自主题: Reader版 - 数千本原版历史军事图书下载
数千本原版历史军事图书下载
空愁居图纸相册的详细目录,下载方法,留言反馈,评论,最近更新记录:(不断更新
中)
[url]http://blog.sina.com.cn/u/1080201461[/url]
空愁居网易镜像:
[url]http://www.blog.163.com/-DDlO.html[/url]
空愁居聚义堂论坛:
[url]http://bulo.163.com/group/-0-H0.html[/url]
预览图:
《中国内战军队1911-49》(47)
MAA306 - Chinese.Civil.War.Armies.1911-49
[img]http://blog.sina.com.cn/pic/406290f502000120[/img]
[img]http://blog.sina.com.cn/pic/406290f5020000w5[/img]
《古代中国军队1500-200 Bc》(51)
《古代中国军队BC-AD589》(52)
《古代中国军队590-1260ad》(52)
《中世纪中国军队1260-1520》(51)
《远东攻城武器AD 612
J********2
发帖数: 354
5
来自主题: TrustInJesus版 - 唐崇荣牧师谈灵恩
http://www.crca.com.cn/show.aspx?id=1422&cid=80
唐崇荣牧师谈灵恩:

一,请定义「灵恩派」。
答:注重某一些灵恩把它绝对化,以这个为号召,来要教会跟他们合一的人就是灵恩派
的人。请你注意,如果整个所有上帝圣灵恩赐都一同并用,那么这些人比较平衡。只注
重医病,赶鬼,说方言这几件事,然后把这些绝对化到一个地步,如果没有医病,没有
赶鬼就是没有能力,如果没有说方言就没有圣灵的洗,把它极端绝对化,然后要教会一
定要走这条路线的,这个就是灵恩派,这个是以偏概全,很危险。

二,强调现象的圣灵灵恩派教会受洗,怎样确定是否受圣灵的洗?
答:圣灵的洗就是真正重生得救的经历。受圣灵的洗就是因圣灵洁净你,从罪人变成圣
徒,这个叫作圣灵的洗。每一次你受圣灵的洗这个字一提的时候,你就马上跟他们观念
中间能够说方言才叫作圣灵的洗并在一起,结果你就在错误观念中间一直不能享受圣经
的正解。洗就是要洁净,大家说,「洗就是要洁净。」没有洗以前是罪人,洗就是圣徒
,受圣灵的洗,就是圣灵重生人,使人洁净从罪人变成圣徒,真正得救,这个叫作圣灵
的洗。这样简单的原理要把它乱到... 阅读全帖
t******n
发帖数: 122
6
来自主题: Fujian版 - 差点中招了!
i always delete such email immediately if they're not blocked.
FYI - a useful tech article:
http://spaces.msn.com/members/zjr72/Blog/cns!1p-SQdO241G9F9Expq006pyg!380.entry
June 18
谈论URL伪装
在文章模糊的URL中,提供了各种URL地址的表示法,其实这就是常见的URL地址伪装的方法。一般而言,一个标准的URL地址格式[RFC1738,RFC1738中文]应该是这样的:
schemes://:@:/
前面的schemes可以包括如下协议:
ftp File Transfer protocol
http Hypertext Transfer Protocol
gopher The Gopher protocol
d******i
发帖数: 7160
7
来自主题: Hardware版 - Ps3MediaSever不能Stream冰电影?
咋回事呢?
GUI的TRACE记录:
INFO 2013-04-02 11:45:28.421 [Request Handler] Starting transcode/remux of
PLAY - No Subs
INFO 2013-04-02 11:45:34.906 [StartPlaying Event] renderer: 192.168.1.116,
file: http://192.96.204.196:8080/d/ich4fibzpqikmrsce4gxkq4opihgy4a3xorw3lcbcomgyevhmwwxpgzk/the.office.us.s09e10.hdtv.x264-2hd.mp4
INFO 2013-04-02 11:45:43.203 [Request Handler] Starting transcode/remux of
PLAY - No Subs
INFO 2013-04-02 11:45:47.203 [StopPlaying Event] renderer: 192.168.1.116,
file: http://192.... 阅读全帖
r***l
发帖数: 67
8
All the url related classes are in java.net package. You can creat a URL
object, open input stream and get data from there.
For image, java.awt.ToolKit provide utility method to ease the process.
Try this:
try {
java.net.URL url = new URL("www.eeee.edu/.../?.jpg");
java.awt.Image image =
java.awt.Toolkit.getDefaultToolkit().getDefaultToolkit().createImage(url);
} catch (MalformedURLException e) {
} catch (IOException e) {
}
There are other utility methods in the ToolKit, which are very u
t*********e
发帖数: 630
9
来自主题: Java版 - 问个 crawler 的问题
想从这个网站上抓些东西,网址:
http://www.allmusic.com/advanced-search
这个 URL 所在的页面,默认没有数据库里的东西。选择左边的 "Release Date", 比
如 2011, 右边就出现所有 2011 年发行的专辑和歌手。想写个小 crawler 把所有的歌
名都爬出来,但是上面的 URL 无法作为起始 URL,因为它不包括那个 release date
filtering 的参数。
我的问题是,如何从 HTML source, 得到一个 URL,它包括选择日期参数后所在起始页
面的完整 URL,这样,小爬虫就可以从这个页面开始。
我想大约应该是:
http://www.allmusic.com/advanced-search?start-date=2011
但这个不对。请熟悉 HTML/Script, 前端开发的帮忙看看,这个起始 URL 应该是什么
? Thanks.
D*V
发帖数: 564
10
来自主题: sysop版 - 正式开放 WWW 服务
本站于 1998年12月1日正式开放 WWW 服务。
URL 是 http://bbs.mit.edu
以前用于测试的 URL http://bbs.mit.edu:1112 废除。
如果仍然连接该 URL,将看到:
THIS URL IS OBSOLETE NOW.
THE NEW FORMAL URL IS:
http://bbs.mit.edu
Please change your bookmark to the new formal URL, Thanks:-)
请注意,1112 端口将于一定时间后完全关闭,届时将不再显示上述信息并返回出错信息。
a**u
发帖数: 3802
11
来自主题: _ChenChuSheng版 - 【视频】楚生高品质mp3下载 (转载)
【 以下文字转载自 CcsAmu 讨论区 】
发信人: ajiu (小九@我素爬墙派), 信区: CcsAmu
标 题: 楚生高品质mp3下载
发信站: BBS 未名空间站 (Fri Aug 10 18:51:27 2007), 转信
这个贴里,处理掉了一些尖叫鼓掌什么的,我听了第一首觉得不错,所以应该整体都还
不错
http://cache.tianya.cn/publicforum/content/funstribe/1/113003.shtml
我整理一下:
酒吧演唱部分:
陈楚生 - 1945 酒吧演唱.mp3 (3.67MB)
[URL]http://www.91files.com/?HUQ93JUTXLC3L93CXHUJ[/URL]
陈楚生 - 不必勉强 酒吧演唱.mp3 (5.09MB)
[URL]http://www.91files.com/?DBYXD764FSM9Y5PSP7Q6[/URL]
陈楚生 - 姑娘 酒吧演唱.mp3 (4.48MB)
[URL]http://www.91files.com/?8XIBCB8X5Z8IOWAP5HAQ[/URL]
陈楚生
s******y
发帖数: 740
w*******y
发帖数: 60932
13
I think this deal deserves a second chance.
My Perfect Kitchen Gourmet Nonstick Roaster with V-Rack is sold at $19.99.
Use coupon $5 off $15 to make it $14.99 (or the 20% off coupon to make it $
15.99), depends on how much tax is in your state, then after $9.99 mail in
rebate, it'll make it $6+. I got two yesterday after I saw the original
post. So feel free to rep the original poster (see below link).
Roaster:
[URL="http://www.bedbatha ndbeyond.com/product.asp? SKU=14250069 "/URL]
Rebate... 阅读全帖
w*******y
发帖数: 60932
14
Amazon.com has Big Bang Theory Seasons 1-3:
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias=aps&field-keywords=big bang&x=0&y=0#/ref=nb_sb_noss?url=search-alias=aps&field-keywords=big bang&rh=i:aps,k:big bang
#/ref=nb_sb_noss?url=search-alias%3Daps&field-keywords=big+bang&rh=i%3Aaps%
2Ck%3Abig+bang" rel="nofollow" target="_blank" onclick="_gaq.push(['_
trackEvent', 'thread', 'click', '2417520 - big-bang-theory-season-13-1299-
each-fs-w-prime-amazon']);">Big Bang Theory Seasons 1-3 [Big B... 阅读全帖
w*******y
发帖数: 60932
w*******y
发帖数: 60932
16
COOLER MASTER GX 450W RS450-ACAAD3-US 450W ATX12V v2.31 80 PLUS BRONZE
Certified Active PFC Power Supply
$24.99 after code/MIR
$44.99 After EMCNJHF37 $10.00 code - $20 MIR +$24.99
First post, didn't see it posted, good reviews on NE, seemed worth posting.
Link:
http://[URL="http://www.newegg.com/Product/Product.aspx?It
#91;URL="http://www.newegg.com/Product/Product.aspx?Item=N82E16817171060&nm_mc=EMC-IGNEFL012412&cm_mmc=EMC-IGNEFL012412-_-EMC-012412-Index-_-PowerSupplies-_-17171060-L04C" rel="no... 阅读全帖
s******o
发帖数: 935
17
来自主题: _Amguulan版 - 楚穆音频下载大全
☆─────────────────────────────────────☆
ajiu (小九@我素爬墙派) 于 (Fri Aug 10 18:51:27 2007) 提到:
这个贴里,处理掉了一些尖叫鼓掌什么的,我听了第一首觉得不错,所以应该整体都还
不错
http://cache.tianya.cn/publicforum/content/funstribe/1/113003.shtml
我整理一下:
酒吧演唱部分:
陈楚生 - 1945 酒吧演唱.mp3 (3.67MB)
[URL]http://www.91files.com/?HUQ93JUTXLC3L93CXHUJ[/URL]
陈楚生 - 不必勉强 酒吧演唱.mp3 (5.09MB)
[URL]http://www.91files.com/?DBYXD764FSM9Y5PSP7Q6[/URL]
陈楚生 - 姑娘 酒吧演唱.mp3 (4.48MB)
[URL]http://www.91files.com/?8XIBCB8X5Z8IOWAP5HAQ[/URL]
陈楚生 - 索菲娅 酒吧演唱.mp3 (4.24MB)
l*y
发帖数: 21010
18
[/img][/url][url=https://flic.kr/p/s4PBfH]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0323[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
19
[/img][/url][url=https://flic.kr/p/stzsZz]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0315[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
20
[/img][/url][url=https://flic.kr/p/sts3eW]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0312[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
21
[/img][/url][url=https://flic.kr/p/sDWUpH]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0309[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
22
[/img][/url][url=https://flic.kr/p/sdMdAD]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0302[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
23
[/img][/url][url=https://flic.kr/p/s6Wftb]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0285[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
24
[/img][/url][url=https://flic.kr/p/smSatc]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0278[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
25
[/img][/url][url=https://flic.kr/p/rkSQin]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0267[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
26
[/img][/url][url=https://flic.kr/p/s9mh7j]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0253[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
27
[/img][/url][url=https://flic.kr/p/rDoCUR]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0173[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
28
[/img][/url][url=https://flic.kr/p/rDoChZ]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0172[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
29
[/img][/url][url=https://flic.kr/p/rySJDh]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0162[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
30
[/img][/url][url=https://flic.kr/p/rdUPCX]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0157[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
31
[/img][/url][url=https://flic.kr/p/rdLdNA]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0153[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
32
[/img][/url][url=https://flic.kr/p/r2rJqW]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0122[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
33
[/img][/url][url=https://flic.kr/p/qULkGT]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0114[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
l*y
发帖数: 21010
34
[/img][/url][url=https://flic.kr/p/r1w1iM]Copenhagen Bikehaven by Mellbin - Bike Cycle Bicycle - 2015 - 0077[/url] by [url=https://www.flickr.com/photos/mellbin/]Franz-Michael S. Mellbin[/url], on Flickr
g*****n
发帖数: 591
35
来自主题: Talk版 - 法轮大法怎么办?zt
有两个东北人是我们不能忘记的,一个常年现身春节晚会上为老百姓带来欢乐,可惜今
年大病一场上不了春晚的赵本山,而另一位是蛊惑大众、大吹邪教给人们带来痛苦的李
洪志了,最近他的新闻可是出尽风头。http://www.ddhw.comwww.ddhw.com[/url]有人可能看到过,近期网上疯传自称是李洪志的女儿美歌,写给各位同仁的求助信,信中透露了很多法轮功高层的内幕,父亲处在水深火热之中,叶浩意图架空父亲并随意篡改父亲的新经文,张而平则是不安修炼只为财,把神韵的收入和社会各界的赞助都拿走了,让父亲痛苦不堪、生不如死。有来自大纪元的消息证实了这些传言,《大纪元》2月21日讯,大陆网特造谣法轮功创始人李洪志去世的消息,这些消息只怕不是空穴来风,后来被长期致力于致癌基因的诺贝尔医学奖获得者Harold E. Varmus组织M.D.安德森癌症中心、加州大学旧金山分校医学中心,麻省总医院等著名医疗机构诊断确认,李洪志已患脑瘤(恶性神经胶质)瘤,正在全力救治中,大家不禁会问李大师不是自诩为“宇宙主佛”吗,怎么会得绝症了,大家都知道这可是要命的疾病啊。http://www.ddhw.comwww.... 阅读全帖
w********r
发帖数: 14958
36
来自主题: Automobile版 - 新Fusion这货除了漂亮脸蛋还有啥?
求救:凯美瑞240G烧机油严重怎么办?_凯美瑞论坛_
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&
急!求助!!toyota camry烧机油!问题严重吗? - 『 车行天下』
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&
丰田凯美瑞发动机烧机油正常吗?
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=14
浙江温岭:丰田凯美瑞开5000公里烧掉了2升多机油天天讨论
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=9&
【凯美瑞的口碑】严重烧机油_新浪汽车_新浪网
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=15
t*****e
发帖数: 15794
37
来自主题: Food版 - 如何贴视频和图片 (转载)
【 以下文字转载自 LeisureTime 讨论区 】
发信人: wh (wh), 信区: LeisureTime
标 题: 如何贴视频和图片
发信站: BBS 未名空间站 (Sun May 25 16:13:48 2014, 美东)
一、如何贴视频:
1.youtube视频:
拷贝网页地址,在地址前加v,http后面如有s的去掉s。去掉watch?, 把=改成/。例
如:
https://www.youtube.com/watch?v=r1HBiQ34CNM -->
vhttp://www.youtube.com/v/r1HBiQ34CNM
链接顶格贴,不留空格,就显示为内嵌:
2.虾米、土豆、新浪、优酷等视频:
在视频下方或该网页上找到转贴地址或flash地址(通常以.swf结尾),拷贝地址,前
面加v,顶格贴即可。
(注:虾米目前不对海外用户开放)
友情提醒:贴视频时最好同时把原视频的原始链接贴出来(请去掉http后面的s,便于
直接点击),一来方便telnet用户及手机和平板用户,二来有些视频不能内嵌,必须点
击原始链接观看。
二、如何贴图片:
1.在web下添加附件,附件必... 阅读全帖
h******k
发帖数: 810
38
来自主题: JobHunting版 - 某公司面试经历
PixelClassic说的基本都对。
补充下:
3. 我开始说就是merge sort的变种,
bool isMerge(lista, listb, listm)
{
... ...
if ( lista.get(i) == listm.get(k) ) {
i++; k++;
} else if ( listb.get(j) == listm.get(k) ) {
j++; k++;
} else {
return false
}
结果被面试人教训了一顿。其实他期待的解法是从尾向头merge,一边merge一边删除
lista/listb/listm里面的元素。termination是listm.empty()。code可能漂亮
点,不过真不是唯一解法啊。
4. 要分d<0, 01情况。然后写binary search代码的时候,面试人说这样收敛
不够快,反复打断我。
6. bit.ly url shortening web service 就是:
1. 用户输入url,返回短的bit.ly url。比如:www.google.com,返回bit.ly/G。
2. ... 阅读全帖
g*****k
发帖数: 623
39
来自主题: JobHunting版 - 某公司面试经历
我个人交得好像第3题不对。
请考虑这个例子。
lista: &A &C
listb: &A &D
listm: &A &D &A &C
明显listm是lista 和 listb 的valid merge。
但是你的code将会返回false
其实从后往前作也一样会有这样的问题。
应该用backtracking来解这题。
lista.get(i)==listb.get(j)==listm.get(k),
那么就是返回剩下的子数组匹配的问题。
lista[i+1..]
listb[j..]
listm[k+1..]
当如上子数组不匹配时,我们将检测如下子数组
lista[i..]
listb[j+1..]
listm[k+1..]
就是算法效率不高。
期待高人指点

PixelClassic说的基本都对。
补充下:
3. 我开始说就是merge sort的变种,
if ( lista.get(i) == listm.get(k) ) {
i++; k++;
} else if ( listb.get(j) == listm.get(k) ) {
j++; k++;
} else {
re... 阅读全帖
c**m
发帖数: 535
40
来自主题: JobHunting版 - g电面,新鲜面经
1. Find 1000 popular URLs in a log.
对于这种log里找popular URL的题目,首先肯定是要用hash去保存每一个URL的
frequency。然后对于返回top k:option 1, sort, O(nlogn);option2,用一个
size为k的min_heap,O(nlogk)。
Follow up,如果log存在多个machine里,那么肯定是要merge result了。这个时候每
个machine如果只是存一个size为k的heap显然是不够的了。所以我们可以对于每个
machine:opt 1,sort the URL frequency;opt 2, use a min_heap to store all
URL frequency。这里个人感觉opt 1好一些。
2. Return a query based on the occurrence from a big table。
首先这个很大的table,也就是一个很大file,然后不能完全放入main memory里面,是
吧?那个这个其实跟“从一个大文件里随机取出一行... 阅读全帖
a*****s
发帖数: 1121
41
来自主题: JobHunting版 - 问一道大数据量面试题
只有两台机器,如果不让用cluster的话,每台机器对自己的每个url做hash,得到一个
10TB数据的url 的hash范围[a,b],第二台机器得到另外一个范围[c,d],假设两个集合
的交际是[c,b],然后开始如下通信:
machine 1 收集[a,c]数据并存为结果的一部分;
machine 1把[(b-c)/2,c]的数据以(url,1)的(key,value)对的发给machine2;
machine 1把从machine 2 发来的[c,(b-c)/2]的数据,连同自己disk上属于该区间的数
据,对于相同的url key,把他们的value相加,然后吧所有做完后value是1的数据存储
为结果的一部分。
machine 2做类似machine1的工作,只是数据范围是[(b-c)/2,b],并把所有数据(b,d]的
url直接存为结果。
以上可能没有考虑两个节点的load balancing,可以通过popularity检测来决定两台
machine 工作区间的划分,使其达到balancing。
s***5
发帖数: 2136
42
来自主题: JobHunting版 - G家电面的两个题
1. 假设要纪录最长过去24小时的url长度,最快每秒更新一次,可以把每秒内的url长
度aggregate起来存在一个hashtable里。过去24小时内,最多有24*3600个这样的
hashtable,用linked list连起来,另外用一个hashtable统计这个time window里所有
url长度。每次新的url进来,把linked list里最老的数据去掉,同时更新总的
hashtable。
基于那个总hashtable很容易算出bottom 95%url平均长度。
f******p
发帖数: 173
43
来自主题: JobHunting版 - G家电面的两个题
第一题counting,url长度不会太大,分配一个Bundle[400]的数组,
class Bundle {
int count;
int avgLen;
}
存每个长度的url的个数和均值。然后还有
total_url_count, total_url_avg_length
95%url的平均长度就是: (total_url_count * total_url_avg_length-sum_{i in top
5% url set}{count_i*avgLen_i}) divided by (total_url_count - sum_{i in top
5% url set}{count_i})
第二题不会。。可以退化成二维或者一维的。怎么感觉和closest pair of points的解
法有些类似。

5%
p****o
发帖数: 46
44
来自主题: JobHunting版 - G家电面的两个题
不是很清楚, 这95%指的是url长度排序的95%, 还是出现的所有url的95%?
比方说
url length: occurrence
1: 1
2: 1
3: 1
...
94: 1
95: 2
...
99: 0
100:1
如果按url"长度"排序的95%: (1+2+..94+95+95)/96
而如果按"所有"url排序的95%: (1+2+..94+95)/95
指的是哪一种?

5%
p*******e
发帖数: 186
45
我需要登录一个网站,输入用户名和密码,然后下载登录后的网页内容。请问Java如何
能做到?
我在网上找到下面一段代码,但好像不工作,不知道什么原因。版主请手下留情,这里
高手多。我刚学Java。
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.Authenticator;
import java.net.MalformedURLException;
import java.net.PasswordAuthentication;
import java.net.URL;

public class AuthDemo {
public static void main(String args[]) throws MalformedURLException,
IOException {
String urlString = "";
St... 阅读全帖
D***0
发帖数: 138
46
来自主题: JobHunting版 - salesforce怎么这么难进啊
将近三个月里两次面它家,
第一次折在第一个电话onsite了,一个巨长的名字的老印,coding题不难,看一段代码
,指出哪有问题,第二题是删除linkedlist里的一个node,就用一个指针。然后就是写
sql query,老印说要用having,我说ok,然后就写了一个带having的,然后第二天就
收到拒信,说db太弱。。。这个确实没机会练,也没机会接触。
过了一阵子网投另一组,然后店面,计算一个数组的inverted元素的个数,没见过,直
接给了O(n^2)的,然后问如何改进,实在没想到,就说应该用binary search或者merge
sort的,最低也就是O(nlogn)了,店面过了,然后是一轮code challenge,不难,2个
小时做完发过去。然后onsite,
5轮,每轮一个小时,尼玛,其中一轮还是打电话,
1 像是欧洲人, 一道简单题,不记得了,做完了,面试官说good,然后照相,然后就
是design一个system,说他们现在做这个,好像是个什么连续的incoming字符串流,如
何存储,query,如何得到当前某个metric的lifetime的min... 阅读全帖
f******x
发帖数: 201
47
来自主题: JobHunting版 - 面经加求建议
谢谢楼主!
请问楼主,top url那题怎么做啊?
5. design question, design a system which can rank the url sharings, e.g.
users will share urls, we want to rank the most shared urls for the last 10
minutes, for last hour, for last day, etc. there are total 100 millions url
sharing happen every day.
谢谢!

to
can
better?
o****g
发帖数: 174
48
一些需要登录才能看的信息,web crawl 的时候,如果headers 有了cookies, UA, IP
这些信息是否也能crawl 到?
一些网站如douban.com 它的一些信息是需要登录才能看到,当在python 里用scrapy,
requests 进行web crawling 的时候,如果我们登录了douban, 然后又把登录都得到的
cookies, UA, ip 这些信息放在headers里,是不是就能在python web crawl 的时候在
python 代码里crawl 到需要登录才能看到了信息了?或者要得到哪些信息才能在代码
里得到登录才能看到的html ?
requests:
import requests
url = 'SOME URL'
headers = {
'cookie':'cookies1'
'User-Agent': 'My User Agent 1.0',
'From': '[email protected]' # This is another valid field
}
response = re... 阅读全帖
tj
发帖数: 957
49
来自主题: Living版 - 请教下刷油漆问题
不知道为啥这个网站被俺们公司block了。。
Web Proxy Notification from ................
Blocked by URL Filter Database
Your requested URL has been blocked by the URL Filter database module of x's
web proxy. The URL is listed in categories that are not allowed by policy
at this time.
Rule name: Blocks URLs With Bad Reputation
Ruleset: Category Content Filter - Authenticated
Date: 2012-11-02 08:33:18
Host: homewigo.com
Requested port: 80
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)