由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - tinyurl 是怎么做到同一个long url两次得到相同的short url
相关主题
Perl 问题 (updated)求救:javascript程序运行中的一个error message
IIS7.5 大于 64KB 文件不能下载 ? (转载)问个技术问题: 怎样把其他网站的搜索结果显示在自己的网站上
URL questions贡献一下:本版上搜集的 Google 面试题 (转载)
请教一个语言选择的弱问题问个 C/C++ 的 -=, += 的问题
问一道面试题Interview questions about hash function
Random Switch Between Two Different URLsa website "programing" question
同主题阅读工具一个弱问题,关于打开HTTP文件
cgi测试newbee问题请教:如何用Java get URL content是.swe并且是utf-16 encoding的文件
相关话题的讨论汇总
话题: url话题: tinyurl话题: hash话题: ie话题: varchar
进入Programming版参与讨论
1 (共1页)
r*******y
发帖数: 1081
1
里面是有一个 integer id 到short url 的一个一一对应。 但是 long url到这个
integer id的对应怎么搞,不然怎么做到相同的 long url得到相同的 short url.
thanks.
n*****t
发帖数: 22014
2
Int id 就是这个 long url 在 DB 里的 rec id,short url 就是这个 int 转成
ascii
,我瞎猜的

【在 r*******y 的大作中提到】
: 里面是有一个 integer id 到short url 的一个一一对应。 但是 long url到这个
: integer id的对应怎么搞,不然怎么做到相同的 long url得到相同的 short url.
: thanks.

r*******y
发帖数: 1081
3
你猜测对了。
不过我的问题不是这个,我的问题是比如我在那里为 www.sina.com.cn产生了一个
short
url: www.tinyurl.com/1a2b3c
我让它再生成一次,还是得到同样的 1a2b3c
我的问题是系统怎么知道 www.sina.com.cn已经产生过short url.

【在 n*****t 的大作中提到】
: Int id 就是这个 long url 在 DB 里的 rec id,short url 就是这个 int 转成
: ascii
: ,我瞎猜的

n*****t
发帖数: 22014
4
Insert on duplicate update, get id

【在 r*******y 的大作中提到】
: 你猜测对了。
: 不过我的问题不是这个,我的问题是比如我在那里为 www.sina.com.cn产生了一个
: short
: url: www.tinyurl.com/1a2b3c
: 我让它再生成一次,还是得到同样的 1a2b3c
: 我的问题是系统怎么知道 www.sina.com.cn已经产生过short url.

r*******y
发帖数: 1081
5
如果要自己设计的话,如何detect duplicate ?

【在 n*****t 的大作中提到】
: Insert on duplicate update, get id
r*******y
发帖数: 1081
6
感觉可以用trie 来search long url判定是不是duplicate.

【在 r*******y 的大作中提到】
: 如果要自己设计的话,如何detect duplicate ?
n*****t
发帖数: 22014
7
设置 long url 为 unique

【在 r*******y 的大作中提到】
: 如果要自己设计的话,如何detect duplicate ?
r*******y
发帖数: 1081
8
你这是用database吧,我是想知道如果自己 code from scratch, 不用现成的database
,如何搞?

【在 n*****t 的大作中提到】
: 设置 long url 为 unique
c******3
发帖数: 296
9
简单的话就用哈西表吧,不过可能会暴表。
复杂点的,问老魏,多核加速。或问goodbug,万机分布。

database

【在 r*******y 的大作中提到】
: 你这是用database吧,我是想知道如果自己 code from scratch, 不用现成的database
: ,如何搞?

g*****g
发帖数: 34805
10
A hash of url is generated as key. Use the hashkey you can quickly find out
if the url has been generated.
Note hash can collide, but it's fairly evenly distributed so there won't be
many results under a key.

【在 r*******y 的大作中提到】
: 你猜测对了。
: 不过我的问题不是这个,我的问题是比如我在那里为 www.sina.com.cn产生了一个
: short
: url: www.tinyurl.com/1a2b3c
: 我让它再生成一次,还是得到同样的 1a2b3c
: 我的问题是系统怎么知道 www.sina.com.cn已经产生过short url.

相关主题
Random Switch Between Two Different URLs求救:javascript程序运行中的一个error message
同主题阅读工具问个技术问题: 怎样把其他网站的搜索结果显示在自己的网站上
cgi测试newbee问题贡献一下:本版上搜集的 Google 面试题 (转载)
进入Programming版参与讨论
g*****g
发帖数: 34805
11
这种url hash,在做网站做bookmarkable很常见的。老姜完全没经验乱指点又暴露了。
n*****t
发帖数: 22014
12
网站用 db 存 url 不常见?小姨子你还来劲了啊

【在 g*****g 的大作中提到】
: 这种url hash,在做网站做bookmarkable很常见的。老姜完全没经验乱指点又暴露了。
z****e
发帖数: 54598
13
老姜,那个帖子里把你写成了老将
估计是对八区政治形势不了解阿

【在 n*****t 的大作中提到】
: 网站用 db 存 url 不常见?小姨子你还来劲了啊
g*****g
发帖数: 34805
14
傻逼你又不懂了吧,DB是要存url, 但是url长度可以几千,有的网站可以来一堆url前
面都一样,最后一个参数不一样。
数据库用VARCHAR都存不了,长度不够。用CLOB比慢死你。
所以上个hash, 位数弄长一点,就算你是google search, 也有个几个collide到头了,
然后一比实际url就知道。
你丫整一外行,没经验的东西,就别误导了。

【在 n*****t 的大作中提到】
: 网站用 db 存 url 不常见?小姨子你还来劲了啊
n*****t
发帖数: 22014
15
所以说你丫煞笔啊,如假包换的小姨子
url length limit 不知道,varchar length 不知道,更不知道 db index 怎么做的。
煞笔你少喷几句就不会丢人了,不出来丢人你会死啊?

【在 g*****g 的大作中提到】
: 傻逼你又不懂了吧,DB是要存url, 但是url长度可以几千,有的网站可以来一堆url前
: 面都一样,最后一个参数不一样。
: 数据库用VARCHAR都存不了,长度不够。用CLOB比慢死你。
: 所以上个hash, 位数弄长一点,就算你是google search, 也有个几个collide到头了,
: 然后一比实际url就知道。
: 你丫整一外行,没经验的东西,就别误导了。

g*****g
发帖数: 34805
16
傻逼你不死撑没完是吧?给你看看http spec.
3.2.1 General Syntax
The HTTP protocol does not place any a priori limit on the length of a URI.
Servers MUST be able to handle the URI of any resource they serve, and
SHOULD be able to handle URIs of unbounded length if they provide GET-based
forms that could generate such URIs. A server SHOULD return 414 (Request-URI
Too Long) status if a URI is longer than the server can handle (see section
10.4.15).

【在 n*****t 的大作中提到】
: 所以说你丫煞笔啊,如假包换的小姨子
: url length limit 不知道,varchar length 不知道,更不知道 db index 怎么做的。
: 煞笔你少喷几句就不会丢人了,不出来丢人你会死啊?

n*****t
发帖数: 22014
17
二逼又来了:
Extremely long URLs are usually a mistake. URLs over 2,000 characters will
not work in the most popular web browser. Don't use them if you intend your
site to work for the majority of Internet users.
你悲愤 spec 有屁用,全堆就是全堆

.
based
URI

【在 g*****g 的大作中提到】
: 傻逼你不死撑没完是吧?给你看看http spec.
: 3.2.1 General Syntax
: The HTTP protocol does not place any a priori limit on the length of a URI.
: Servers MUST be able to handle the URI of any resource they serve, and
: SHOULD be able to handle URIs of unbounded length if they provide GET-based
: forms that could generate such URIs. A server SHOULD return 414 (Request-URI
: Too Long) status if a URI is longer than the server can handle (see section
: 10.4.15).

g*****g
发帖数: 34805
18
所以傻逼你啥都只能做太监版的。IE的limit是2000左右没错,可Chrome, FF都是至少
Million级。你没见过不支持IE的网站是吧,这个就是原因之一。
做tinyurl的,巴不得多一点客户,还有那么傻逼弄最低的limit专为IE定制的。你跟太
监俩人一模
一样,外行瞎指导,丢人就嘴硬。

your

【在 n*****t 的大作中提到】
: 二逼又来了:
: Extremely long URLs are usually a mistake. URLs over 2,000 characters will
: not work in the most popular web browser. Don't use them if you intend your
: site to work for the majority of Internet users.
: 你悲愤 spec 有屁用,全堆就是全堆
:
: .
: based
: URI

n*****t
发帖数: 22014
19
The TinyURL homepage includes a form that is used to submit a long URL for
shortening. For each URL entered, the server adds a new alias in its hashed
database and returns a short URL such as http://tinyurl.com/2unsh in the following page. If the URL has already been requested, TinyURL will return the existing alias rather than create a duplicate entry. The short URL forwards users to the long URL.
接着现下限,煞笔

【在 g*****g 的大作中提到】
: 所以傻逼你啥都只能做太监版的。IE的limit是2000左右没错,可Chrome, FF都是至少
: Million级。你没见过不支持IE的网站是吧,这个就是原因之一。
: 做tinyurl的,巴不得多一点客户,还有那么傻逼弄最低的limit专为IE定制的。你跟太
: 监俩人一模
: 一样,外行瞎指导,丢人就嘴硬。
:
: your

n*****t
发帖数: 22014
20
不支持 IE 的网站就是你个煞笔做的吧?不出来丢人会死啊?

【在 g*****g 的大作中提到】
: 所以傻逼你啥都只能做太监版的。IE的limit是2000左右没错,可Chrome, FF都是至少
: Million级。你没见过不支持IE的网站是吧,这个就是原因之一。
: 做tinyurl的,巴不得多一点客户,还有那么傻逼弄最低的limit专为IE定制的。你跟太
: 监俩人一模
: 一样,外行瞎指导,丢人就嘴硬。
:
: your

相关主题
问个 C/C++ 的 -=, += 的问题一个弱问题,关于打开HTTP文件
Interview questions about hash function请教:如何用Java get URL content是.swe并且是utf-16 encoding的文件
a website "programing" question问java applet的问题
进入Programming版参与讨论
g*****g
发帖数: 34805
21
傻逼你不会自己弄一个超过IE limit的URL到tinyurl实测?技术论坛,错了就错了,死
撑到底有用吗?IE limit 2083, VARCHAR2 4000, 这个4269的照样产生。
TinyURL was created!
The following URL:
http://www.longurlmaker.com/view/?id=CRA
ILRRPLXKCHERGTSCQOTCFTODFUEGXVGGGYXWJVGL
CKDJEWMUKGXQALTGGXMESSKZRIWADDMGNPQSMCNW
....
has a length of 4269 characters and resulted in the following TinyURL which
has a length of 26 characters:
http://tinyurl.com/mmoqgwu

hashed

【在 n*****t 的大作中提到】
: The TinyURL homepage includes a form that is used to submit a long URL for
: shortening. For each URL entered, the server adds a new alias in its hashed
: database and returns a short URL such as http://tinyurl.com/2unsh in the following page. If the URL has already been requested, TinyURL will return the existing alias rather than create a duplicate entry. The short URL forwards users to the long URL.
: 接着现下限,煞笔

n*****t
发帖数: 22014
22
认识 hashed database 吗?

which

【在 g*****g 的大作中提到】
: 傻逼你不会自己弄一个超过IE limit的URL到tinyurl实测?技术论坛,错了就错了,死
: 撑到底有用吗?IE limit 2083, VARCHAR2 4000, 这个4269的照样产生。
: TinyURL was created!
: The following URL:
: http://www.longurlmaker.com/view/?id=CRA
: ILRRPLXKCHERGTSCQOTCFTODFUEGXVGGGYXWJVGL
: CKDJEWMUKGXQALTGGXMESSKZRIWADDMGNPQSMCNW
: ....
: has a length of 4269 characters and resulted in the following TinyURL which
: has a length of 26 characters:

g*****g
发帖数: 34805
23
傻逼VARCHAR2 4000最多,4200的url都可以用,你丫还敢说VARCHAR够长吗?IE limit
2000, 你丫承认人没用你太监版的实现吗?贴个IE的limit来做救命稻草,真不嫌丢人。

【在 n*****t 的大作中提到】
: 认识 hashed database 吗?
:
: which

n*****t
发帖数: 22014
24
varchar 多少?

limit

【在 g*****g 的大作中提到】
: 傻逼VARCHAR2 4000最多,4200的url都可以用,你丫还敢说VARCHAR够长吗?IE limit
: 2000, 你丫承认人没用你太监版的实现吗?贴个IE的limit来做救命稻草,真不嫌丢人。

g*****g
发帖数: 34805
25
看啥数据库了,Oracle varchar2 4000, 是个人都知道。总之人实现的比你拿出来死撑
的IE, 长
多了。

【在 n*****t 的大作中提到】
: varchar 多少?
:
: limit

n*****t
发帖数: 22014
26
知道错了就好,接下来说说 tinyurl 用的 hashed database

【在 g*****g 的大作中提到】
: 看啥数据库了,Oracle varchar2 4000, 是个人都知道。总之人实现的比你拿出来死撑
: 的IE, 长
: 多了。

g*****g
发帖数: 34805
27
LOL,傻逼你真够极品。什么URL最多应该2087的link拿出来丢人,转眼就当没这回事了。
url弄个hashkey再比也是我跟你说的。

【在 n*****t 的大作中提到】
: 知道错了就好,接下来说说 tinyurl 用的 hashed database
n*****t
发帖数: 22014
28
你丫写的网站有 2000 多字节的 url 吧?反正肯定不是正常人写的。稍微看过点 DB
书的人都知道 unique 是怎么实现的,你个 SQL 都不会的煞笔还是别丢人了。
接着说说 tinyurl 用什么存储 url 的,是不是还有一个字段叫 hashkey 啊,你当设
计的人跟你丫一样煞笔啊

了。

【在 g*****g 的大作中提到】
: LOL,傻逼你真够极品。什么URL最多应该2087的link拿出来丢人,转眼就当没这回事了。
: url弄个hashkey再比也是我跟你说的。

g*****g
发帖数: 34805
29
LOL, tinyurl自然有个字段存hash, 4000都不够长存URL,你丫还来?傻逼你打脸要
打几次呀。
有本事你让tinyurl不支持4000以上的url输入呀。人做好的实现你都要争。
太长的字段比hash本来就是个常识。你丫嘴硬到底有用吗?

【在 n*****t 的大作中提到】
: 你丫写的网站有 2000 多字节的 url 吧?反正肯定不是正常人写的。稍微看过点 DB
: 书的人都知道 unique 是怎么实现的,你个 SQL 都不会的煞笔还是别丢人了。
: 接着说说 tinyurl 用什么存储 url 的,是不是还有一个字段叫 hashkey 啊,你当设
: 计的人跟你丫一样煞笔啊
:
: 了。

n*****t
发帖数: 22014
30
果然全堆啊,还专门弄个字段存 hash,啧啧啧
刚才不是还鸭子嘴说不用 db 存 url 吗?来,接着证明 tinyurl 用的是 oracle 不是
mysql 更不是 sql server

【在 g*****g 的大作中提到】
: LOL, tinyurl自然有个字段存hash, 4000都不够长存URL,你丫还来?傻逼你打脸要
: 打几次呀。
: 有本事你让tinyurl不支持4000以上的url输入呀。人做好的实现你都要争。
: 太长的字段比hash本来就是个常识。你丫嘴硬到底有用吗?

相关主题
有熟悉as3的吗?菜鸟问个问题IIS7.5 大于 64KB 文件不能下载 ? (转载)
问个关于socket问题URL questions
Perl 问题 (updated)请教一个语言选择的弱问题
进入Programming版参与讨论
g*****g
发帖数: 34805
31
傻逼我哪里说不用存url, 我说的是varchar存不下,得用clob. 你丫非说varchar存得
下被打脸不是?

【在 n*****t 的大作中提到】
: 果然全堆啊,还专门弄个字段存 hash,啧啧啧
: 刚才不是还鸭子嘴说不用 db 存 url 吗?来,接着证明 tinyurl 用的是 oracle 不是
: mysql 更不是 sql server

g*****g
发帖数: 34805
32
尼玛这傻逼连我说的话,也能纂改,都什么人呀。就为了自己一点破脸,一点人格都不
要了。
信人: goodbug (好虫), 信区: Programming
标 题: Re: tinyurl 是怎么做到同一个long url两次得到相同的short ur
发信站: BBS 未名空间站 (Wed Feb 12 00:50:16 2014, 美东)
傻逼你又不懂了吧,DB是要存url, 但是url长度可以几千,有的网站可以来一堆url前
面都一样,最后一个参数不一样。
数据库用VARCHAR都存不了,长度不够。用CLOB比慢死你。
n*****t
发帖数: 22014
33
放狗查一下 mysql 和 sql server 的 varchar,再告诉我哪个煞笔做了 unique 还再
用一个字段存 hash

【在 g*****g 的大作中提到】
: 傻逼我哪里说不用存url, 我说的是varchar存不下,得用clob. 你丫非说varchar存得
: 下被打脸不是?

g*****g
发帖数: 34805
34
傻逼你是死撑到底了是吧,刚才哪个傻逼拿IE 2087的limit是来秀智商下限的,现在不
敢承认了是吧?

【在 n*****t 的大作中提到】
: 放狗查一下 mysql 和 sql server 的 varchar,再告诉我哪个煞笔做了 unique 还再
: 用一个字段存 hash

n*****t
发帖数: 22014
35
哪个煞笔说 url 不能用 varchar 存的?哪个煞笔说 hash 要用一个字段存的?url 长
度超过 2k 的只有你这种煞笔写得出来,没有唯一

【在 g*****g 的大作中提到】
: 傻逼你是死撑到底了是吧,刚才哪个傻逼拿IE 2087的limit是来秀智商下限的,现在不
: 敢承认了是吧?

g*****g
发帖数: 34805
36
你觉得url长度不能超过2K,tinyurl可是赤裸裸地打你脸,你丫不服有用吗?

【在 n*****t 的大作中提到】
: 哪个煞笔说 url 不能用 varchar 存的?哪个煞笔说 hash 要用一个字段存的?url 长
: 度超过 2k 的只有你这种煞笔写得出来,没有唯一

n*****t
发帖数: 22014
37
正常人写的 url 不会超过 2k,当然 tinyurl 知道你这个煞笔还存在

【在 g*****g 的大作中提到】
: 你觉得url长度不能超过2K,tinyurl可是赤裸裸地打你脸,你丫不服有用吗?
g*****g
发帖数: 34805
38
你丫就是民科都要装。人问tinyurl怎么实现的,你的结论就是tinyurl实现错了。LOL

【在 n*****t 的大作中提到】
: 正常人写的 url 不会超过 2k,当然 tinyurl 知道你这个煞笔还存在
n*****t
发帖数: 22014
39
你丫正儿八经小姨子一个,说 varchar 存不下 url 的是你,说 hash 需要另外一个字
段的也是你,晾这丢人吧,这回你姐夫也不会帮你擦屁股了
对了,你语文是你姐夫教的?

LOL

【在 g*****g 的大作中提到】
: 你丫就是民科都要装。人问tinyurl怎么实现的,你的结论就是tinyurl实现错了。LOL
g*****g
发帖数: 34805
40
是哪个脑残拿出ie 2087的limit来秀下限的,你也有脸说。tinyurl的实现都赤裸裸打
了你的脸,你丫死撑有用吗?
还有脸拿varchar来说事,spec都写了不设上限,mysql, sql server哪个varchar没有
上限的?
傻逼本来就是点小破事,外行老实学不行,非要嘴硬。

【在 n*****t 的大作中提到】
: 你丫正儿八经小姨子一个,说 varchar 存不下 url 的是你,说 hash 需要另外一个字
: 段的也是你,晾这丢人吧,这回你姐夫也不会帮你擦屁股了
: 对了,你语文是你姐夫教的?
:
: LOL

相关主题
请教一个语言选择的弱问题同主题阅读工具
问一道面试题cgi测试newbee问题
Random Switch Between Two Different URLs求救:javascript程序运行中的一个error message
进入Programming版参与讨论
s***e
发帖数: 108
41
俩大拿争啥,用LONGTEXT再加INDEX就行了?

【在 g*****g 的大作中提到】
: 是哪个脑残拿出ie 2087的limit来秀下限的,你也有脸说。tinyurl的实现都赤裸裸打
: 了你的脸,你丫死撑有用吗?
: 还有脸拿varchar来说事,spec都写了不设上限,mysql, sql server哪个varchar没有
: 上限的?
: 傻逼本来就是点小破事,外行老实学不行,非要嘴硬。

g*****g
发帖数: 34805
42
有的网站URL很长,又只相差最后一个参数,结果就是性能很差。所以用md5 hashkey查
找是
一个通用的做法。hash的特点,就是URL差一个字母,结果都完全不同。

【在 s***e 的大作中提到】
: 俩大拿争啥,用LONGTEXT再加INDEX就行了?
n*****t
发帖数: 22014
43
鸭就是个半瓶醋,DB 做了 index 后,select 就是用的 btree 或者 hash,拌醋非得
画蛇添足再加个字段存 hash key。其实我故意一开始没告诉鸭,就看鸭的下限究竟是
多少。
说鸭拌醋真是侮辱醋了,我向无辜的醋表示道歉

【在 s***e 的大作中提到】
: 俩大拿争啥,用LONGTEXT再加INDEX就行了?
q*c
发帖数: 9453
44
我觉得是的存 hash~ 你想想我网站比如是个翻译网站,input 就在 get url 里面,便
于交流保持, 随便上 几千字节, 而且就最后几个字节不同。这样的 url 来上几万个
,你要是 db unique, 那比较起来不得慢死人?
hash 就用个 64 位的字符串冲突基本就是零。快了无数吧?
除非数据库里面就是 hash 比较?可是我记得用的是 b tree 吧,是顺序比较。

【在 n*****t 的大作中提到】
: 放狗查一下 mysql 和 sql server 的 varchar,再告诉我哪个煞笔做了 unique 还再
: 用一个字段存 hash

g*****g
发帖数: 34805
45
你这傻逼,用varchar被tinyurl爆表打脸了,你丫还没完了。你丫不服倒是拿个数据库
实现大家看看呀。

【在 n*****t 的大作中提到】
: 鸭就是个半瓶醋,DB 做了 index 后,select 就是用的 btree 或者 hash,拌醋非得
: 画蛇添足再加个字段存 hash key。其实我故意一开始没告诉鸭,就看鸭的下限究竟是
: 多少。
: 说鸭拌醋真是侮辱醋了,我向无辜的醋表示道歉

g*****g
发帖数: 34805
46
当数据库存hashkey的时候,长url的hash是在数据库外面做的。当用hash index的时候
,且不说hash算法不能自选,光CPU就够数据库服务器吃一壶的。也就外行没有任何概
念的才会在高并发网站上怕数据库死的不够快。
n*****t
发帖数: 22014
47
Mysql cluster 可以选 hash index

【在 q*c 的大作中提到】
: 我觉得是的存 hash~ 你想想我网站比如是个翻译网站,input 就在 get url 里面,便
: 于交流保持, 随便上 几千字节, 而且就最后几个字节不同。这样的 url 来上几万个
: ,你要是 db unique, 那比较起来不得慢死人?
: hash 就用个 64 位的字符串冲突基本就是零。快了无数吧?
: 除非数据库里面就是 hash 比较?可是我记得用的是 b tree 吧,是顺序比较。

n*****t
发帖数: 22014
48
煞笔继续现,你妈没教过你放狗查查 vchar 是多大?

【在 g*****g 的大作中提到】
: 你这傻逼,用varchar被tinyurl爆表打脸了,你丫还没完了。你丫不服倒是拿个数据库
: 实现大家看看呀。

r*******y
发帖数: 1081
49
请问你是怎么用64位的字符串的呢? 谢谢。

【在 q*c 的大作中提到】
: 我觉得是的存 hash~ 你想想我网站比如是个翻译网站,input 就在 get url 里面,便
: 于交流保持, 随便上 几千字节, 而且就最后几个字节不同。这样的 url 来上几万个
: ,你要是 db unique, 那比较起来不得慢死人?
: hash 就用个 64 位的字符串冲突基本就是零。快了无数吧?
: 除非数据库里面就是 hash 比较?可是我记得用的是 b tree 吧,是顺序比较。

a9
发帖数: 21638
50
你不存到时候用的时候怎么办?

【在 g*****g 的大作中提到】
: 傻逼你又不懂了吧,DB是要存url, 但是url长度可以几千,有的网站可以来一堆url前
: 面都一样,最后一个参数不一样。
: 数据库用VARCHAR都存不了,长度不够。用CLOB比慢死你。
: 所以上个hash, 位数弄长一点,就算你是google search, 也有个几个collide到头了,
: 然后一比实际url就知道。
: 你丫整一外行,没经验的东西,就别误导了。

相关主题
问个技术问题: 怎样把其他网站的搜索结果显示在自己的网站上Interview questions about hash function
贡献一下:本版上搜集的 Google 面试题 (转载)a website "programing" question
问个 C/C++ 的 -=, += 的问题一个弱问题,关于打开HTTP文件
进入Programming版参与讨论
q*c
发帖数: 9453
51
url 来了取 md5 hash, 以此为 key 丢 cassandra, 然后把相应metadata 记录在 db
里面。

【在 r*******y 的大作中提到】
: 请问你是怎么用64位的字符串的呢? 谢谢。
e********3
发帖数: 18578
52
你把long url存在数据库里面,然后生成一个SHA hash或者自己定义的GUID,每次通过
这个GUID来找对应的long url。

【在 r*******y 的大作中提到】
: 里面是有一个 integer id 到short url 的一个一一对应。 但是 long url到这个
: integer id的对应怎么搞,不然怎么做到相同的 long url得到相同的 short url.
: thanks.

e********3
发帖数: 18578
53
ur length基本没有上限。
http://boutell.com/newfaq/misc/urllength.html

【在 n*****t 的大作中提到】
: 所以说你丫煞笔啊,如假包换的小姨子
: url length limit 不知道,varchar length 不知道,更不知道 db index 怎么做的。
: 煞笔你少喷几句就不会丢人了,不出来丢人你会死啊?

e********3
发帖数: 18578
54
varchar当然有上限了,没有上限的话用LONGTEXT或者blob.

【在 g*****g 的大作中提到】
: 是哪个脑残拿出ie 2087的limit来秀下限的,你也有脸说。tinyurl的实现都赤裸裸打
: 了你的脸,你丫死撑有用吗?
: 还有脸拿varchar来说事,spec都写了不设上限,mysql, sql server哪个varchar没有
: 上限的?
: 傻逼本来就是点小破事,外行老实学不行,非要嘴硬。

g*****g
发帖数: 34805
55
大家说的一样,一个是 varchar不够长,另一个是 hash要另存。就一个精分要死撑。

【在 e********3 的大作中提到】
: 你把long url存在数据库里面,然后生成一个SHA hash或者自己定义的GUID,每次通过
: 这个GUID来找对应的long url。

e********3
发帖数: 18578
56
其实一个64位的MD5 Hash就解决的了,collide的概率几乎忽略不计,我同意database
server和application server要分开这样处理高并发。

【在 g*****g 的大作中提到】
: 大家说的一样,一个是 varchar不够长,另一个是 hash要另存。就一个精分要死撑。
n*****t
发帖数: 22014
57
傻逼 2G 不够存 url,你当 tinyurl 是移动硬盘啊?
你存一个 2G url 给我看看,傻逼

【在 g*****g 的大作中提到】
: 大家说的一样,一个是 varchar不够长,另一个是 hash要另存。就一个精分要死撑。
n*****t
发帖数: 22014
58
就你这篇文章里
Extremely long URLs are usually a mistake. URLs over 2,000 characters will
not work in the most popular web browser. Don't use them if you intend your
site to work for the majority of Internet users.
谁会设计一个超过 2k 的 url?当然,tinyurl 知道有古德八这种脑残,不过还没傻到
给丫准备 2g 的空间

【在 e********3 的大作中提到】
: ur length基本没有上限。
: http://boutell.com/newfaq/misc/urllength.html

e********3
发帖数: 18578
59
IE里面不支持超过2K的url,不说明别的browser不行,你设计一个tinyurl不能只针对
IE的用户吧?你这个url length兼容是向下兼容的,能处理2 mil的url难道处理不了
200的url?

your

【在 n*****t 的大作中提到】
: 就你这篇文章里
: Extremely long URLs are usually a mistake. URLs over 2,000 characters will
: not work in the most popular web browser. Don't use them if you intend your
: site to work for the majority of Internet users.
: 谁会设计一个超过 2k 的 url?当然,tinyurl 知道有古德八这种脑残,不过还没傻到
: 给丫准备 2g 的空间

d******k
发帖数: 4295
60
我碰见过,合作方的阿三做了个web,用Get.参数id都是GUID,允许多选没上限。
后来改成了post
相关主题
请教:如何用Java get URL content是.swe并且是utf-16 encoding的文件问个关于socket问题
问java applet的问题Perl 问题 (updated)
有熟悉as3的吗?菜鸟问个问题IIS7.5 大于 64KB 文件不能下载 ? (转载)
进入Programming版参与讨论
e********3
发帖数: 18578
61
有时候你必须得Get,比如你需要bookmark这个link的话。

【在 d******k 的大作中提到】
: 我碰见过,合作方的阿三做了个web,用Get.参数id都是GUID,允许多选没上限。
: 后来改成了post

1 (共1页)
进入Programming版参与讨论
相关主题
请教:如何用Java get URL content是.swe并且是utf-16 encoding的文件问一道面试题
问java applet的问题Random Switch Between Two Different URLs
有熟悉as3的吗?菜鸟问个问题同主题阅读工具
问个关于socket问题cgi测试newbee问题
Perl 问题 (updated)求救:javascript程序运行中的一个error message
IIS7.5 大于 64KB 文件不能下载 ? (转载)问个技术问题: 怎样把其他网站的搜索结果显示在自己的网站上
URL questions贡献一下:本版上搜集的 Google 面试题 (转载)
请教一个语言选择的弱问题问个 C/C++ 的 -=, += 的问题
相关话题的讨论汇总
话题: url话题: tinyurl话题: hash话题: ie话题: varchar