由买买提看人间百态

topics

全部话题 - 话题: 分词
首页 上页 1 2 3 4 5 6 7 8 下页 末页 (共8页)
b******y
发帖数: 9224
1
来自主题: StartUp版 - 问个特种搜索引擎的问题

是的,最早分词就是中科院的那套c/c++程序。后来,搜狗,百度等等,都有了自己的
算法。好像天津还有个啥海量分词的公司,靠这个赚钱。
Anyway, 搜索这东西算是个feature吧,可以搞一搞,但要说花多大精力,这个我也不
敢说。因为毕竟我是做business, 不是做科学研究。看情况吧。。。
a****b
发帖数: 3588
2
【 以下文字转载自 Joke 讨论区 】
发信人: NYC (NewYork is a dirty word?), 信区: Joke
标 题: 有人转过学外语全集了吗?
发信站: BBS 未名空间站 (Wed Mar 9 16:25:22 2011, 美东)
先是法语
老子两年前选了法语课!!!!!!!!
于是踏上了尼玛不归路 啊!!!!!!!!!!
谁跟老子讲法语是世界上最油煤的语言啊!!!!!!!!
尼玛听的哪个外太空的法语啊!!!!!!!!!!!
跟吐痰一样一样一样的啊 有木有!!!!!!!!!
谁再跟老子讲法语是世界上最油煤的语言 老子一口浓痰咸你啊!!!!!!!!!!
!!!!!
法国人数数真是极品啊!!!!!!!!
76不念七十六啊!!!!!!!!!!
念六十加十六啊!!!!!!!!!!
96不念九十六啊!!!!!!!!!
念四个二十加十六啊!!!!!!!!!!!!!
法国人数学好得不得了 有木有!!!!!!!!!
一百以内加减法老子不用计算器直接念出来了啊 有木有!!!!!!!!!!!!!!
电话号码两个两个念啊!!!!!!!!!!!!
176988472怎么念!!!... 阅读全帖
M****M
发帖数: 1445
3
德语
劳资上了近一年德语课!!!!!!
于是踏上了尼玛不归路啊!!!!!!!
谁给劳资讲德语是世界上最严谨的语言啊!!!!!!
尼玛的!!哪个星云的德语啊!!!!!!
跟吐屎一样一样一样的啊(发ö的时候)!!!!有木有有木有!!!!
谁再给劳资提德语是世界上最严谨的语言,劳资一口盐汽水喷死你啊!!!!!!!
德国人数数真是极品啊!!!!!!
八十九不念八十九啊!!!!!!!
念九 和八十啊!!!!!有木有!!!!!!!
尼玛怎么是反的啊!!!!!!!
德国人数学好得不得了啊!!!!
加减乘除倒算如流啊!!!!!!!
67254不念六万七千二百五十四啊!!!!!!
念七和六十个千两个百四和五个十啊!!!!!!!
写出来尼玛是siebenundsechzigtausendzweihundertvierundfünfzig!!!!!
四十八个字母啊!!!!!尼玛不嫌长啊!!!!!!
尼玛还没标点符号和空格啊!!!!!
这肿么认啊????坑死爹啊!!!!!!
等你认出来,尼玛一首忐忑已经唱完了呀完了呀!!!!!!
就是尼玛甩葱歌也唱完了呀!!!!!!
所有名词都分男,女和不男不女啊!... 阅读全帖
s*********4
发帖数: 1980
4
经国家质量监督检验检疫总局、国家标准化管理委员会批准,新修订的《汉语拼音正词
法基本规则》将于今年10月1日起实施。如何拼写汉语的人名地名,如何拼写汉语的数
词、量词、连接词、形容词等,都有了“法定”规范。
语言发展规则修订
原有的《汉语拼音正词法基本规则》,是上世纪90年代中期由国家语委组织研制、
国家质量技术监督局发布的国家标准。随着社会语言生活的发展变化,2006年,教育部
、国家语委根据国家标准委要求开始组织专家对原标准进行修订,内容包括分词连写规
则、人名地名拼写规则、大写规则、标调规则、移行规则、标点符号使用规则、变通规
则。该标准适用于文化教育、编辑出版、中文信息处理等领域的汉语拼音拼写。
按此规则,拼写普通话基本上以词为书写单位。表示一个整体概念的双音节和三音
节结构的词要连写,如:quánguó(全国)、Pòtiānhuāng(破天荒)。但是,四
音节及四音节以上表示一个整体概念的名词,则必须分写,如:wúfèng gāngguǎn
(无缝钢管)、huánjìng bǎohù guīzé(环境保护规则)。
人名地名规范拼写
随着国际交流的愈发频繁,中国的人名地名会越来... 阅读全帖
k****n
发帖数: 394
5
来自主题: SanFrancisco版 - 最后一课
那天早晨上学,我去得很晚,心里很怕韩麦尔先生骂我,况且他说过要问我们分词,可
是我连一个字
也说不上来。我想就别上学了,到野外去玩玩吧。
天气那么暖和,那么晴朗!
画眉在树林边宛转地唱歌;锯木厂后边草地上,普鲁士兵正在操练。这些景像,比
分词用法有趣
多了;可是我还能管住自己,急忙向学校跑去。
我走过镇公所的时候,看见许多人站在布告牌前边。最近两年来,我们的一切坏消
息都是从那里
传出来的:败仗啦,征发啦,司令部的各种命令啦。──我也不停步,只在心里思量:
“又出了什么事
啦?”
铁匠华希特带着他的徒弟也挤在那里看布告,他看见我在广场上跑过,就向我喊:
“用不着那么快
呀,孩子,你反正是来得及赶到学校的!”
我想他在拿我开玩笑,就上气不接下气地赶到韩麦尔先生的小院子里。
平常日子,学校开始上课的时候,总有一阵喧闹,就是在街上也能听到。开课桌啦
,关课桌啦,
大家怕吵捂着耳朵大声背书啦……还有老师拿着大铁戒尺在桌子上紧敲着,“静一点,
静一点……”
我本来打算趁一阵喧闹偷偷地溜到我的座位上去;可是那一天,一切偏安安静静的
,跟星期日的
早晨一样。我从开着的窗子望进去,看见同学们都在自己的
H*********n
发帖数: 290
6
最后一课
那天早晨上学,我去得很晚,心里很怕韩麦尔先生骂我,况且他说过要问我们分词。可
是我连一个字也说不上来。我想就别上学了,到野外去玩玩吧。   天气那么暖和,
那么晴朗!   画眉在树林边宛转地唱歌;锯木厂后边草地上,普鲁士士兵正在操练
。这些景象,比分词用法有趣多了;可是我还能管住自己,急忙向学校跑去。 我走过
镇公所的时候,看见许多人站在布告牌前边。最近两年来,我们的一切坏消息都是从那
里传出来的:败仗啦,征发啦,司令部的各种命令啦。——我也不停步,只在心里思量
广场上跑过,就向我喊:“用不着那么快呀,孩子,你反正是来得及到学校的!”
我想他在拿我开玩笑,就上气不接下气地赶到韩麦尔先生的小院子里。 平常日子,
学校开始上课的时候,总有一阵喧闹,就是在街上也能听到。开课桌啦,关课桌啦,大
家怕吵捂着耳朵大声背书啦……还有老师拿着大铁戒尺在桌子上紧敲着,“静一点,静
一点……”   我本来打算趁那一阵喧闹偷偷地溜到我的座位上去;可是那一天,一
切偏安安静静的,跟星期日的早晨一样。我从开着的窗子望进去,看见同学们都在自己
的座位上了;韩麦尔先生呢,踱来踱去,胳膊底下挟着那怕人的戒尺
b*******t
发帖数: 33714
7
来自主题: AudioBook版 - 文科生终于可以被消灭了[zz]
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不
是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解
嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是
“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话
可能的字的组合都列举出来,就可以整体统计频率了。”大家一致分析这位网友一定是
个理科生。
随后, “yixuan”贴出了他算出来的高频词,排在前面的分别是:
1、1485
2、东风(1382)
3、何处(1230)
... 阅读全帖
S***Z
发帖数: 1029
8
来自主题: LeisureTime版 - 有人转过学外语全集了吗? (转载)
【 以下文字转载自 Joke 讨论区 】
发信人: NYC (NewYork is a dirty word?), 信区: Joke
标 题: 有人转过学外语全集了吗?
发信站: BBS 未名空间站 (Wed Mar 9 16:25:22 2011, 美东)
先是法语
老子两年前选了法语课!!!!!!!!
于是踏上了尼玛不归路 啊!!!!!!!!!!
谁跟老子讲法语是世界上最油煤的语言啊!!!!!!!!
尼玛听的哪个外太空的法语啊!!!!!!!!!!!
跟吐痰一样一样一样的啊 有木有!!!!!!!!!
谁再跟老子讲法语是世界上最油煤的语言 老子一口浓痰咸你啊!!!!!!!!!!
!!!!!
法国人数数真是极品啊!!!!!!!!
76不念七十六啊!!!!!!!!!!
念六十加十六啊!!!!!!!!!!
96不念九十六啊!!!!!!!!!
念四个二十加十六啊!!!!!!!!!!!!!
法国人数学好得不得了 有木有!!!!!!!!!
一百以内加减法老子不用计算器直接念出来了啊 有木有!!!!!!!!!!!!!!
电话号码两个两个念啊!!!!!!!!!!!!
176988472怎么念!!!... 阅读全帖
l**i
发帖数: 8245
9
来自主题: LeisureTime版 - 我的支教经历一
发信人: shell (空雀涅槃), 信区: America
标 题: 我的支教经历九
发信站: Unknown Space - 未名空间 (Thu Mar 24 11:21:59 2005), 转信
教学-高三
高三学生是我最先认识的,也是复新学校最有名的,很多同学不但去过大城市,而
且还接受过记者采访。我对高三学生的第一印象就是举止很大方,不怕生,普通话
说得相对很好。在复新的第一个早上就被高三学生朗朗的读书声唤醒,据说同学们
都是5点多就起来念书的。
在去看奥运前跟高三同学补过一段时间初中英语的基础课,包括语法,发音,还有
让他们用英语写作文。初步感觉基础不是很扎实,但毕竟是花过功夫学的。虽然知
道高三同学高考压力很大,但我还是尽量权衡应试教育和真正的语言训练。我在读
博士期间选修了一年多的法语课,算是对美国的语言教学有所了解,所以很想把这
边上课的一些方法用在这些学生身上。我一个特别深的感觉就是美国这里学习语言
注重语言的实用性,单词也要求背,但根本不是重点,重点在听说读写,运用各种
方式去使用这门语言。学习一年以后老师就要求大家读原版小说了,虽然读得很痛
苦,但收获很大。还... 阅读全帖
l*r
发帖数: 79569
10
来自主题: LeisureTime版 - 酒馆女郎
我的分词系统一直领先bos一代啊
当然昨天败在了MRJM上面,这也没办法,他的分词系统比较fuzzy
c**c
发帖数: 2593
11
来自主题: LeisureTime版 - OED和中文字典
呵呵,想不到这里还有这种技术坑可以灌。机器自动分词当然不会百分百准确(人都有
时会搞错),不过“萝莉控制大叔”这个例子倒不是太难。因为如果分词算法比较聪明
点的话,会看到把“萝莉控”和“大叔”两个词分出去后,中间剩下一个孤零零的“制
”,而这个字单独出现的概率太低,这样就不如另一种分法“萝莉”、“控制”、“大
叔”总体得分高。
l*r
发帖数: 79569
12
来自主题: LeisureTime版 - OED和中文字典
大体是这个意思
考虑字频权重。具体算法实现我不了解
原来看过一个最民科的汉字分词基本是这个思路,但那个主要是为了分词检索,而不是
正确的parse语义,这两个要求难度大不一样。
b*s
发帖数: 82482
13
来自主题: LeisureTime版 - OED和中文字典
同意。
而且字典也不是机器编的,机器只是把有关的引用和上下文找出来,最后还是
lexicographer们比较鉴别,然后做出决定的。
在Webster Collegiate里面,经常有Usage Note, 基本上就是一个Panel决定某种用法
是否被接受,标准就是educated people的共识。很多用法,几十年前不被认可的,现
在就被基本上认可了。
如果educated people,医生,律师,法官,作家,等等,认为"剩男"是可以接受的,
当然可以收入辞典而legitimize...

呵呵,想不到这里还有这种技术坑可以灌。机器自动分词当然不会百分百准确(人都有
时会搞错),不过“萝莉控制大叔”这个例子倒不是太难。因为如果分词算法比较聪明
点的话,会看到把“萝莉控”和“大叔”两个词分出去后,中间剩下一个孤零零的“制
”,而这个字单独出现的概率太低,这样就不如另一种分法“萝莉”、“控制”、“大
叔”总体得分高。
s******t
发帖数: 2511
14
大部分词读起来给人一种苦兮兮的感觉,怎么就纤尘不染了?
纳兰性德死得太早,来不及感悟人生,大部分词都是效仿前人,来几段无病呻吟的表面
文章。
h*******g
发帖数: 10585
15
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不
是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解
嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是
“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话
可能的字的组合都列举出来,就可以整体统计频率了。”大家一致分析这位网友一定是
个理科生。
随后, “yixuan”贴出了他算出来的高频词,排在前面的分别是:
1、1485
2、东风(1382)
3、何处(1230)
4... 阅读全帖
b*******s
发帖数: 470
16
大牛secondjob!你分析极有道理,这个就是更高水平的处理表达的手法了。比方那个
them的重复,我就没办法简洁化处理,那还是我有酝酿下的表达,一急之下,更糟糕。
提那个speakers,我就是想发短信客观描述她短信来的时候房间里发生了什么事情以及
我的心情,没有想到对信息进一步加工,呵呵~ 看你的发言,受益良多,感谢!
Economist和The New Yorker我都经常看,说实话这两本杂志风格和内容其实很不一样
,前者主要是政治经济,少部分文化科技;后者主要以pop+elite文化内容为主,时评
在Reporting & Essays那部分比较多,而Arts& Culture, Fiction & Poetry之类的栏
目,就比较生活+文艺。《纽约客》的用词和句式比《经济学人》会更intellectual:
我GRE红宝、巴朗都背得很熟,也背过美国这边比较流行的比如Word Smart(只背了I,
没有背II)和Webster Vocabulary Builder等单词书,但是《纽约客》我还是不时会碰
到不懂的单词。《经济学人》相对生词比较少,但用词也绝非那么小菜,不信可以... 阅读全帖
e****e
发帖数: 2740
17
来自主题: WaterWorld版 - 文科生泡妞利器被码工摧毁了
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不
是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解
嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是
“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话
可能的字的组合都列举出来,就可以整体统计频率了。”大家一致分析这位网友一定是
个理科生。
随后, “yixuan”贴出了他算出来的高频词,排在前面的分别是:
1、1485
2、东风(1382)
3、何处(1230)
... 阅读全帖
t******n
发帖数: 2939
18
☆─────────────────────────────────────☆
Saob (Saob) 于 (Fri Jan 27 19:44:31 2012, 美东) 提到:
如,中文里“感情”这个词。比如,我们两已经沒有什么感情了。
英语怎么翻?
We have no feeling for each other anymore
We have no love for each other anymore
第一,feeling这个词才粗糙,更本表达不出中文里“感情”这个词的意境。
第二, love是爱情,和感情意思有明显区别。
再比如,什么什么伤害了中国人民的感情。
外交部翻译是 hurt the feelings of the Chinese people. 经常被外国人嘲笑,有一
部分原因是这个feeling, 太粗糙,和原句想表达的意思差了好几个级别。英语这句话
感觉是个幼儿园小孩赌气,说"you hurt my feeling!". 其实这里哪里仅仅是feeling
的意思。
---
太多太多中文词汇没有英语可以表达出相同的细腻感。但是,反之则不然。英语里面表
达... 阅读全帖
z******g
发帖数: 1331
19
来自主题: WaterWorld版 - 瓜瓜的英文真愁人
news后面的后置定语是用现在分词还是过去分词?你是不是没上过高中,坐货柜过来的吧
a*********y
发帖数: 321
20
来自主题: WaterWorld版 - 瓜瓜的英文真愁人
英文不是用中文学的, "后置定语是用现在分词还是过去分词" 还真的不懂. 用英文给
哥哥我解释一下你认为这句英文哪里语法有误, 我再教育你. 挖个坑还故作玄虚, 一副
穷酸嘴脸.

的吧
d*******m
发帖数: 331
21
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
SB么,从句是从句,现在分词短语是现在分词短语,算状语不算从句懂么?
你见过主句和从句之间不用连词的么?
纯傻逼。
如果还不懂,你自己搜搜什么叫 独立主格。
LZ重学英语吧。
d*******m
发帖数: 331
22
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
现在分词短语做状语,或者说拥有主格的分词短语做状语,通常叫独立主格,不是什么
从句。
从句必须有连词,必须有谓语(虽然满足一定条件可以省略)。
d*******m
发帖数: 331
23
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
没人轻信百度。
我初中学独立主格的时候还没百度。独立主格很灵活,远不止只可以做状语。它不符合
很多语法规则,而且定义很模糊,算是语言学家很多时候无法解释分词短语的灵活性专
门提出了一种解释。
不说了。我贴百度只是懒得跟你解释,让你自己看一下,不代表我全盘同意它的观点。
还有,你那破英语,千万别再试图教别人了。多大岁数了连个从句定义都没明白,还“
小朋友小朋友的”,装个毛啊?
谓语是啥你都没明白。看你的描述,你连分词的逻辑主语这些概念和用法都模糊不清。
我只能概括的跟你说里面很多细节很多条条的。比你想象的深很多。
不说了。如果你真想明白,从主谓宾开始慢慢学吧。我认真的不逗你。
p******r
发帖数: 6213
24
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
该补习的是你。独立主格结构不是句子。句子可以省略动词(谓语),但不能没有谓语
。独立主格结构是分词结构,没有动词。分词/不定时/介词结构都可以做状语/定语/同
位语,并且在很多情况下可以替代从句,但它们本身不是从句,不是句子。
d*******m
发帖数: 331
25
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
SB么,从句是从句,现在分词短语是现在分词短语,算状语不算从句懂么?
你见过主句和从句之间不用连词的么?
纯傻逼。
如果还不懂,你自己搜搜什么叫 独立主格。
LZ重学英语吧。
d*******m
发帖数: 331
26
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
现在分词短语做状语,或者说拥有主格的分词短语做状语,通常叫独立主格,不是什么
从句。
从句必须有连词,必须有谓语(虽然满足一定条件可以省略)。
d*******m
发帖数: 331
27
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
没人轻信百度。
我初中学独立主格的时候还没百度。独立主格很灵活,远不止只可以做状语。它不符合
很多语法规则,而且定义很模糊,算是语言学家很多时候无法解释分词短语的灵活性专
门提出了一种解释。
不说了。我贴百度只是懒得跟你解释,让你自己看一下,不代表我全盘同意它的观点。
还有,你那破英语,千万别再试图教别人了。多大岁数了连个从句定义都没明白,还“
小朋友小朋友的”,装个毛啊?
谓语是啥你都没明白。看你的描述,你连分词的逻辑主语这些概念和用法都模糊不清。
我只能概括的跟你说里面很多细节很多条条的。比你想象的深很多。
不说了。如果你真想明白,从主谓宾开始慢慢学吧。我认真的不逗你。
p******r
发帖数: 6213
28
来自主题: WaterWorld版 - 我是持枪者,我反对拥枪(一)
该补习的是你。独立主格结构不是句子。句子可以省略动词(谓语),但不能没有谓语
。独立主格结构是分词结构,没有动词。分词/不定时/介词结构都可以做状语/定语/同
位语,并且在很多情况下可以替代从句,但它们本身不是从句,不是句子。
wh
发帖数: 141625
29
那么牛,不看翻译!我学语言好像很没耐心,总觉得花那么多时间学这种基本的东西,
不如去看翻译拉倒了。
是啊我也知道学佛不必讲究形式,但还是想有个老师指导。别人推荐我看《金刚经》,
我怕看不懂中文还特地借英文看,但看得挺抵触的,大概深受西式逻辑思维影响,觉得
东方哲学就是不讲推理,到关键地方一下子就跳过去了,所以比西哲高明,呵呵,但感
觉还是含糊模棱,不能被说服。
噢,joyinjoy的法文id是啥?我记得她用过梵文id。
那你现在还在brown附近吗?

其实,佛陀教的不是“学问”,而是生活方式。他自己从来不称自己为“佛”,
而是叫做Tathaagata,这个词中文翻译成“如来”,英文一般翻成thus-gone。
tathaa是这样的意思,后面这个既可以理解成aagata (动词aagam[来]的过去分词),
也可以理解成gata (动词gam[去】的过去分词)。我查了梵文字典,发现这Tathaagata还
可以理解为,being like this。不管怎么翻译,我想佛陀这样自称,只是想让人们明
白,其实体会到他所体会的境界才是最重要的。
她这里见过,想来还在。不过她披上了法文id而已
a***n
发帖数: 1616
30
来自主题: EnglishChat版 - 多重定语顺序问题。
正式书面语,
<普通形容词定语> 并列 <过去分词定语> 修饰 <名词>
是形容词放在前,还是过去分词放在前?
N*C
发帖数: 1987
31
来自主题: Joke版 - 有人转过学外语全集了吗?
先是法语
老子两年前选了法语课!!!!!!!!
于是踏上了尼玛不归路 啊!!!!!!!!!!
谁跟老子讲法语是世界上最油煤的语言啊!!!!!!!!
尼玛听的哪个外太空的法语啊!!!!!!!!!!!
跟吐痰一样一样一样的啊 有木有!!!!!!!!!
谁再跟老子讲法语是世界上最油煤的语言 老子一口浓痰咸你啊!!!!!!!!!!
!!!!!
法国人数数真是极品啊!!!!!!!!
76不念七十六啊!!!!!!!!!!
念六十加十六啊!!!!!!!!!!
96不念九十六啊!!!!!!!!!
念四个二十加十六啊!!!!!!!!!!!!!
法国人数学好得不得了 有木有!!!!!!!!!
一百以内加减法老子不用计算器直接念出来了啊 有木有!!!!!!!!!!!!!!
电话号码两个两个念啊!!!!!!!!!!!!
176988472怎么念!!!!!!
不念腰七六九八八四七二 啊!!!!!!!!!!
念一百加六十加十六 四个二十加十八 再四个二十加四 再六十加十二啊!!!!!!
!!!!!
你们还找美眉要电话啊!!!!!!!!!!!!!
电话报完一集葫芦娃都看完了啊 有木有!!!!!!!!!!!!!!
所... 阅读全帖
a*w
发帖数: 4495
32
【 以下文字转载自 WaterWorld 讨论区 】
发信人: evence (我们都是飞行军), 信区: WaterWorld
标 题: 文科生泡妞利器被码工摧毁了
发信站: BBS 未名空间站 (Fri Dec 2 12:12:24 2011, 美东)
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不
是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解
嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是
“犹解嫁”“解嫁东”“嫁东风”,... 阅读全帖
w*****o
发帖数: 105
33
来自主题: Joke版 - What does "Commemorate" mean?
:-D
per dict.youdao.com
commemorate
英 [kə'meməreɪt] 美 [kə'mɛməret]
vt. 庆祝,纪念;成为…的纪念
[ 过去式 commemorated 过去分词 commemorated 现在分词 commemorating ]
网络释义专业释义英英释义
纪念
灵车四周挂着玄色和黄色的挽幛,以纪念(Commemorate)是毛片送他上了天堂。上面装
饰着大黄花,暧昧,淫荡。
基于818个网页-相关网页
l*r
发帖数: 79569
34
【 以下文字转载自 Xibei 讨论区 】
发信人: gshjj (各输己键), 信区: Xibei
标 题: 有人转过学外语全集了吗? (转载)
发信站: BBS 未名空间站 (Thu Mar 10 11:15:37 2011, 美东)
发信人: NYC (NewYork is a dirty word?), 信区: Joke
标 题: 有人转过学外语全集了吗?
发信站: BBS 未名空间站 (Wed Mar 9 16:25:22 2011, 美东)
先是法语
老子两年前选了法语课!!!!!!!!
于是踏上了尼玛不归路 啊!!!!!!!!!!
谁跟老子讲法语是世界上最油煤的语言啊!!!!!!!!
尼玛听的哪个外太空的法语啊!!!!!!!!!!!
跟吐痰一样一样一样的啊 有木有!!!!!!!!!
谁再跟老子讲法语是世界上最油煤的语言 老子一口浓痰咸你啊!!!!!!!!!!
!!!!!
法国人数数真是极品啊!!!!!!!!
76不念七十六啊!!!!!!!!!!
念六十加十六啊!!!!!!!!!!
96不念九十六啊!!!!!!!!!
念四个二十加十六啊!!!!!!!!!!!!!
法国... 阅读全帖
A*********e
发帖数: 4361
35
【 以下文字转载自 LoveNLust 讨论区 】
发信人: anise (琴子), 信区: LoveNLust
标 题: 【转载】传说的作诗机就是这个原理
发信站: BBS 未名空间站 (Sat Dec 3 14:09:16 2011, 美东)
太搞笑了,有了这个程序,现在全民都可以做诗人了
发信人: henryjing (little13), 信区: PhotoGear
标 题: 【转载】文科生终于可以被消灭了
发信站: BBS 未名空间站 (Sat Dec 3 10:59:32 2011, 美东)
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想... 阅读全帖
a***e
发帖数: 1073
36
太搞笑了,有了这个程序,现在全民都可以做诗人了
【 以下文字转载自 PhotoGear 讨论区 】
发信人: henryjing (little13), 信区: PhotoGear
标 题: 【转载】文科生终于可以被消灭了
发信站: BBS 未名空间站 (Sat Dec 3 10:59:32 2011, 美东)
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不
是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解
嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”... 阅读全帖
d******c
发帖数: 2407
37
来自主题: paladin版 - 刚刚看到的敏感词
还牵涉到汉语分词的困难。
其实现有的分词程序应该能处理相当多的误判,只不过网站上可能因为资源问题不那么
搞而已,或者就是懒。
我觉得还有一个办法,作者发布一个章节,如果系统认为有违禁词,就提示一下,只要
作者坚持没有违禁内容并为此负责,仍然允许发表。这样的话H擦边球不好说,凡是正
常内容,跟违禁一点关系没有的内容,都应该正常发表,网站也根本不可能为此受打击。
至少起点的签约作者都是跟起点有合同和真实地址的,足以保证负责的可靠性,完全可
以做到签约作者的正常作品都不受违禁词屏蔽的影响。
b*********9
发帖数: 458
38
【 以下文字转载自 Sex 讨论区 】
发信人: evence (我们都是飞行军), 信区: Sex
标 题: 文科生泡妞利器被码工摧毁了 (转载)
发信站: BBS 未名空间站 (Sat Dec 3 01:28:41 2011, 美东)
发信人: evence (我们都是飞行军), 信区: WaterWorld
标 题: 文科生泡妞利器被码工摧毁了
发信站: BBS 未名空间站 (Fri Dec 2 12:12:24 2011, 美东)
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不... 阅读全帖
j*****6
发帖数: 1059
39
来自主题: TrustInJesus版 - 《圣经》都是神所默示的
里程 圣经的权威
《圣经》都是神所默示的
字句默示
《圣经》都是神所默示的。默示不是机械的听写。因为《圣经》作者们写作的风格
、词汇、语气、习惯等明显地各不相同;写作的文体、資料来源等也不同。但在圣灵的
引导、管制之下,他们所写出的都无误地是神要他们说的话。另一方面,又有人认为,
《圣经》的默示只是“概念”、“意思”的默示,絕对无误;但神允許作者自由地选择
字句,故可能产生人为的小错误。這种观点在逻輯上是讲不通的。概念、意思是由字句
表达的。有误的字句怎能表达无误的概念和意思呢?所以,概念的默示必需基於字句的
默示。而且,概念默示的观点也与《圣经》的教导不符。
《圣经》多次提到人的口。当摩西說自己是拙口笨舌時,耶和华对他说:“谁造人
的口呢?谁使人口啞、耳聋、目明、眼瞎呢?豈不是我耶和华么?现在去吧!我必赐你
口才,指教你所当说的话”(出4: 11-12)。又如,“這是耶和华亲口说的”(賽40:
5, 58: 14);“耶和华如此说:……你若将宝貴的和下賤的分別出來,你就可以当作我
的口”(耶15: 19);“但我对你说话的時候,必使你开口,你就要对他们说:‘主耶
和华如此说……’”(... 阅读全帖
x*r
发帖数: 11073
40
来自主题: Xibei版 - 酒泉下雪了!!!!
发挥一下联想能力吧~~~~
http://dict.cn/haunt
名词 haunt:a frequently visited place
同义词:hangout, resort, repair, stamping ground
动词 haunt:follow stealthily or recur constantly and spontaneously to
同义词:stalk
haunt like a ghost; pursue
同义词:obsess, ghost
be a regular or frequent visitor to a certain place
同义词:frequent
haunt[hɔ:nt] 添加生词 改进词条 n.常到的地方
vt.缠住, 常到, 出没(像鬼魂一样)
vi.徘徊,出没(像鬼魂一样)
例句与用法:
The ghost has been laid and will not return to haunt you again.
那鬼魂已经祛除,不会再回来缠著你了。
The ghost of Lady Margaret is s... 阅读全帖
g***j
发帖数: 40861
41
【 以下文字转载自 Joke 讨论区 】
发信人: NYC (NewYork is a dirty word?), 信区: Joke
标 题: 有人转过学外语全集了吗?
发信站: BBS 未名空间站 (Wed Mar 9 16:25:22 2011, 美东)
先是法语
老子两年前选了法语课!!!!!!!!
于是踏上了尼玛不归路 啊!!!!!!!!!!
谁跟老子讲法语是世界上最油煤的语言啊!!!!!!!!
尼玛听的哪个外太空的法语啊!!!!!!!!!!!
跟吐痰一样一样一样的啊 有木有!!!!!!!!!
谁再跟老子讲法语是世界上最油煤的语言 老子一口浓痰咸你啊!!!!!!!!!!
!!!!!
法国人数数真是极品啊!!!!!!!!
76不念七十六啊!!!!!!!!!!
念六十加十六啊!!!!!!!!!!
96不念九十六啊!!!!!!!!!
念四个二十加十六啊!!!!!!!!!!!!!
法国人数学好得不得了 有木有!!!!!!!!!
一百以内加减法老子不用计算器直接念出来了啊 有木有!!!!!!!!!!!!!!
电话号码两个两个念啊!!!!!!!!!!!!
176988472怎么念!!!... 阅读全帖
o***m
发帖数: 7
42
来自主题: CS版 - 问个做中文互联网相关的
问下,美帝做中文互联网的公司多吗
如果做中文互联网的话,像一些分词等中文处理需要的技术,他们是否会购买呢
和一哥们最近写了一个分词的模块,效果各种不错,工业化设计,绝对是工业界方面一
流水平
想出售赚点小钱
有没有哥们来给指点下,或者,愿意一起折腾的。
多谢
f***l
发帖数: 73
43
来自主题: CS版 - 问个做中文互联网相关的
这种分词的东西,开源的做的好多年了,效果也很好, 每年还有中文处理分词比赛。
你可以先去拿个名次
o***m
发帖数: 7
44
来自主题: Internet版 - 问个做中文互联网相关的 (转载)
【 以下文字转载自 CS 讨论区 】
发信人: orthm (orthm), 信区: CS
标 题: 问个做中文互联网相关的
发信站: BBS 未名空间站 (Tue Aug 6 20:54:41 2013, 美东)
问下,美帝做中文互联网的公司多吗
如果做中文互联网的话,像一些分词等中文处理需要的技术,他们是否会购买呢
和一哥们最近写了一个分词的模块,效果各种不错,工业化设计,绝对是工业界方面一
流水平
想出售赚点小钱
有没有哥们来给指点下,或者,愿意一起折腾的。
多谢
s*****n
发帖数: 134
45
【 以下文字转载自 WaterWorld 讨论区 】
发信人: evence (我们都是飞行军), 信区: WaterWorld
标 题: 文科生泡妞利器被码工摧毁了
发信站: BBS 未名空间站 (Fri Dec 2 12:12:24 2011, 美东)
你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为一位网友“
yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记
这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“
美妙绝伦”的宋词,圆周率也可以哦!
简化宋词就是“东风何处在人间”
署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最
常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多
时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不
是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解
嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是
“犹解嫁”“解嫁东”“嫁东风”,... 阅读全帖
v*******e
发帖数: 11604
46
来自主题: Programming版 - 西方以词为单位取得先机

古代没有分词问题,因为一个字就是一个词;你爱我吗?
后来字不够用了,用两个或多个字组成词,才有分词问题。这是老祖宗搞方块字的时候
没想到的问题。
l******n
发帖数: 9344
47
来自主题: Programming版 - 搜索系统设计
我搞混了,是solr的问题
正在try elasticsearch的icu和中文分词,你用过没有?如果要用自己的分词器,怎么
配置?
p***r
发帖数: 4702
48
来自主题: Programming版 - CNN做NLP工程多吗?
莫要限制自己的思路,都上CNN了分词干什么?直接上字模型就好了
分词是方法不是目的
首页 上页 1 2 3 4 5 6 7 8 下页 末页 (共8页)