i******e 发帖数: 171 | 1 我一直有这个问题。 一般文章都要求主文和图分开成两个文件, 我通常就直接把 Fig
ure~\ref{Fig:xx} 写死成"Figure~1". 一直忍了,虽然觉得很笨。
这次写了一片review, 编辑果然又要让改.可这次实在太长了, 图也比较多。
终于不想一个一个改了. 我于是在主文后面加了如下
%%%%figures not included, just creat labels.
\begin{figure}
\caption{}
\label{Fig:xx}
\end{figure}
... ...
... ...
... ...
这样, 基本不用改主文里的reference, 也不出图. 但是后面还是会自动出"Figure 1."
, "Figure 2." 之类的caption. 你们都是怎么处理这种问题的? 先谢了. |
|
z***e 发帖数: 5393 | 2 我不认为你需要使用超过30个PHP API来做论坛。
我列举一下:
和mysql连接的,5~6个(connect/close/query/fetch...)
字符处理如htmlencode(),substring之类的,最多10个.
论坛的东西说白了就是客户端发请求,服务器parse一下然后修改数据库返回结果而已。
php并不是什么“新”东西,新东西是RoR/nodejs之类的.web服务从最初C到perl到php/
asp/jsp的过程, php恰好是作为perl的代替品出现。
当然只要能输入在网页显示的都能输出,那么你要想想为毛别人都不用php做论坛?你
觉得网上那些phpbb/simplemachine/discussz/phpwind/etc.这些开发者都是群傻瓜完
全不知道perl的存在?php和所有xxp的web工具一样,成为Perl的代替品就是因为可以
直接切入html和server code混合起来,而不是非要print xxxx (jsp就是servlet的马
甲,但是为什么别人不去直接用servlet?asp后面也是C#,为毛不直接用
HttpResponseHan... 阅读全帖 |
|
|
c***s 发帖数: 70028 | 4 资料图:2011年6月30日晚桑兰在美国长岛住宅中。孙宇挺 摄
2011年4月,前中国体操运动员桑兰因训练中不慎摔成高位截瘫一事,一纸诉状将25个机构和个人告上了纽约南区联邦地方法院。2012年10月,桑兰委托律师对时代华纳提出违约、食言和信赖损害这三项指控,要求其做出赔偿。2014年2月,美联邦法官最终做出裁决,由于时代华纳对媒体的讲话构不成法律上合同关系,因此对这一事件不予处理。
桑兰提交诉状 索赔金额高达18亿美元
2011年4月28日,前中国体操队队员桑兰在意外受伤近13年之后,向美国纽约南区联邦地方法院,提交了一份索赔金额高达18亿美元的诉状。6月28日桑兰抵达纽约时,她的身份是原告,被告名单上列出的机构和个人多达25个,索赔金额调高到21亿美元。9月22日桑兰回国时,25名被告中只有桑兰当时在美国的监护人刘国生、谢晓虹夫妇以及他们的代表律师莫虎接到了传票。
不过最为戏剧化的是,就在桑兰“讨债”的同时,她自己也成了被告。莫虎告她“轻浮诉讼”,而刘、谢夫妇也表示打算提出反诉,“桑兰和海明对所作的事情要承担法律责任。”对于这场官司,桑兰当时表示是要“讨一个说法”。令人意外的是,此... 阅读全帖 |
|
c***s 发帖数: 70028 | 5 资料图:2011年6月30日晚桑兰在美国长岛住宅中。孙宇挺 摄
2011年4月,前中国体操运动员桑兰因训练中不慎摔成高位截瘫一事,一纸诉状将25个机构和个人告上了纽约南区联邦地方法院。2012年10月,桑兰委托律师对时代华纳提出违约、食言和信赖损害这三项指控,要求其做出赔偿。2014年2月,美联邦法官最终做出裁决,由于时代华纳对媒体的讲话构不成法律上合同关系,因此对这一事件不予处理。
桑兰提交诉状 索赔金额高达18亿美元
2011年4月28日,前中国体操队队员桑兰在意外受伤近13年之后,向美国纽约南区联邦地方法院,提交了一份索赔金额高达18亿美元的诉状。6月28日桑兰抵达纽约时,她的身份是原告,被告名单上列出的机构和个人多达25个,索赔金额调高到21亿美元。9月22日桑兰回国时,25名被告中只有桑兰当时在美国的监护人刘国生、谢晓虹夫妇以及他们的代表律师莫虎接到了传票。
不过最为戏剧化的是,就在桑兰“讨债”的同时,她自己也成了被告。莫虎告她“轻浮诉讼”,而刘、谢夫妇也表示打算提出反诉,“桑兰和海明对所作的事情要承担法律责任。”对于这场官司,桑兰当时表示是要“讨一个说法”。令人意外的是,此... 阅读全帖 |
|
d**e 发帖数: 6098 | 6 ☆─────────────────────────────────────☆
quantx (X矿工) 于 (Sat Apr 21 05:54:10 2012, 美东) 提到:
quit, cut loss.
☆─────────────────────────────────────☆
longway2008 (longway2008) 于 (Sat Apr 21 08:44:31 2012, 美东) 提到:
find a job or intern first.
☆─────────────────────────────────────☆
gloomyturkey (一只郁闷的火鸡) 于 (Sat Apr 21 09:44:52 2012, 美东) 提到:
正解,在不喜欢又无意义的事上,浪费一个月都是很亏的,更不要说浪费一年。我就是
中途drop的,从来没有后悔过。
★ 发自iPhone App: ChineseWeb - 中文网站浏览器
☆─────────────────────────────────────☆
danicahu (k... 阅读全帖 |
|
z****e 发帖数: 54598 | 7 这不是做得挺好的
这个distributed system的课还是比较负责的,jms, web service什么都教
所谓分布式以前发展最大的就是j2ee
jms就是j2ee的一个部分,理论上web那些java的东西,比j2ee要简单点
j2ee很多时候文绉绉的,不是那么便于理解
你下学期选什么,看你自己的背景
要做data什么叉叉没那么容易,要求相对高很多
如果是理科转行的话,比如从统计或者数学这样转过来
会比较合适做这块,有个相关学位的话会更适合做这一块,尤其是搞统计的
我从来都觉得统计是一个很好的专业,应用数学就是cs和统计
不过不仅这块门槛高,机会也不是那么多,不象开发那样多机会
选cloud就没有这个问题
ml和dm这一块,无非数据爆炸,然后如何萃取出数据
然后再分析再处理,这个过程中各个语言都有其优点
比如perl对于文本处理,python用来替换脚本,传统上r和sas的各种统计工具
java对于jvm的贴切,很难说用什么最好,随便你用,只要你知道自己在做什么
老师上课不会教你怎么用这些工具,会更侧重理论,然后课程中会做project
你自己觉得哪个语言顺手就操哪个上,不... 阅读全帖 |
|
h******r 发帖数: 201 | 8 刚面一个程序员位置,国人面试官让做一个project,最后输出几个文本,要求是适合
人阅读的plain text格式。做完后在本地机器运行没有问题,提交后面试官说有几个乱
码,我看了一下,只是单引号和双引号在面试官电脑上显示成a椋莟ext editor显
示utf-8的设置问题;而同样文件在我机器上毫无问题。我建议面试官运行一下我的
code但是被拒,现在不知道如何处理? |
|
o*********e 发帖数: 7 | 9 我使用英文版的windows。请问如何用Perl script处理中文文件?需从CPAN上下载什么
modules和字库吗?有没有简单的example script可以看一看?另外,什么text editor
可以保存utf, unicode, 以便用来写中文Perl script?
再一问题是,我的计算机是64bits 的。我只找到32 bits 的nmake.ext。哪里可找到64
bit 的? |
|
h*****0 发帖数: 4889 | 10 就用一个JTextArea,然后每次发生任何字符输入都处理一下事件;每次发生光标位置
变化都处理一下事件(比如不准到上一行)。 |
|
s*****o 发帖数: 76 | 11 比如要处理个文本,里面有很多格式数据块,由分隔符间隔。
可能会出现空数据块。比如:
联系方式:
tel: 098827464
email: w*[email protected]
mailing:
******************
家庭成员:
Father:
mother:
brother:
******************
教育经历:
middle school:
high school: xxx high
college:
要求是碰到空数据块的时候忽略整个块。不全的数据块保持原样。
通常该怎么识别空数据块?
好象把每项先存到变量里等这个块读完再回头查变量是不是空这种
方法比较笨。有没有什么好办法? |
|
b***i 发帖数: 3043 | 12 unix/linux, 64位
文件大约几百兆,要读入2维矩阵中,大约几万列,几千行。
原始文件每行格式为
/path...../filename authorname n1, n2, ............, nlast
每行以unix换行符结尾。
我首先要把前面的path基本忽略,可以留下filename, authorname读入到一个vector中,然后把剩下的写入处理过的文件中,只有整数,即每行只有n1, n2到最后一个,每行内的数字用逗号隔开,行间用unix换行符。在这个过程中,可以把总行数搞定,也知道每行多少个数据。然后动态分配数组。
下面就是如何快速读入处理过的文件?我用getline
for(int i=0;i
{
string onenumber;
getline(iss, onenumber, ',');
istringstream(onenumber)>>RawM[j][i];
}
有特别快的办法吗? |
|
F**D 发帖数: 6472 | 13 sp. 个人还觉得科学计算是一个系统,里面有很多过程都是不能一概而论的,有的比如
像文本处理,输入参数的生成,输出的后处理,可能matlab,mathematics就很方便,而
核心的计算模块,用c/fortran就会效率很高。一个人恐怕也只能执行一个大规模数值计
算其中的一块,这是需要一个team的。 |
|
|
p*********w 发帖数: 23432 | 15 招聘:舆情系统开发zz
【 以下文字转载自 ITExpress 讨论区 】
发信人: fid (fid), 信区: ITExpress
标 题: 招聘:舆情系统开发
发信站: 水木社区 (Mon Apr 12 15:10:00 2010), 站内
发信人: hnsyljiajia (jia), 信区: ITjob
标 题: 招聘:舆情系统开发
发信站: 水木社区 (Mon Apr 12 15:05:00 2010), 站内
在C++架构下开发高并发的舆情监控系统,包括:
1、spider
针对主流的网络媒体定时抓取网站,包括:
1)门户网站、论坛、博客等,
2)Web2.0网站
3)搜索引擎结果集成
2、query
解析抓下来的页面(标题、来源、作者、发布时间、正文等),根据用户设置的关
键词
对正文进行抽取,根据相关性返回自动摘要。包括:
1)编码识别
2)内容去重
3)锚文本处理
4)垃圾信息过滤
5)关键字抽取
6)关键信息提取
7)论坛帖子主题、回帖、点击量
8)正文抽取
9)自动摘要
3、 |
|
h********3 发帖数: 2075 | 16 你不知道现在机器学习里面针对文本处理的模式都是bag-of-word model吗????都用
了好多年了。。。 |
|
s*******d 发帖数: 229 | 17 文本处理快吧,没见过比python更简洁的,而且程序格式固定,比其他代码写起来好看
吧,最重要的是快 |
|
m**********s 发帖数: 87 | 18 大约是24-28 inch 这个档次上的
有没有呢?
要能够文本处理眼睛不会太累,就是分辨率还可以吧
谢谢! |
|
|
w***u 发帖数: 17713 | 20 老邢傻b,把我ampersand符号后的话全删完了。这种文本处理能力,也真的只能给3000
海淀刀一个月了
: 这完全是个党搞的劣币驱逐良币。一个药,pre-clinical trial
|
|
f**********n 发帖数: 29853 | 21 你丫写的这些反驳,一个程序猿一天就能模拟出来。你丫这脑子就是最简单文本处理。 |
|
r*********t 发帖数: 4911 | 22 文风和回报率啊,文本一啊,老大爷啊之类果然大同小异。这里要表彰一下耗子,耗子
虽然也骂人,可是从不辱人父母。 |
|
d*****e 发帖数: 41 | 23 大多数东西现在就可拿走,
有少数还要用的,周4available(床,微波炉,吸尘器)。
住PV,欢迎来看,达赖那个赠品,多买多送。
价格也更新了,给不给力,同学们看了再说(欢迎砍价)
765 496 4925
PV 204 - 6
谢谢
Serta Rhone queen size 床垫,box和铁架子(可拆卸)100刀
32寸 sharp 液晶电视 720p (送电视柜和天线) 150$
显示器 thinkvision l220x 22寸,1920x1200, pva面板,文本处理很爽 100刀
wii (已破解) wii fit 2个遥控器,2个num loc 3个游戏,还有一些自己刻的游戏,
全套 120$
加湿器 5刀
桌椅一套(2个凳子) 10$
桌椅一套 (4个凳子) 10刀
打印机(lexmark x2690)打印扫描一体机(没墨了) 10刀
小桌子 3刀
台灯2个,黑白各一个,3刀一个,5刀两个
床头柜 5刀一个
脏衣服的框子 2个一共5刀
理发器 一套 10刀
粉碎机 5刀
应版主要求改到一个帖子,据说有利版面整洁。 :) |
|
k**o 发帖数: 254 | 24 岗位名称:
Data Scientist 数据科学家
岗位描述:
数据事业部是隶属于阿里云的核心数据部门,承载阿里大数据战略的使命。数据事业部
-飞天一部的数据引擎团队负责阿里公有云和私有云项目的落地实施,同时推动建立大
数据生态,是数据事业部核心的团队。
算法技术与能力是阿里云最核心的竞争力,我们的愿景是通过最前沿的算法技术,帮助
客户挖掘数据价值,激发数据活力,将算法技术与能力转化为各个行业的商业价值。希
望有志于长期从事数据挖掘、机器学习的同学加入到我们团队,成长为行业算法专家,
用算法改变世界。
工作职责:
1.负责企业级大数据应用项目的算法规划、数据挖掘和模型设计,涉及到的技术包括深
度学习、强化学习、人工智能、文本处理等。
2.能深入理解行业需求与痛点,引导客户,发现其业务问题,并通过算法和模型解决业
务问题
3.承担部分政企项目POC实施、项目落地实施等。
岗位要求:
1. 三年以上数据挖掘项目经验,熟悉常用的数据挖掘与机器学习技术,有分布式
数据挖掘的实际经验为佳;
2. 统计、数学、计算机科学和通信电子类的硕士或博士学位。扎实的理论基础进
行统计,... 阅读全帖 |
|
w****6 发帖数: 359 | 25 用NOTEPAD
WORDPAD对格式的处理并不干净 |
|
a******t 发帖数: 34 | 26 申请software engineer的话,哪边比较好。interview问题的侧重点有什么不同,比如
有的侧重概念,有的侧重算法?做的东西有什么区别,比如有的侧重图像处理,有的侧重文本处理?哪边工资高?能面一个office,如果成了的话,再选择
喜欢的地方吗?主要担心加州有地震。 |
|
e*****l 发帖数: 206 | 27 is double click based in NYC?
NYC seems more sales and advertising related.
I would suggest choosing mountain view for software engineer.
Also it depends on your gender. If you are a girl, choose mountain view -
much more dating friendly for girls; alternatively, if you are a guy and not
very much career-focused, choose NY.
侧重文本处理?哪边工资高?能面一个office,如果成了的话,再选择 |
|
w****o 发帖数: 2260 | 28 只会C/C++,工作中也够用了。
可是想学一个scripting language,到底是perl, 还是python适用的广呢?
基本上就是想做一些文本处理,然后也会用到一些网络的功能,比如去抓crawl网站.
还有一个考虑就是如果跳巢的话,主要的软件公司和热门的互联网公司里用哪种的多? |
|
c********h 发帖数: 49 | 29 认识一些CS PHD, 看起来都是搞应用问题,最后看他们的博士论文都是一堆一堆数学
公式在里头。
有一个人搞语音的,帮助残疾人语音识别。
有一个搞游戏的,研究个里面的一个算法提高人物的面目表情。
还有一个是搞文本处理的,用什么数学概率统计理论。 |
|
s*****l 发帖数: 45 | 30 如果你不把Hadoop,Big Data这样的词写到resume上,应该别人也不会问,
如果写上去了,就做好被问题的功课。 我在简历上写了用过mapreduce,G家就问我了
一道很具体的MapReduce的文本处理编程题。 |
|
p*****2 发帖数: 21240 | 31
我感觉只有Haskell这么依赖monad。Clojure根本就不需要monad。文本处理,ruby应该
有优势,不过大数据的话clojure有优势呀。 |
|
k**o 发帖数: 254 | 32 岗位名称:
Data Scientist 数据科学家
岗位描述:
数据事业部是隶属于阿里云的核心数据部门,承载阿里大数据战略的使命。数据事业部
-飞天一部的数据引擎团队负责阿里公有云和私有云项目的落地实施,同时推动建立大
数据生态,是数据事业部核心的团队。
算法技术与能力是阿里云最核心的竞争力,我们的愿景是通过最前沿的算法技术,帮助
客户挖掘数据价值,激发数据活力,将算法技术与能力转化为各个行业的商业价值。希
望有志于长期从事数据挖掘、机器学习的同学加入到我们团队,成长为行业算法专家,
用算法改变世界。
工作职责:
1.负责企业级大数据应用项目的算法规划、数据挖掘和模型设计,涉及到的技术包括深
度学习、强化学习、人工智能、文本处理等。
2.能深入理解行业需求与痛点,引导客户,发现其业务问题,并通过算法和模型解决业
务问题
3.承担部分政企项目POC实施、项目落地实施等。
岗位要求:
1. 三年以上数据挖掘项目经验,熟悉常用的数据挖掘与机器学习技术,有分布式
数据挖掘的实际经验为佳;
2. 统计、数学、计算机科学和通信电子类的硕士或博士学位。扎实的理论基础进
行统计,... 阅读全帖 |
|
m*****e 发帖数: 627 | 33 这个就是一个上网本吧。
够用了。
普通文本处理不会感觉到不爽。
看普通视频没问题,高清解码就算了 |
|
e******x 发帖数: 925 | 34 如果没有别的办法,可以先export sql文件,然后用文本编辑器全程替换。
再import到数据库里。 |
|
r*****e 发帖数: 4611 | 35 一般手提电脑的显卡没那么强,无法接3个的
一个方法是通过usb接显示器。amazon上有这样的产品,几十块钱吧。效果一般,看电
影会延迟,普通文本处理没问题。反正你看电影也会用另两个
还有个办法就是用台式机接三个显示,然后用手提电脑控制台式机。咳咳。。。 |
|
l******a 发帖数: 415 | 36 上次去某银行开个户,一进门就发现几台机器,只有一两个工作人员对客户进行引导,
不到十分钟就可以办理一个新的银行卡。
至于转账,汇款之类的操作,其实ATM机器已经可以完成绝大部分了。但是,一旦产生
了便利,就会有不法分子在进行诈骗的行为,打击互联网黑色产业势在必行。
至于出国的话,现在带一个翻译软件,基本上可以和外国人进行简单的交流。如果是十
年前的话,不会外语在国外基本上寸步难行。此时,语音识别技术,文本处理技术,数
据的人工收集,图像的打标签之类的工作就会促使一批人的就业。
目前自动贩卖机之类的实在是太多了,也很便利,基本上硬币,纸币,微信,支付宝都
可以付款购物。不过自动贩卖机还是有局限性,总有一些东西是自动贩卖机不会卖的,
通常还要去实体店买。对于自动贩卖机而言,其实物品的摆放顺序就类似互联网广告的
摆放顺序,如何摆放能够使得用户购买更多或者更合适的商品就是关键之处。因此,个
性化推荐系统其实就有了自己的用武之地。 个人感觉,人工智能在未来会对一些职业
产生冲击,但是也会促使一些职业的发展,会带来新的就业机会。其实就看个人处在什
么样的位置和拥有什么样的机遇了。
扩展:显然... 阅读全帖 |
|
e****e 发帖数: 158 | 37 代友发帖,一般国际杂志,需要1-2审稿人。
有兴趣请回站内信箱,提供些个人信息。
谢谢! |
|
e****e 发帖数: 158 | 38 自己顶一下。有兴趣审稿的请跟我站内联系,谢谢! |
|
d*****e 发帖数: 41 | 39 大多数东西现在就可拿走,
有少数还要用的,周4available(床,微波炉,吸尘器)。
住PV,欢迎来看,达赖那个赠品,多买多送。
价格也更新了,给不给力,同学们看了再说(欢迎砍价)
看来价格还算给力,现在还有
三星空调 制冷窗机, 5刀
脏衣服的框子 2个一共5刀
食物搅拌器(粉碎机) 5刀
桌椅一套(木的,2个凳子) 10刀
小桌子 3刀
显示器 thinkvision l220x 22寸,1920x1200, pva面板,文本处理很爽 100刀 (预订了)
765 496 4925
PV 204 - 6
谢谢
应版主要求改到一个帖子,据说有利版面整洁。 :) |
|
d*****e 发帖数: 41 | 40 更新一下东西,照片就不另外上了,这几天打包没时间了。
765 496 4925
PV 204 - 6
谢谢
Serta Rhone queen size 床垫,box和铁架子(可拆卸)100刀
32寸 sharp 液晶电视 720p (送电视柜和天线) 150$
显示器 thinkvision l220x 22寸,1920x1200, pva面板,文本处理很爽 100刀
三星空调,窗机,只有制冷和通风功能,1P,10刀
桌椅一套(2个凳子) 10$
打印机(lexmark x2690)打印扫描一体机(没墨了) 10刀
小桌子 3刀
台灯2个,黑白各一个,3刀一个,5刀两个
床头柜 5刀一个
脏衣服的框子 2个一共5刀
理发器 一套 10刀
粉碎机 5刀 |
|
b*s 发帖数: 82482 | 41 很简单:
打开TextEdit应用,File -> Open, 然后参照下图。一般中文纯文本是GBK,有时候也
会是Unicode。 |
|
w********e 发帖数: 8594 | 42 我的原则是,如果一件事情需要重复做20次以上,那就得考虑考虑用程序(或者类似程
序的东西)解决了。我经常用点ms office里的VBA干点简单的活儿。我看我女朋友做一
些文本处理的时候,经常手动地一个一个地改。唉,发现规律,然后用个稍微高级一些
的查找替换功能不就完事儿了?或者把操作记录成宏?每次我帮解决了问题,她就觉得
这个太好用了,太神奇了。下次却还是手动解决问题。我也不知道自己只是喜欢整这些
东西呢,还是这些东西真能提高效率。 |
|
H******7 发帖数: 34403 | 43 小坡的原则是,如果一件事情需要重复做20次以上,那就得考虑考虑用程序(或者类似
程序的东西)解决了。小坡经常用点ms office里的VBA干点简单的活儿。小坡看小坡女
朋友做一些文本处理的时候,经常手动地一个一个地改。唉,发现规律,然后用个稍微
高级一些的查找替换功能不就完事儿了?或者把操作记录成宏?每次小坡帮解决了问题
,她就觉得这个太好用了,太神奇了。下次却还是手动解决问题。小坡也不知道自己只
是喜欢整这些东西呢,还是这些东西真能提高效率。 |
|
a***y 发帖数: 19743 | 44 我最常用的软件列表2007-2008。。。。。
iPhoto, 08版改进很多,管理照片更方便,修改功能更强大
VisualHub视频转换的好东西
Keynotes,做Slideshow很好
iChat,和家里通话音质确实比skype强很多
Aperture,高级管理照片的东西
iCal,虽然不是最强大,但是很好用
Mail,虽然不是最强大,但是比Thunderbird等等还是好用
Numbers,只是纪录试验数据的话,排版很方便很灵活
Max,音频转换很强大很好用
Photo Booth,很好玩
Preview 很强大
Adium 同时上Yahoo, AIM, MSN, etc多账号很方便很漂亮很舒服
Cyberduck 免费FTP里面算最好的了
TextWrangler 免费文本处理,VIM之外比较好用的图形界面的
TranslateIt! 可用StarDict字典的翻译软件,大家必备喔
aMule 要电驴,这个是唯一选择
Azureus & Transmission BT的好东西
Aquamacs Emacs 要用Emacs这个我认为比较好,不过很久不用了
Flip4Mac 放W |
|
l******a 发帖数: 10467 | 45 indesign不需要很强阿, photoshop需要ram, 欧以前就是用powerbook g4 1g来处理图
片和用indesign cs3, 一点问题没有 |
|
d***a 发帖数: 13752 | 46 二代Macbook Air节能和散热都做得很好,一般上网和文本处理,机壳温度大约在32度
上下,不超过35度。 |
|
a***y 发帖数: 19743 | 47 苹果在Leopard的时候测试过vector的UI
但是貌似总是很难做到bitmap那样的精细,所以后来貌似决定还是坚持bitmap了。
如果是vector的UI就完美渲染就好了。
网页文字,文本文档文字这些,根本没有插值一说。本来就是矢量。 |
|
a***n 发帖数: 404 | 48 有个疑问。
Weka 好像它的输入文件必须是feature 列表,是不是这样啊?
但是Cluto好像就可以是similarity矩阵,这个在文本处理的时候,如果已经有了文档间
的similarity value,是不是就不太合适用Weka了?
用过Weka的指点下了。
多谢!! |
|
d*****u 发帖数: 17243 | 49 会python很有用,另外有些工作要求用Java
你上网站看看就知道了
我觉得学统计的人看懂一般的NLP算法都很容易
无非就是MaxEnt,Hidden Markov Model,各种Baysian network
你可以自己做一些小项目练习一下文本处理
推荐Speech and Language Processing这本书后面的习题 |
|