Text Mining question, Please help - Statistics版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - Text Mining question, Please help

相关主题
● SAS Text Miner	● Sas enterprise miner是干什么的？
● Have anyone used WEKA?	● 请问有人用过SAS Text Mining吗?
● 谈谈找夏天实习的经历	● 【请教】关于Text mining
● 请教做 Health Insurance Claim Data Mining 的大牛如何入门的问题	● Text datamining 是用Perl好还是Python好？
● 请问SAS 里能run SVM吗？	● 统计SAS大侠请看一下这个图。谢谢了先。
● SAS for Windows 7 64-bit	● [合集] 关于SAS certificate 在找工作中的作用
● 打算考SAS ENTERPRISE MINER，不知道有啥好的教材	● which procedure in SAS for neural network?
● 该让公司买什么软件	● contract job in bank - $35 per hour without benefits

相关话题的讨论汇总
话题: text话题: mining话题: sas话题: caratclean

进入Statistics版参与讨论

1

(共1页)

K***a 发帖数: 72	1 In the data sample below, I’m trying to derive the fields (Clarity, ColorAltClean, CaratClean, etc) from the Description field above it, the description is for diamond product. We have SAS Enterprise Miner, but don’t have text miner, is there any good SAS tool can accomplish this task? Description Platinum 1.10ct Round I1 I Sds.32ct Baguettes IGI Cert 31302436 Clarity ColorAltClean CaratClean Shape CertAgent CERTNUMClean I1 I 1.10 Round IGI 31302436
Y****a 发帖数: 243	2 这跟text mining沾不上边儿吧，顶多算data import from file SAS里不是有fixed width读数据的方法吗，或者separate by space 实在不行，数据又不大的话，先读到excel里，用空格做分割符，然后再导入SAS
K***a 发帖数: 72	3 谢谢YueJia回复。也许只有用SAS code解决了。本来想试试能不能在text mining领域找到更简单和更适合长期应用的方法。
d********i 发帖数: 193	4 可以考虑用regular expressions来parse data
K***a 发帖数: 72	5 谢谢端阳。还有其它办法吗？
z******n 发帖数: 397	6 正则表达式最好了，为啥还要其他方法【在 K***a 的大作中提到】 : 谢谢端阳。还有其它办法吗？
f********1 发帖数: 228	7 不知道整体data的情况，从给的例子猜测，可能是把每个第四行的data用空格做分隔符读出来。Linux下可以用awk command http://superuser.com/questions/396536/how-to-keep-only-every-nt regular expression也是很好的方法

1

(共1页)

进入Statistics版参与讨论

相关主题
● contract job in bank - $35 per hour without benefits	● 请问SAS 里能run SVM吗？
● Anybody interested in buying these SAS books?	● SAS for Windows 7 64-bit
● 有没有搞marketing的正搞数据挖掘？	● 打算考SAS ENTERPRISE MINER，不知道有啥好的教材
● 问个SAS enterprise的问题	● 该让公司买什么软件
● SAS Text Miner	● Sas enterprise miner是干什么的？
● Have anyone used WEKA?	● 请问有人用过SAS Text Mining吗?
● 谈谈找夏天实习的经历	● 【请教】关于Text mining
● 请教做 Health Insurance Claim Data Mining 的大牛如何入门的问题	● Text datamining 是用Perl好还是Python好？

相关话题的讨论汇总
话题: text话题: mining话题: sas话题: caratclean

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)