由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请问哪有用python处理文本或者html的code
相关主题
perl的文本处理大部分容易在python里实现吗?python 正则表达式请教
cygwin里的python可以用Windows的odbc吗?那位大侠介绍一下python的webcrawler吧
请教一个perl的问题 (转载)python能检查出space是一个还是两个吗?
问个grep正则匹配的问题 (转载)parsing file in node: js or python ?
问个关于正则表达式的超弱智问题...文本分析,document_term matrix求解。
正则表达式里括号的转义好乱文本信息搜索
为什么一说文本处理就提perl如何用Python或者Perl抓取文本?
[合集] 统一的regex (grep, sed, awk, python,..)请问Python初学者怎么学
相关话题的讨论汇总
话题: python话题: 文本话题: 处理话题: code话题: html
进入Programming版参与讨论
1 (共1页)
F****3
发帖数: 1504
1
根据大家建议看了看python入门的书,但是有点抽象。希望看看sample code,主要是
关于处理文本的,除了activestate以外还有什么地方有很多code吗?
l********a
发帖数: 1154
2
Text Processing in Python
http://gnosis.cx/TPiP/
w****k
发帖数: 6244
3
pypi

【在 l********a 的大作中提到】
: Text Processing in Python
: http://gnosis.cx/TPiP/

d**o
发帖数: 864
4
处理html可以用beautifulsoup
处理文本,看你要做什么的,不过regular expression一定要学的。

【在 F****3 的大作中提到】
: 根据大家建议看了看python入门的书,但是有点抽象。希望看看sample code,主要是
: 关于处理文本的,除了activestate以外还有什么地方有很多code吗?

F****3
发帖数: 1504
5
谢谢!!
请问如果只是简单的搜索很多txt文件,然后把关键词周围的句子提取出来。像这样的
code一般那里有呢?
e*******o
发帖数: 4654
6
就是折腾正则式,千变万化,你针对自己的需要来写。
如果是要关键词所在的行,grep,ack 之类的就可以了。不过你还是学点编程为好,老
是想着现成的代码哪行。

【在 F****3 的大作中提到】
: 谢谢!!
: 请问如果只是简单的搜索很多txt文件,然后把关键词周围的句子提取出来。像这样的
: code一般那里有呢?

F****3
发帖数: 1504
7
说得有道理,主要是书看起来太抽象了。。。 想看看别人的练练手 :)
l*******s
发帖数: 1258
8
是想抄作业吧
回去问TA去
F****3
发帖数: 1504
9
呵呵,不是。干活儿要用。
我们学校NLP的课程要秋天才有。现在只能听网上课程。

【在 l*******s 的大作中提到】
: 是想抄作业吧
: 回去问TA去

1 (共1页)
进入Programming版参与讨论
相关主题
请问Python初学者怎么学问个关于正则表达式的超弱智问题...
你们这些python黑正则表达式里括号的转义好乱
学学PYTHON为什么一说文本处理就提perl
网上哪里有实现算法的联系题?[合集] 统一的regex (grep, sed, awk, python,..)
perl的文本处理大部分容易在python里实现吗?python 正则表达式请教
cygwin里的python可以用Windows的odbc吗?那位大侠介绍一下python的webcrawler吧
请教一个perl的问题 (转载)python能检查出space是一个还是两个吗?
问个grep正则匹配的问题 (转载)parsing file in node: js or python ?
相关话题的讨论汇总
话题: python话题: 文本话题: 处理话题: code话题: html