boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - 新手请教如何抓blog data的问题
相关主题
用LTL能表达(a b)*吗?
哪位帮忙看一下lex程序,涉及汉字编码,不知道问题出哪里。
请教大牛个问题:工程上实现了个算法,能否发个paper玩玩 (转载)
[转载] How to minimize this variance?
python or perl?
[合集] 现在学啥scripting language比较好?
perl和python到底哪个好?
紧急求助:怎么批处理修改几百个文件的文件名?
Perl 和 python 哪个更值得学阿?
请问perl初学者最开始看那本书好
相关话题的讨论汇总
话题: blog话题: data话题: 新手话题: 例如话题: 指点
进入CS版参与讨论
1 (共1页)
E*****9
发帖数: 32
1
转系到CS,好多东西都不懂.
导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
万分感谢!!!
r***u
发帖数: 241
2
虽然没用过Python,但感觉python应该会不错,上手比较容易,库也很多

【在 E*****9 的大作中提到】
: 转系到CS,好多东西都不懂.
: 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
: 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
: 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
: google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
: 万分感谢!!!

l********0
发帖数: 283
3
这种程序的主要功能点是:httpclient,String parse
在正则表达式方面强的语言适合做这个,比如Java,Perl,等

【在 E*****9 的大作中提到】
: 转系到CS,好多东西都不懂.
: 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
: 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
: 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
: google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
: 万分感谢!!!

j****a
发帖数: 1277
4
从一些大的blog网站入手应该会容易一些把 站点结构都类似

【在 E*****9 的大作中提到】
: 转系到CS,好多东西都不懂.
: 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
: 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
: 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
: google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
: 万分感谢!!!

E*****9
发帖数: 32
5
谢谢大家啊,可以再具体点么?

【在 E*****9 的大作中提到】
: 转系到CS,好多东西都不懂.
: 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
: 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
: 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
: google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
: 万分感谢!!!

l********0
发帖数: 283
6
还要怎么具体?

【在 E*****9 的大作中提到】
: 谢谢大家啊,可以再具体点么?
r*******n
发帖数: 3020
7
我用过Python抓过google排名前50的连接,每一个小时抓一次,
比较结果有什么变化。
用到urllib, 正则表达式

【在 E*****9 的大作中提到】
: 谢谢大家啊,可以再具体点么?
E*****9
发帖数: 32
8
嗯,谢谢~我去努力研究~~

【在 E*****9 的大作中提到】
: 转系到CS,好多东西都不懂.
: 导师让简单实现一下抓自己blog上的data,例如post, profile, friends list之类的东
: 西.之后可能要大范围的抓数据.大家懂的可以指点一下大致方向吗,例如用那种语言比
: 较容易实现,如果不是只单纯抓一个网页上的,还要历史posts呢?
: google, baidu都用了,但搜到的都在杂了,有人可以指点一下.
: 万分感谢!!!

1 (共1页)
进入CS版参与讨论
相关主题
请问perl初学者最开始看那本书好
诚心请教大data set到底该怎么分析? (转载)
How to Parsing function in Haskell?
请问tracert的结果是什么意思?
[转载] 求教高手:如何用程序实现递归函数的一般表达式?
表达式求值问题
请教个函数表达式
如何求解方程2*x^3+10*x^2=3?? (转载)
解释程序怎么写?
[5个包子] 请教C/C++读取文件的遇到的问题
相关话题的讨论汇总
话题: blog话题: data话题: 新手话题: 例如话题: 指点