o****g 发帖数: 174 | 1 公司有一个project 是爬虫(crawl) wechat, 找出相关某个产品的文章,并计算相关某
个产品的文章的数目。请问有没有可能爬虫wechat? 如果能,怎么爬虫wechat? |
d*******n 发帖数: 43 | 2 没有能不能 只有难不难
爬虫说到底还是模拟 看你怎么模拟了 |
o****g 发帖数: 174 | 3 多谢。怎么模拟。主要这是一个apple 的app 怎么爬呢?得在mac 系统里爬吧?怎么爬
?在windows 系统下能爬吗?
【在 d*******n 的大作中提到】 : 没有能不能 只有难不难 : 爬虫说到底还是模拟 看你怎么模拟了
|
x********9 发帖数: 208 | |
f****n 发帖数: 399 | 5 你这是爬公众号的文章吧
[在 oovbbg (Old Old Virgin, Big Big Girl) 的大作中提到:]
:公司有一个project 是爬虫(crawl) wechat, 找出相关某个产品的文章,并计算相关
某个产品的文章的数目。请问有没有可能爬虫wechat? 如果能,怎么爬虫wechat? |
o****g 发帖数: 174 | 6 是的,爬公众号的文章怎么爬?多谢!
【在 f****n 的大作中提到】 : 你这是爬公众号的文章吧 : [在 oovbbg (Old Old Virgin, Big Big Girl) 的大作中提到:] : :公司有一个project 是爬虫(crawl) wechat, 找出相关某个产品的文章,并计算相关 : 某个产品的文章的数目。请问有没有可能爬虫wechat? 如果能,怎么爬虫wechat?
|
z*********n 发帖数: 1451 | 7 wechat有api就能爬啊,跟网页区别不大吧,你觉着难点在哪?会被wechat当ddos
block了吗? |
e*******o 发帖数: 4654 | |
s******r 发帖数: 267 | |
R*********4 发帖数: 293 | 10 当然有可能,
【1】uwp或者wpf应用,
你可以加个 webview, 然webview去登陆webchat
然后用 invokescript 和 notify 让自己得程序和webchat通信
【2】chrome 或者 firefox
你也以 extension得形式和webchat通信
即使是这两种方法,也需要Dynamic Proxy才能实现
楼上有个人说api, 但现在api可以通过各种复杂token避免攻击得,比如次数限制,ip
限制,设备限制等
无非就是 parse html, parse json, GET, POST
只是如果想以服务器得模式,会有困难,现在webchat验证是比较严得 |
b***e 发帖数: 1 | 11 用chrome extension的话,可以考虑使用http://www.swiftformatter.com/webpage,安装之后可以自己写JS code来实现网页操作。好处是不用再从头实现完整的chrome extension了。 |