由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
BuildingWeb版 - 如何让自己的网站抓取网页信息?(嵌套浏览器?)
相关主题
如何在程序里访问需要注册才能看的网页?问个用php抓网页的问题
大家现在都是用什么抓取网页数据?怎么让访问我网站的浏览器自动从其他网站抓数据传给服务器
抓网页的法律问题请教一个网站实现问题
请教一个问题:在点浏览器back按钮的时候,Re: 请教,我不想让别人从网站上下载文件(.doc,.xls等),但这些文件可以在
也show一下我的网站如何让别人可以在我的网站上填表格,post到网页上
测试网页浏览器兼容性的好工具有没有这样的网站 search-of-search ?
我的新闻聚合网站,请拍转!what is cgi?
怎么在浏览器里把网页的背景音关掉?贡献一个email validator RegExp
相关话题的讨论汇总
话题: 抓取话题: 网站话题: 信息话题: 嵌套话题: 浏览器
进入BuildingWeb版参与讨论
1 (共1页)
b**********6
发帖数: 199
1
本人非CS专业,语言组织可能不太到位。
目标:客户通过自己的网站登陆其他网站,比如overstock.com,在顾客选择好商品后
抓取所选商品的信息
是做一个网站内的嵌套浏览器还是有别的好办法?比如像www.hidemyass.com?
谢谢!
g****z
发帖数: 1135
2
和第三方没有类似api的协议,不好办。
n*****t
发帖数: 22014
3
curl

【在 b**********6 的大作中提到】
: 本人非CS专业,语言组织可能不太到位。
: 目标:客户通过自己的网站登陆其他网站,比如overstock.com,在顾客选择好商品后
: 抓取所选商品的信息
: 是做一个网站内的嵌套浏览器还是有别的好办法?比如像www.hidemyass.com?
: 谢谢!

s****y
发帖数: 983
4
不如说说你到底是想要干啥
b******y
发帖数: 9224
5
别想了,这种行不通。因为对方一变化,你这儿就需要重新编程。
b**********6
发帖数: 199
6
能详细讲讲怎么用curl吗?谢谢!

【在 n*****t 的大作中提到】
: curl
b**********6
发帖数: 199
7
自己做网站的话,还要做数据库,很多网页,所以想了个懒办法。借用一个平台,抓取
别的网站商品信息

【在 s****y 的大作中提到】
: 不如说说你到底是想要干啥
s****y
发帖数: 983
8
呃呃呃,你要做的是数据采集啊。可以用curl抓取自己写regex抓信息,或者推荐你研究
一下国产的火车头.
但是你懒不了啊,最后估计还是要用数据库. 抓到了信息你怎么用?不会是学雷锋帮人家
卖东西吧

【在 b**********6 的大作中提到】
: 自己做网站的话,还要做数据库,很多网页,所以想了个懒办法。借用一个平台,抓取
: 别的网站商品信息

g****z
发帖数: 1135
9
他要抓取的是对方网站上用户通过嵌入网站的浏览信息,curl用不上的。

【在 s****y 的大作中提到】
: 呃呃呃,你要做的是数据采集啊。可以用curl抓取自己写regex抓信息,或者推荐你研究
: 一下国产的火车头.
: 但是你懒不了啊,最后估计还是要用数据库. 抓到了信息你怎么用?不会是学雷锋帮人家
: 卖东西吧

b**********6
发帖数: 199
10
谢谢你的回答。查了一下国产的火车头,好像只能抓取静态网页信息。抓到信息后存进
自己的数据库,然后帮厂家买给顾客。

【在 s****y 的大作中提到】
: 呃呃呃,你要做的是数据采集啊。可以用curl抓取自己写regex抓信息,或者推荐你研究
: 一下国产的火车头.
: 但是你懒不了啊,最后估计还是要用数据库. 抓到了信息你怎么用?不会是学雷锋帮人家
: 卖东西吧

b**********6
发帖数: 199
11
嗯,就是这个目的

【在 g****z 的大作中提到】
: 他要抓取的是对方网站上用户通过嵌入网站的浏览信息,curl用不上的。
1 (共1页)
进入BuildingWeb版参与讨论
相关主题
贡献一个email validator RegExp也show一下我的网站
做 blog 的各位测试网页浏览器兼容性的好工具
about .htaccess我的新闻聚合网站,请拍转!
请教有关iframe的问题怎么在浏览器里把网页的背景音关掉?
如何在程序里访问需要注册才能看的网页?问个用php抓网页的问题
大家现在都是用什么抓取网页数据?怎么让访问我网站的浏览器自动从其他网站抓数据传给服务器
抓网页的法律问题请教一个网站实现问题
请教一个问题:在点浏览器back按钮的时候,Re: 请教,我不想让别人从网站上下载文件(.doc,.xls等),但这些文件可以在
相关话题的讨论汇总
话题: 抓取话题: 网站话题: 信息话题: 嵌套话题: 浏览器