b******d 发帖数: 794 | 1 很多购物网站提供库存查询,甚至可以查到local inventory,怎么来自动对这些数据进
行查询?
c#里面可以自己生成个web browswer, 然后分析返回的页面信息;java怎么做?有什么
快速(不需要inherit web broswer)的方法吗? |
g*****g 发帖数: 34805 | 2 html Unit.
据进
【在 b******d 的大作中提到】 : 很多购物网站提供库存查询,甚至可以查到local inventory,怎么来自动对这些数据进 : 行查询? : c#里面可以自己生成个web browswer, 然后分析返回的页面信息;java怎么做?有什么 : 快速(不需要inherit web broswer)的方法吗?
|
b******d 发帖数: 794 | 3 还是bug家的给面子阿,能不能展开讲讲。
你那个mit包子机怎么实现的?
【在 g*****g 的大作中提到】 : html Unit. : : 据进
|
g*****g 发帖数: 34805 | 4 自己反编译看就是了。源码就俩三文件。
【在 b******d 的大作中提到】 : 还是bug家的给面子阿,能不能展开讲讲。 : 你那个mit包子机怎么实现的?
|
e*****t 发帖数: 1005 | 5 selenium 2 (webdriver) is also easy to use.
【在 g*****g 的大作中提到】 : 自己反编译看就是了。源码就俩三文件。
|
b******d 发帖数: 794 | 6 谢谢两位, 不知道这两个对付js,ajax之类的谁更好用点?
作为一个standalone app而不是一个test case呢?哪个更合适?
【在 e*****t 的大作中提到】 : selenium 2 (webdriver) is also easy to use.
|
e*****t 发帖数: 1005 | 7 都行。不用管js/ajax,归根到底都是http request。弄清楚http interaction就差不多
了,可以直接模拟。
【在 b******d 的大作中提到】 : 谢谢两位, 不知道这两个对付js,ajax之类的谁更好用点? : 作为一个standalone app而不是一个test case呢?哪个更合适?
|
b******d 发帖数: 794 | 8 谢谢,看了一下,有两个问题
1. 好像对数据的查询必须知道target的name,比如form;js什么的都是动态生成这些nam
e, 文件又大,源程序又在另外地方,找起来好费劲,有没有什么快速定位的好方法?
2.如果模拟一个提交动作,怎么知道提交是否成功?好像doc上说就是啥等几秒。可是等
的短了长乐都不合适,有没有反馈可以监测是否成功获得反馈页面,比如listener或者
onload之类的可以用吗?
不多
【在 e*****t 的大作中提到】 : 都行。不用管js/ajax,归根到底都是http request。弄清楚http interaction就差不多 : 了,可以直接模拟。
|
e*****t 发帖数: 1005 | 9 想简单、直接,就直接simulate http request,parse http response.
如果不是很明白底层的,parse dom也可以。不懂你的onload或者listner指的什么,你
是说得javascript么?java不是那么处理的。
nam
是等
【在 b******d 的大作中提到】 : 谢谢,看了一下,有两个问题 : 1. 好像对数据的查询必须知道target的name,比如form;js什么的都是动态生成这些nam : e, 文件又大,源程序又在另外地方,找起来好费劲,有没有什么快速定位的好方法? : 2.如果模拟一个提交动作,怎么知道提交是否成功?好像doc上说就是啥等几秒。可是等 : 的短了长乐都不合适,有没有反馈可以监测是否成功获得反馈页面,比如listener或者 : onload之类的可以用吗? : : 不多
|
b******d 发帖数: 794 | 10 selenium的什么接口可以直接处理http response?
onload是指js的, htmlunit里面可以直接响应处理这个事件。
假如我提交一个form, 怎么才能知道server返回了一个http response呢?
【在 e*****t 的大作中提到】 : 想简单、直接,就直接simulate http request,parse http response. : 如果不是很明白底层的,parse dom也可以。不懂你的onload或者listner指的什么,你 : 是说得javascript么?java不是那么处理的。 : : nam : 是等
|
|
|
e*****t 发帖数: 1005 | 11 http://docs.oracle.com/javase/6/docs/api/java/net/package-summa
你还是从基础开始吧。
【在 b******d 的大作中提到】 : selenium的什么接口可以直接处理http response? : onload是指js的, htmlunit里面可以直接响应处理这个事件。 : 假如我提交一个form, 怎么才能知道server返回了一个http response呢?
|
b******d 发帖数: 794 | 12 赛,还是socket编程阿,那你推荐的selenium怎么用呢?
【在 e*****t 的大作中提到】 : http://docs.oracle.com/javase/6/docs/api/java/net/package-summa : 你还是从基础开始吧。
|
e*****t 发帖数: 1005 | 13 webdriver can easily parse and manipulate DOM.But I don't think that's what
you needed.
【在 b******d 的大作中提到】 : 赛,还是socket编程阿,那你推荐的selenium怎么用呢?
|
b******d 发帖数: 794 | 14 分析页面是一个需求,自动化网页浏览也是一个,htmlunit好像不能返回请求是否成功
,需要自己暂停一个时间,很不方便。webdriver还没有仔细看
what
【在 e*****t 的大作中提到】 : webdriver can easily parse and manipulate DOM.But I don't think that's what : you needed.
|
b******d 发帖数: 794 | 15 发现htmlunit也可以返回请求页面,不过现在访问一个页面老是报告这些warning, 有没
有办法去掉?
Oct 10, 2012 1:15:41 AM com.gargoylesoftware.htmlunit.IncorrectnessListenerI
mpl notify
WARNING: Obsolete content type encountered: 'text/javascript'.
Oct 10, 2012 1:15:41 AM com.gargoylesoftware.htmlunit.DefaultCssErrorHandler
error
WARNING: CSS error: 'http://RSK.imageg.net/include/store.css' [324:75] Error
in style rule. (Invalid token "*". Was expecting one of: , ,
>, "}", ";".)
Oct 10, 2012 1:15:41 AM com.gargoylesoftware.htmlunit.DefaultCssErrorHandler
warning
what
【在 e*****t 的大作中提到】 : webdriver can easily parse and manipulate DOM.But I don't think that's what : you needed.
|
g*****g 发帖数: 34805 | 16 这个难道不是改改Log4j设置就解决了吗?
有没
IncorrectnessListenerI
DefaultCssErrorHandler
IDENT
【在 b******d 的大作中提到】 : 发现htmlunit也可以返回请求页面,不过现在访问一个页面老是报告这些warning, 有没 : 有办法去掉? : Oct 10, 2012 1:15:41 AM com.gargoylesoftware.htmlunit.IncorrectnessListenerI : mpl notify : WARNING: Obsolete content type encountered: 'text/javascript'. : Oct 10, 2012 1:15:41 AM com.gargoylesoftware.htmlunit.DefaultCssErrorHandler : error : WARNING: CSS error: 'http://RSK.imageg.net/include/store.css' [324:75] Error : in style rule. (Invalid token "*". Was expecting one of: , , : >, "}", ";".)
|
b******d 发帖数: 794 | 17
没用过log4j, 就是eclipse输出的warning.
是不是htmlunit内部进行的格式检查,有什么办法可以turn off?
【在 g*****g 的大作中提到】 : 这个难道不是改改Log4j设置就解决了吗? : : 有没 : IncorrectnessListenerI : DefaultCssErrorHandler : IDENT
|
b******d 发帖数: 794 | 18 另外请教一下,怎么获得没有id/name的table, 好像htmlpage只能获得getElementById
啥的,我这个table什么特征都没有,怎么找到他,还是就作为text搜索,可是搜到之后
,后面的结构也不好搜索了
还有table套table的如何准确定位里面的table, 也是没有id/name的,比如这个
http://RSK.imageg.net/image
s/pixel.gif" width="11" height="1" border="0" /> |
SOLON-SOLON SHOP CTR
01-4244 | 5.82 miles*
http://RSK.imageg.net/images/rsk_h
eader_arrow.gif" border="0" width="3" height="7" alt="" /> See a map
<
table width="100%" cellpadding=0 cellspacing=0 border=0 align="cen
ter">
|
|
Store Hours: |
|
Mon-Thu 10 am - 8 pm Friday 10:00 am -
8:30 pm Saturday 10 am - 8 pm Sunday 9:30 am - 7:00
pm |
table>
|