|
第二个规则,翻页规则用了记号线索类型,用的方法不对,应该是- 首先要做线索映射,
- 把网页上代表翻页区的div节点做 线索-》定位 映射给他,相当于先划一个区域
- 然后再做记号映射。
- 最后再点击“定位选项”,选择优选class
为什么要做“定位选项”设置,那时因为自动选择的@id构造的xpath不合适,手工可以干预是否选择@id或者@class,在“线索规则”窗口能够看到选择以后的变化。其它翻页问题参看集锦:http://www.gooseeker.com/doc/thread-698-1-1.html
你原先的第二个规则,翻页到很少页面就会结束翻页了,你可以观察一下。
我看到还有一个地方可以改进:抓取内容 url 没有必要写自定义xpath,在DOM树窗口中选中href节点做映射即可。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 3 个关于本帖的回复 最后回复于 2016-6-20 14:16