集搜客GooSeeker网络爬虫
标题:
规则2是什么意思?
[打印本页]
作者:
小蜜蜂a
时间:
2017-10-12 11:08
标题:
规则2是什么意思?
规则2是什么意思?
作者:
wangyong
时间:
2017-10-12 11:36
在采集网页时,有时候会遇到同一个网站展示同类信息的页面有多种网页结构。
在做采集规则时需要每种结构需要做一个采集规则,但是又是同类信息中的不同网页结构,所以就用同一个规则名规则编号编号不同实现。
比如在淘宝中搜索关键词,展示的商品有天猫的数据也有淘宝的数据,在做第二级规则时就可以淘宝用规则1天猫有规则2。参考教程
《怎样采集同一网站的不同网页结构信息》
要注意的是只有网页结构区别很大的时候才需要用到规则1,规则2,在这之前可以通过做
定位标志映射
和
自定义xpath
来提供规则适应性。
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2