集搜客GooSeeker网络爬虫

标题: 规则2是什么意思? [打印本页]

作者: 小蜜蜂a    时间: 2017-10-12 11:08
标题: 规则2是什么意思?
规则2是什么意思?

作者: wangyong    时间: 2017-10-12 11:36
在采集网页时,有时候会遇到同一个网站展示同类信息的页面有多种网页结构。

在做采集规则时需要每种结构需要做一个采集规则,但是又是同类信息中的不同网页结构,所以就用同一个规则名规则编号编号不同实现。

比如在淘宝中搜索关键词,展示的商品有天猫的数据也有淘宝的数据,在做第二级规则时就可以淘宝用规则1天猫有规则2。参考教程《怎样采集同一网站的不同网页结构信息》

要注意的是只有网页结构区别很大的时候才需要用到规则1,规则2,在这之前可以通过做定位标志映射自定义xpath来提供规则适应性。





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2