集搜客GooSeeker网络爬虫

标题: 怎么提高规则的适应性? [打印本页]

作者: a798234780    时间: 2017-9-1 18:17
标题: 怎么提高规则的适应性?
本帖最后由 a798234780 于 2017-9-1 18:21 编辑

我层级采集第二层信息,通过第一层采了7千多条信息,然后用第二层规则采集第二层信息,成功率只有10%的样子

作者: huzhongshun11    时间: 2017-9-1 18:20
1.抓取内容做定位映射标志。

2.网页上没有@class, @id这样可用的定位标志可以用自定义XPath



3.这里详细讨论了这个问题 《提高规则适应性的方法》





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2