集搜客GooSeeker网络爬虫

标题: 怎样采集分页列表里面连接的信息 [打印本页]

作者: 胡长昱    时间: 2016-11-1 15:12
标题: 怎样采集分页列表里面连接的信息
分页列表里边连接的信息,要怎么采集?

作者: scraper    时间: 2016-11-1 15:14
首先采集分页列表信息,需要用到翻页线索,教程见《翻页采集列表
还要采集每个列表的链接里边的信息,就需要把链接采集下来做层级抓取,教程见《采网址做层级抓取

作者: 胡长昱    时间: 2016-11-1 15:14
scraper 发表于 2016-11-1 15:14
首先采集分页列表信息,需要用到翻页线索,教程见《翻页采集列表》
还要采集每个列表的链接里边的信息,就 ...

那就是需要做两个规则?怎么把两个规则的数据放在一起?

作者: scraper    时间: 2016-11-1 15:16
胡长昱 发表于 2016-11-1 15:14
那就是需要做两个规则?怎么把两个规则的数据放在一起?

首先要把xml转换成excel,教程见《xml转换为excel
再把两个excel表格合并在一起,教程见《如何在excel中合并多层级采集结果






欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2