集搜客GooSeeker网络爬虫

标题: 层级采集问题 [打印本页]

作者: jiangsuxincheng    时间: 2017-7-4 11:31
标题: 层级采集问题
[attach]6920[/attach]我要采集这样的网站信息 http://218.94.78.91:19001/REG/f/announcement/announcementShow,我的第一级规则名建设项目,第二级规则名建设项目2,爬虫采集的时候第一级采集全采集下来了,第二级采集只是其中我做规则的那条信息,请帮忙看一下,我也是根据教程采网址做层级采集——以大众点评为例来学习的。总觉得抓取数据哪里不对

作者: jiangsuxincheng    时间: 2017-7-4 11:39
我看了下应该是我爬取的时候没有改线索数量
作者: jiangsuxincheng    时间: 2017-7-4 11:39
网页数
作者: shengchengx    时间: 2017-7-4 11:45
jiangsuxincheng 发表于 2017-7-4 11:39
网页数

只抓了一个可能没有更改单搜的线索数呢
然后你这边翻页没有做呢


作者: jiangsuxincheng    时间: 2017-7-4 11:46
我刚学习只是根据教程测试下,所以没翻页,谢谢你了




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2