设置了两个规则,第一级规则采集网页上的链接,第二级规则采集所链接的网页内容,但是链接有很多页所以在第一级规则设置了翻页采集,步骤应该没问题,但是显示自身翻页只爬出了第一页的链接,求解

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-3-30 21:52

沙发
ym 版主 发表于 2017-3-30 21:52:50 | 只看该作者
本帖最后由 ym 于 2017-3-30 21:54 编辑

直接测试你的第一级规则,翻页没有问题。
你说只翻了一页,要么是网速问题,要么你是用爬虫群采集,规则的调度设置了同一线索内翻页次数为1,这种情况要改为不限制就好了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-26 01:53