爬出来全是第一页的。。




请问是哪里出错了呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2018-1-9 22:21

沙发
Fuller 管理员 发表于 2018-1-9 22:21:07 | 只看该作者
我加载你的规则测试了一下,有两个问题
1,在“创建规则”工作台上,做样例复制映射的时候没有选择第一条和第二条做映射,而是选择了第二条和第三条做映射,会漏抓数据
2,在“爬虫路线”工作台上,加载了你的规则以后,发现线索的定位编号和记号的定位编号都定位到了另一个地方,原来在网页上有一个完全相同结构的dom节点,翻页点击的时候就会误点那里。

你加载规则以后,重新做定位映射和记号映射,然后点击“爬虫路线”工作台上的“定位偏好”按钮,选择偏好id,真正你想点的那个翻页按钮具有特殊id,选择了偏好id以后就会使用那个特殊id。

另外,运行DS打数机的时候,应该选择菜单 配置-》定时器触发,否则,抓取这个网页会很慢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-12 03:54