看了之前的解决帖子,但是是老版的,新版的页面好像不一样,找不到之前的解决方法
https://www.gooseeker.com/doc/thread-13112-1-1.html
附 看的相关的回答



之前用过翻页页码 也只能爬到1,2页

求 解答!!

image.jpg (187.37 KB, 下载次数: 441)

image.jpg
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2022-4-9 18:51

沙发
Fuller 管理员 发表于 2022-4-9 09:20:45 | 只看该作者
你的规则名是什么?发出来我检查一下看看
举报 使用道具
板凳
Fuller 管理员 发表于 2022-4-9 18:51:17 | 只看该作者
目前新版本数据管家生成翻页规则的时候有个bug,爱彼迎网站上的翻页按钮是一个svg节点,而不是html节点,自动生成的翻页规则有bug,那么,可以定义连续点击规则,用点击来翻页,而不用翻页规则,因为点击使用的xpath是手工生成的,就不会有bug

第一步:生成点击用的xpath
如下图,选中下一页按钮那个svg节点,点击“偏好class”按钮生成xpath,需要把生成的xpath修改一下,增加一个条件[@aria-label="下一个"],这样整个xpath就变成了:
  1. //*[@class='_ni9axhe']/nav//svg:svg[@aria-label="下一个"]
复制代码
填入点击动作的交互位置输入框。

第二步:设置高级选项
因为网页上只有一个下一页按钮,但是,又想让点击动作点很多次,就需要高级设置,在重复次数那里设置一个比较大的数字,如上图,设置了100

第三步:设置重复内容中断
因为点击动作设置了重复次数,如果翻页到底了,想早点结束,应该设置重复内容中断。如果是手工启动的采集,就如下图设置该参数。如果是自动的爬虫群采集模式,就要在任务的调度参数设置界面上设置这个参数。

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 16:57