请问各位大佬,这种弹出的窗口应该如何设置爬取评论?
设置了滚屏但是滚动的是底下的页面而不是上层弹出的页面。
规则名Shalom_mover
爬取页面链接:
https://www.google.com/search?q= ... :0xc594c8faf20e4be8,1

如果有大佬帮忙解答,非常感谢!!
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2021-5-5 22:17

沙发
Fuller 管理员 发表于 2021-5-5 22:17:21 | 只看该作者
用点击动作弹出浮窗以后,就要用滚轮动作进行局部滚屏,参看:https://www.gooseeker.com/doc/article-408-1.html ,这个教程虽然是针对老版本爬虫软件写的,新版本的数据管家也支持滚轮动作。不过滚轮动作只有旗舰版才能用。
采集这个网页的难度应该在于:
1,不知道该设置滚轮滚多少比较合适。有些评论多,有些评论少,就很难设置一个合适的数字。
2,另外就是定义动作顺序需要一个技巧:第一级定义两个点击动作,第一个点击动作是点击关闭浮窗的×号;第二个动作才是点击一个链接显示新浮窗。这有点不太符合直觉。第二级规则负责滚轮

另外,如果每个话题的所有评论有独立网址,那就尽量采用层级采集,而不是用点击动作弹出浮窗。层级采集速度快,更稳定
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 13:18