快捷导航
2 1953

加载更多 抓不到数据

vignylwn 于 2018-5-16 20:21 发表 [复制链接]
抓微博评论,有加载更多的选项,于是根据教程进行如下设置
微信图片_20180516201937.png
共有800+的评论,但是抓出来只有几十条,请大神帮忙看看是什么原因

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-5-21 16:32

Fuller 管理员 发表于 2018-5-16 22:17:32 | 显示全部楼层
我加载了你的规则,看到那个模拟点击查看更多的爬虫路线没有了。反而增加了连续动作滚屏。这个不太合适

续动作滚屏通常是用于没有底的瀑布流的,每滚一次抓取一次,会产生好多结果文件。而这个场景适合用DS打数机的自动滚屏,用菜单 配置-》滚屏参数进行设置,把滚屏次数设置成大于0的数字,比如,8,就能开启滚屏。

还是需要定义个爬虫路线,用于翻页,虽然叫“查看更多”,其实跟 “下一页”一样。

另外,爬微博评论有现成的采集工具,不用做规则。参看:https://www.gooseeker.com/land/weibo.html
举报 使用道具
vignylwn 新手上路 发表于 2018-5-21 16:32:56 | 显示全部楼层
Fuller 发表于 2018-5-16 22:17
我加载了你的规则,看到那个模拟点击查看更多的爬虫路线没有了。反而增加了连续动作滚屏。这个不太合适

续 ...

好的,感谢您!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 用Jupyter Notebook的模板管理数据分析过程
  • Jupyter Notebook在机器学习领域的项目目录
  • 统计学中的二项分布、负二项分布、几何分布
  • 连续动作:自动搜索关键词采集信息—以人民
  • 利用重加载防止采集微博博主消息列表中断

热门用户

GMT+8, 2021-2-25 18:33