2 6586

加载更多 抓不到数据

vignylwn 于 2018-5-16 20:21 发表 [复制链接]
抓微博评论,有加载更多的选项,于是根据教程进行如下设置
微信图片_20180516201937.png
共有800+的评论,但是抓出来只有几十条,请大神帮忙看看是什么原因

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2018-5-21 16:32

Fuller 管理员 发表于 2018-5-16 22:17:32 | 显示全部楼层
我加载了你的规则,看到那个模拟点击查看更多的爬虫路线没有了。反而增加了连续动作滚屏。这个不太合适

续动作滚屏通常是用于没有底的瀑布流的,每滚一次抓取一次,会产生好多结果文件。而这个场景适合用DS打数机的自动滚屏,用菜单 配置-》滚屏参数进行设置,把滚屏次数设置成大于0的数字,比如,8,就能开启滚屏。

还是需要定义个爬虫路线,用于翻页,虽然叫“查看更多”,其实跟 “下一页”一样。

另外,爬微博评论有现成的采集工具,不用做规则。参看:https://www.gooseeker.com/land/weibo.html
举报 使用道具
vignylwn 新手上路 发表于 2018-5-21 16:32:56 | 显示全部楼层
Fuller 发表于 2018-5-16 22:17
我加载了你的规则,看到那个模拟点击查看更多的爬虫路线没有了。反而增加了连续动作滚屏。这个不太合适

续 ...

好的,感谢您!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 21:37