快捷导航
规则名称“电视剧宣发微博物料采集”爬取网址:https://weibo.com/p/1002066150454520/photos?from=page_100206&mod=TAB#place

规则很简单,测试窗口可以直接拉到最后一张图。
刚开始只能爬取一小半,后来发现可能是滚动刷新速度问题,将调整滚屏参数调整为2/-1。
爬取数量增多,但还是爬取到3/4时就会显示【总线索:1 Loops】然后闪几下就显示采集完成。
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-5-9 15:06

wangyong 版主 发表于 2020-5-9 14:52:39 | 显示全部楼层
滚屏参数还是小了,需要改成20/-2,超时时长改成120秒
举报 使用道具
Fuller 管理员 发表于 2020-5-9 15:06:52 | 显示全部楼层
1和-1是一样的,没有变速,2,3,4,5...越来越快,-2,-3,-4,..... 越来越慢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 分析电商评论发现消费者话题-LDA主题分析篇
  • 如何使用快捷采集-以豆瓣影评数据采集为例
  • 微博内容分词并手工选词后用JupyterNoteboo
  • 基于新浪微博大数据分析下的《乘风破浪的姐
  • 政策工具视角下我国旅游科技政策文本分析研

热门用户

GMT+8, 2021-6-25 15:02