本帖最后由 ym 于 2017-1-12 11:14 编辑

一、原理
让爬虫在执行动作后再等待额外的时间,然后再去执行下一步动作。
QQ截图20170112111436.png

二、作用

1、延长等待时间,因为很多网页是ajax异步加载的,需要等待一定时间才会显示出全部信息,延长时间可以确保网页加载完全,防止数据漏抓。
2、更加逼真地模仿人的浏览行为,让网站无法识别出是爬虫工具,从而避开反爬手段。

举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2017-1-12 11:05

您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:11