抓大量数据的时候,有些什么办法能提高抓取速度的
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-9-16 09:31

沙发
quyixuan 金牌会员 发表于 2016-11-14 10:45:36 | 只看该作者
可以用多台电脑登录同一个账号爬取,每个电脑多开几个爬虫群窗口。这里有个具体的例子:怎样同时登录5台电脑爬取微博,可以参考一下。
举报 使用道具
板凳
shenzhenwan10 金牌会员 发表于 2016-11-14 16:00:57 | 只看该作者
利用集搜客的爬虫群模式,多台电脑可以协同爬取
举报 使用道具
地板
gooseeker_info 金牌会员 发表于 2016-11-14 20:13:32 | 只看该作者
运行爬虫群,可以跨电脑、跨地域,大批量分布式爬数据。如果批量很大,可以联系GooSeeker官方,购买专用的企业版
举报 使用道具
5#
Fuller 管理员 发表于 2017-9-16 09:31:10 | 只看该作者
这里有 一篇专门的教程《怎样优化DS打数机的抓取速度
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 00:28