抓大量数据的时候,有些什么办法能提高抓取速度的
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2017-9-16 09:31

沙发
quyixuan 金牌会员 发表于 2016-11-14 10:45:36 | 只看该作者
可以用多台电脑登录同一个账号爬取,每个电脑多开几个爬虫群窗口。这里有个具体的例子:怎样同时登录5台电脑爬取微博,可以参考一下。
举报 使用道具
板凳
shenzhenwan10 金牌会员 发表于 2016-11-14 16:00:57 | 只看该作者
利用集搜客的爬虫群模式,多台电脑可以协同爬取
举报 使用道具
地板
gooseeker_info 金牌会员 发表于 2016-11-14 20:13:32 | 只看该作者
运行爬虫群,可以跨电脑、跨地域,大批量分布式爬数据。如果批量很大,可以联系GooSeeker官方,购买专用的企业版
举报 使用道具
5#
Fuller 管理员 发表于 2017-9-16 09:31:10 | 只看该作者
这里有 一篇专门的教程《怎样优化DS打数机的抓取速度
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简

热门用户

GMT+8, 2026-4-6 08:39