我在设置调度参数这里把并发爬虫窗口数设置成5,点击启动采集,运行起来是2个窗口,不是5个。是我操作错误吗?



举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-11-17 11:30

沙发
Fuller 管理员 发表于 2020-11-17 11:30:11 | 只看该作者
你的操作没有错误,在调度设置那里设置的并发网络爬虫窗口数量和实际上启动多少个网络爬虫窗口没有关系。但是,在爬虫软件V10.0.2以后,将改成你预期的那样,请注意及时下载最新版。

原先是这样设计的:
1,在调度参数那里设置并发网络爬虫窗口数量,目的是给调度程序设定一个上限,不允许同时给更多窗口分配爬虫任务
2,而实际运行多少个爬虫窗口,要另外设置的,是在客户端设置的,如下图。如果不设置,总是启动2个窗口。

新版本修改了,把网页上的设置和客户端的设置拉通了,在会员中心的调度设置那个网页上设置好以后,会自动修改客户端的设置。但是有个上限:不能超过6个窗口。因为每个窗口会消耗很多内存。如果你确定你的电脑配置很高,还是需要在客户端另外设置更多窗口。参看下图


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 06:04