有线索,有爬虫,已调度,为什么不爬数据?
调度里一轮线索已经设置到99。
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2017-11-7 10:00

沙发
嘉兴 新手上路 发表于 2017-11-3 11:17:42 | 只看该作者
1,调度的规则太多了,把已经抓完的规则移出罗盘
2,这条规则一共才139条线索,一轮线索数设置了99,一个爬虫群一轮就会调用99条线索,这个规则最多只会启动两个窗口,所以设置这么多窗口没用
3,爬虫群窗口设置多了,需要等待一会才会全部启动起来。
4,如果一直不启动,参考这个教程检查一遍《爬虫群一直显示正在等待采集任务有哪几种原因? 》
举报 使用道具
板凳
dfhs_data 高级会员 发表于 2017-11-3 11:32:15 | 只看该作者
嘉兴 发表于 2017-11-3 11:17
1,调度的规则太多了,把已经抓完的规则移出罗盘
2,这条规则一共才139条线索,一轮线索数设置了99,一个爬 ...

1.规则每天都要抓取数据,不能每天都人工手动移进移出吧?
2.一轮线索设置99,之前是20,参考其他办法让从20设置到99的。
3.爬虫窗口设置好了,等了11个小时也没有爬数据。
举报 使用道具
地板
嘉兴 新手上路 发表于 2017-11-3 11:36:47 | 只看该作者
如果需要每天抓当然就不用移出来,一轮线索数是根据规则的总线索数来定的,并不能参考其他办法。窗口设置好了,一直没启动肯定是设置有问题,一般都是打数机和会员中心的账号登陆不一样,对着帖子检查一遍。再重新启动。
举报 使用道具
5#
dfhs_data 高级会员 发表于 2017-11-3 13:09:18 | 只看该作者
嘉兴 发表于 2017-11-3 11:36
如果需要每天抓当然就不用移出来,一轮线索数是根据规则的总线索数来定的,并不能参考其他办法。窗口设置好 ...

账号是对的,我现在只能试试重启

举报 使用道具
6#
dfhs_data 高级会员 发表于 2017-11-3 13:30:31 | 只看该作者
嘉兴 发表于 2017-11-3 11:36
如果需要每天抓当然就不用移出来,一轮线索数是根据规则的总线索数来定的,并不能参考其他办法。窗口设置好 ...

我重启完,开了一个爬虫窗口,一轮线索也设置到20,爬虫显示要抓取的规则名,但没爬数据


下面是该规则的调度设置



举报 使用道具
7#
嘉兴 新手上路 发表于 2017-11-3 14:43:36 | 只看该作者
dfhs_data 发表于 2017-11-3 13:30
我重启完,开了一个爬虫窗口,一轮线索也设置到20,爬虫显示要抓取的规则名,但没爬数据

这个规则似乎没有保存,所以在启动的时候报“没有权限”,刚在后台给你保存了一下,现在可以了,正在检查原因。
举报 使用道具
8#
dfhs_data 高级会员 发表于 2017-11-7 09:43:51 | 只看该作者
嘉兴 发表于 2017-11-3 14:43
这个规则似乎没有保存,所以在启动的时候报“没有权限”,刚在后台给你保存了一下,现在可以了,正在检查 ...

好的,谢谢。
现在又发现问题,我昨天启动的爬虫抓数据。抓取完成后,我没有关闭爬虫,等待新一轮抓取。
我给规则定的是每天激活线索,是23点激活,也就是昨天晚上23点激活的线索。
我今天查看线索是激活了,但开启的爬虫没有抓取数据。
不知道又怎么了...

举报 使用道具
9#
umsung 高级会员 发表于 2017-11-7 09:56:57 | 只看该作者
本帖最后由 umsung 于 2017-11-7 09:58 编辑
dfhs_data 发表于 2017-11-7 09:43
好的,谢谢。
现在又发现问题,我昨天启动的爬虫抓数据。抓取完成后,我没有关闭爬虫,等待新一轮抓取。
...

上周末好像升级了算法,不知道是否影响到调度这一块了,这个问题已经反馈上去了,今天应该会完善。
举报 使用道具
10#
dfhs_data 高级会员 发表于 2017-11-7 10:00:50 | 只看该作者
umsung 发表于 2017-11-7 09:56
上周末好像升级了算法,不知道是否影响到调度这一块了,这个问题已经反馈上去了,今天应该会完善。
...

好的,我等等看
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-15 23:03