471#
shengchengx 金牌会员 发表于 2017-9-18 17:43:14 | 只看该作者
刚刚9115 发表于 2017-9-18 17:41
已经下载了客户端为什么还提示下载啊?

使用gs浏览器打开,然后点击开始采集
举报 使用道具
472#
刚刚9115 新手上路 发表于 2017-9-18 17:46:53 | 只看该作者
你好,采集状态一直显示为“待启动?”是什么原因?后面有问号不能启动
举报 使用道具
473#
shengchengx 金牌会员 发表于 2017-9-18 18:09:19 | 只看该作者
刚刚9115 发表于 2017-9-18 17:46
你好,采集状态一直显示为“待启动?”是什么原因?后面有问号不能启动

爬虫群一直显示正在等待采集任务有哪几种原因?看下这个教程
举报 使用道具
474#
烁儿 新手上路 发表于 2017-9-22 22:13:20 | 只看该作者
要是想限定采集的区域可以吗?比如说我只抓取厦门市的数据
举报 使用道具
475#
Fuller 管理员 发表于 2017-9-22 22:39:34 | 只看该作者
烁儿 发表于 2017-9-22 22:13
要是想限定采集的区域可以吗?比如说我只抓取厦门市的数据

用工具箱不可以。你可以下载微博关键词的规则http://www.gooseeker.com/res/detail_114518.html,用微博的高级搜索,限定城市后,把网址输入,就可以采集关键词在这个城市的数据了。
举报 使用道具
476#
jiuyuejiudejiu 新手上路 发表于 2017-9-23 11:54:32 | 只看该作者
请问弹出两个爬虫窗口一直都是待分配任务,而四个采集任务一个都没有开始是怎么回事呢?
举报 使用道具
477#
sciencenature 初级会员 发表于 2017-9-23 12:02:19 | 只看该作者
一条微博的评论有4000多,但是仅能爬到130多条,这是什么原因呢?怎么解决,本人小白
举报 使用道具
478#
Fuller 管理员 发表于 2017-9-23 12:06:45 | 只看该作者
jiuyuejiudejiu 发表于 2017-9-23 11:54
请问弹出两个爬虫窗口一直都是待分配任务,而四个采集任务一个都没有开始是怎么回事呢? ...

因为用户很多,采集任务要排队,通常需要等待几分钟时间,如果等待时间过长,就不对了。很可能原因是: 你登录GS网络爬虫软件用的账号和登录微博工具箱后台所用的账号不一样
举报 使用道具
479#
Fuller 管理员 发表于 2017-9-23 12:07:51 | 只看该作者
sciencenature 发表于 2017-9-23 12:02
一条微博的评论有4000多,但是仅能爬到130多条,这是什么原因呢?怎么解决,本人小白
...

微博评论要一口气爬下来,断了的话只能从头再爬。所以,要确保网络很稳定,如果是共享的校园网,通常会很不稳定。可以找网络空闲的时间,比如晚上
举报 使用道具
480#
bowieD 金牌会员 发表于 2017-9-25 09:31:53 | 只看该作者
jiuyuejiudejiu 发表于 2017-9-23 11:54
请问弹出两个爬虫窗口一直都是待分配任务,而四个采集任务一个都没有开始是怎么回事呢? ...

对着这个教程检查一下原因《爬虫群一直显示正在等待采集任务有哪几种原因?》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 06:01