我用了10天不停采集微博数据,都只是偶尔会出现“已停止”的现象,需要我手动去重新激活。为什么现在变成几乎所有的采集任务都很快就显示“已停止”呢?即使我手动重启之后,也是一样。我急需这些数据写论文用的。请问为什么会出现这个问题呢?而且“采集中”的任务数量,平时都是1或者2,现在变成了13或者15这样子。怎么解决?
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2020-7-26 16:34

Fuller 管理员 发表于 2020-7-26 09:31:05 | 显示全部楼层
采集一段时间以后,应该清除缓存和cookie,重新用微博账号登录微博。应该都被封锁了,或者登录状态失效了
按这个帖子一楼的回答清缓存https://www.gooseeker.com/doc/thread-11667-1-1.html
举报 使用道具
Fuller 管理员 发表于 2020-7-26 09:35:14 | 显示全部楼层
这个帖子介绍了两种方法,一种是手工删除AppData下的GooSeeker文件夹,这种是彻底清除,另一种是用界面上的清除缓存功能。

注意,上面说的是集搜客网络爬虫的清除缓存的方法,如果你用的是数据管家,只能通过界面上的按钮进行清除。在左栏下部有个齿轮状按钮,点击以后进入“隐私和历史”管理项。数据管家不要手工删除缓存文件。另外,数据管家正在不断开发新版本的阶段,要及时下载最新版本
举报 使用道具
AliceOu22 中级会员 发表于 2020-7-26 16:34:57 | 显示全部楼层
Fuller 发表于 2020-7-26 09:35
这个帖子介绍了两种方法,一种是手工删除AppData下的GooSeeker文件夹,这种是彻底清除,另一种是用界面上的 ...

谢谢!更新了版本并且清除了cookies 和缓存之后就可以正常运作了

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 13:59