举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2019-9-4 10:32

沙发
czj19961023 实习版主 发表于 2019-9-4 10:26:27 | 只看该作者
我这边测试一下看怎么样。
举报 使用道具
板凳
丁道师 中级会员 发表于 2019-9-4 10:31:53 | 只看该作者
嗯,好的,谢谢
举报 使用道具
地板
Fuller 管理员 发表于 2019-9-4 10:32:21 | 只看该作者
如果爬虫正在采集中,网络断掉了,失败状态就有可能报不上来。或者强制关闭了爬虫,也报不上来。但是,会有一部分数据可以打包。因为数据是持续不断入库的,在关闭之前可能已经入库一些了。这个时候,点击打包按钮是可以下载到一些数据的。

如果你说的是爬虫界面上显示了“打包已完成”,那表示数据入库了,因为是分批入库的,可能只入了入库的时候看到的文件。

你那个截图可以看出来,这个爬虫窗口是只管入库的,另一个窗口是管采集的。入库是定时执行的。一批一批地入,采集的窗口万一被强制关闭,这个入库窗口可以把采集到的文件都入库。但是采集状态在后台看就是“采集中”
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-24 11:38