这三个文件夹分别代表的是什么意思啊?以及.meta文件夹下的这两个文本写的是什么?

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2017-1-18 16:15

沙发
AnswerDSL 版主 发表于 2017-1-18 16:11:52 | 只看该作者
本帖最后由 AnswerDSL 于 2017-1-18 16:17 编辑

harvestrecord里存放的文件夹是自动入库时发送失败的Zip名称,仅仅是以Zip名命名的空文件夹。
imported是存放自动入库时打包后的XML。
filecount里写的是有多少个xml结果文件。
举报 使用道具
板凳
Fuller 管理员 发表于 2017-1-18 16:15:21 | 只看该作者
.meta/filecount里面有个计数器,粗略记录当前文件夹中有个几个结果文件
.meta/packlevel表示文件夹有几层子文件夹
harvestrecord中如果有内容,说明向云存储发送结果文件的时候失败了,可以根据这个记录,找到实际文件手工重发
imported是向云存储发送了结果文件以后把原始结果文件转移了过来

爬虫用户可以不用关心这些信息,而且每个版本可能会变化。如果系统集成确实需要了解,可以专门联络讨论版本计划。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 15:59