我在一个主题规则里建了3个整理箱,是抓网页上不同版块的信息,但是都在一个页面上的,采集下来转为excel后,是一个整理箱一张表,但是我想要把三个整理箱的信息合到一张excel表里,这个要怎样做呀?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2016-12-15 11:53

沙发
ym 版主 发表于 2016-12-15 11:53:45 | 只看该作者
用excel的vlookup函数可以根据三张表的关联字段进行合并,操作参考《如何在excel中合并多层级采集结果》
同一个规则下多个整理箱的关联字段可以用:clueid、fullpath、realpath,这三个是与网址线索一一对应的,各个字段说明请见《xml文件结构怎么看》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 14:01