请问下一个主体中有两个整理箱,然后会导出2个Excel,我怎么让它只导出一个Excel啊?因为这些都是一个页面的数据

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2017-5-5 14:58

沙发
驻在冰箱的企鹅菌 中级会员 发表于 2017-5-5 14:53:30 | 只看该作者
因为我需要爬很多类似网页的数据,自己合并太麻烦了
举报 使用道具
板凳
scraper 论坛元老 发表于 2017-5-5 14:54:41 | 只看该作者
不能自动变成一个excel 要自己去合并
除非你做规则的时候就写在一个整理箱里
合并参考教程《如何在excel中合并多层级采集结果


举报 使用道具
地板
驻在冰箱的企鹅菌 中级会员 发表于 2017-5-5 14:55:31 | 只看该作者
scraper 发表于 2017-5-5 14:54
不能自动变成一个excel 要自己去合并
除非你做规则的时候就写在一个整理箱里
合并参考教程《如何在excel中 ...

可是写在一个整理箱中dom节点就找不到了,不能复制样例了

举报 使用道具
5#
scraper 论坛元老 发表于 2017-5-5 14:56:39 | 只看该作者
驻在冰箱的企鹅菌 发表于 2017-5-5 14:55
可是写在一个整理箱中dom节点就找不到了,不能复制样例了

嵌套整理箱试试
如果只能分开两个整理箱 那就要你自己去合并

举报 使用道具
6#
shengchengx 金牌会员 发表于 2017-5-5 14:58:59 | 只看该作者
可以将两个Excel表格进行合并呢,具体可以使用excel的vlookup函数可以根据两张表的关联字段进行合并。操作可以参考《如何在excel中合并多层级采集结果》。
同一个规则下多个整理箱的关联字段可以用:clueid、fullpath、realpath,这三个是与网址线索一一对应的,各个字段说明请见《xml文件结构怎么看》
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-20 22:08