1、层级抓取在执行第二层级页面信息抓取时,若有多条二级页面(并行的),抓取出来的xml文件都是分开的,有没有办法直接让这些同级页面信息直接在抓取时就整合在一个xml文件中

2、翻页抓取也会有这个问题,有没有办法让所有的页面都在一个文件中

求教

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-9-26 18:06

沙发
ym 版主 发表于 2015-9-25 14:18:54 | 只看该作者
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel
举报 使用道具
板凳
Madzero 初级会员 发表于 2015-9-26 09:59:30 | 只看该作者
ym 发表于 2015-9-25 14:18
可以把每个规则采集到的xml文件导入一个excel中,可以参考教程如何将xml文件导入excel ...

谢谢
举报 使用道具
地板
zjmok9 新手上路 发表于 2015-9-26 18:06:12 | 只看该作者
我用的WPS(微软的office没试过),把xml文件用WPS的EXCEL打开,打开后另存为EXCEL文件。好像很简单哦。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-24 03:07