我想把详情页面列表的数据和详情页面数据保存在同一个xml中,这个得怎么弄???
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2016-10-26 15:33

沙发
xandy 论坛元老 发表于 2016-10-26 11:47:39 | 只看该作者
你的详情页面列表 和 详情页面数据 分别是哪一个?
举报 使用道具
板凳
HJLing 版主 发表于 2016-10-26 11:49:13 | 只看该作者
不能直接保存在同一个xml里 只能把列表数据全都导入到excel 详情数据也全都导入到excel 教程见xml转换成excel

然后再在excel把两级规则数据拼在一起 教程如何在excel中合并多层级采集结果
举报 使用道具
地板
lisongqiu 新手上路 发表于 2016-10-26 11:49:31 | 只看该作者
xandy 发表于 2016-10-26 11:47
你的详情页面列表 和 详情页面数据 分别是哪一个?

我截图中有 上面是基本信息字段 红框框中是列表数据,列表数据是动态的
举报 使用道具
5#
xandy 论坛元老 发表于 2016-10-26 14:36:56 | 只看该作者
lisongqiu 发表于 2016-10-26 11:49
我截图中有 上面是基本信息字段 红框框中是列表数据,列表数据是动态的
...

也就是说当前页面有两个部分的数据你要采集,一个是上面的基本信息,一个是下面的列表数据?
举报 使用道具
6#
lisongqiu 新手上路 发表于 2016-10-26 15:22:19 | 只看该作者

举报 使用道具
7#
Zumwalt 新手上路 发表于 2016-10-26 15:33:03 | 只看该作者

你可以定义一个规则,在这个规则建立两个整理箱
整理箱1:抓取上面的基本信息字段
整理箱2:抓取下面的列表数据

至于下面的列表数据是动态加载的,你可以进行定时采集,可以看看这个帖子:增量采集数据
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-17 16:18