请问嵌套整理箱在使用自定义xpath时如何解决只采第一条样例的问题。主题:企业信息终版change。
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2017-4-10 11:24

沙发
quyixuan 金牌会员 发表于 2017-4-10 11:03:43 | 只看该作者
我看了你的规则,你用的是多个整理箱而不是嵌套整理箱,变更记录用样例复制可以采集多条,我看你用的定位标志,我自己试了一下,这里用定位标志不能采集多条
举报 使用道具
板凳
ovna123 金牌会员 发表于 2017-4-10 11:11:32 | 只看该作者
嗯。麻烦就在于直接用样例复制可以采集当页,要是换个页面又不行了,还涉及到翻页错位问题。可是试了嵌套采集不成功,用目前的一个节点还能采集一条。由于一条记录中各字段class值相同,又不得不用xpath。我想用嵌套+xpath应该可以成功采集,但不知道哪出了问题。xpath用谋数台搜索了一下,也是我想要的记录数,但为什么测试就是只有一条呢?
举报 使用道具
地板
quyixuan 金牌会员 发表于 2017-4-10 11:24:15 | 只看该作者
ovna123 发表于 2017-4-10 11:11
嗯。麻烦就在于直接用样例复制可以采集当页,要是换个页面又不行了,还涉及到翻页错位问题。可是试了嵌套采 ...

我试了一下翻页确实翻到第四页就中断了,这个可能要另外想办法
你说换个页面用样例复制不行,可能是网页结构不相同,这种就只能在一个主题名下面建立多个规则编号来适应不同结构的页面了

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 22:01