样例复制的第一个样例少了#test节点，怎么跳过它，采集其他样例

酱紫

第一样例少了一个#test节点，之后的样例都有，怎么跳过它

quyixuan · 发表于 2016-11-14 17:10:18

找个第一样例字段全的做规则

酱紫 · 发表于 2016-11-14 17:14:06

quyixuan 发表于 2016-11-14 17:10
找个第一样例字段全的做规则

断开的文本怎么合并采集？如下图，节点是分开的

quyixuan · 发表于 2016-11-14 17:14:32

本帖最后由 quyixuan 于 2016-11-14 17:20 编辑

酱紫发表于 2016-11-14 17:14
断开的文本怎么合并采集？如下图，节点是分开的

这边有个教程
http://www.gooseeker.com/doc/article-101-1.html

TonyJiang · 发表于 2016-11-14 17:15:36

酱紫发表于 2016-11-14 17:14
断开的文本怎么合并采集？如下图，节点是分开的

//*[@class='mem_loc']/preceding-sibling::span[3]/span[2]

这个xpath，表示先定位class属性的值是mem_loc的节点，然后定位他所有的兄弟，然后取第3个离他近的，在取这个兄弟的第二个子节点

搞定这个，基本上就能取到你所要的大部分内容了

酱紫 · 发表于 2016-11-14 17:15:52

TonyJiang 发表于 2016-11-14 17:15
//*[@class='mem_loc']/preceding-sibling::span[3]/span[2]

这个xpath，表示先定位class属性的值是m ...

谢谢

gooseeker_info · 发表于 2016-11-14 19:58:53

本帖最后由 gooseeker_info 于 2016-11-14 20:00 编辑

像这样自定义XPath，复杂度太高了，通常可以简单处理。

仔细观察这个文本被切成了3部分，都放在各自的SPAN节点中，往上找三个SPAN的共同父节点，用父节点做内容映射。可以参看《文本断掉该怎么采集》

样例复制的第一个样例少了#test节点，怎么跳过它，采集其他样例

共 6 个关于本帖的回复最后回复于 2016-11-14 19:58

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

样例复制的第一个样例少了#test节点，怎么跳过它，采集其他样例

共 6 个关于本帖的回复 最后回复于 2016-11-14 19:58

推荐板块

精彩推荐

热门话题

热门用户

共 6 个关于本帖的回复最后回复于 2016-11-14 19:58