集搜客GooSeeker网络爬虫

标题: contains()函数是最常用的下方定位 [打印本页]

作者: zhuohui1987    时间: 2017-4-17 16:43
标题: contains()函数是最常用的下方定位
百度网盘 网页下载
http://pan.baidu.com/s/1i4HaCuh

[attach]6181[/attach]

根据“房屋房屋”采集红色框内容

作者: Fuller    时间: 2017-4-17 17:52
你的规则名是什么?
百度网盘里面的内容是什么?

作者: xandy    时间: 2017-4-17 18:05
把定位修改为“绝对定位”,试试下面这条xpath:
  1. //*[@class='MsoNormal'][.//text()='房屋坐落']/../../following-sibling::*/td[count(//*[@class='MsoNormal'][.//text()='房屋坐落']/../preceding-sibling::*)+1]//text()
复制代码
解释下里头的这个xpath语句:
  1. count(//*[@class='MsoNormal'][.//text()='房屋坐落']/../preceding-sibling::*)+1
复制代码

这个是为了统计“房屋坐落”所在的单元位置(因为可能换一个文件,房屋坐落对应的位置又变了),这样就能正确找出“房屋坐落”对应的值





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2