集搜客GooSeeker网络爬虫
标题:
contains()函数是最常用的下方定位
[打印本页]
作者:
zhuohui1987
时间:
2017-4-17 16:43
标题:
contains()函数是最常用的下方定位
百度网盘 网页下载
http://pan.baidu.com/s/1i4HaCuh
[attach]6181[/attach]
根据“房屋房屋”采集红色框内容
作者:
Fuller
时间:
2017-4-17 17:52
你的规则名是什么?
百度网盘里面的内容是什么?
作者:
xandy
时间:
2017-4-17 18:05
把定位修改为“绝对定位”,试试下面这条xpath:
//*[@class='MsoNormal'][.//text()='房屋坐落']/../../following-sibling::*/td[count(//*[@class='MsoNormal'][.//text()='房屋坐落']/../preceding-sibling::*)+1]//text()
复制代码
解释下里头的这个xpath语句:
count(//*[@class='MsoNormal'][.//text()='房屋坐落']/../preceding-sibling::*)+1
复制代码
这个是为了统计“房屋坐落”所在的单元位置(因为可能换一个文件,房屋坐落对应的位置又变了),这样就能正确找出“房屋坐落”对应的值
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/)
Powered by Discuz! X3.2