主题名:点评_商户详情
问题描述:之前一直有抓取过数据,当时就有一个详情链接字段数据时有缺失,需要抓几次左右,才能抓全,自定义没问题。
还专门贴了个帖子求教:http://www.gooseeker.com/doc/for ... amp;page=2#pid15704
今天规则直接报废了:
加载抓取规则遇到的错误:
无法定位容器 No.0
无法定位抓取内容 No.1 (情景2);XPath是a[position()=1]
无法定位抓取内容 No.2 (情景2);XPath是a[position()=2]
无法定位抓取内容 No.3 (情景2);XPath是a[position()=3]
无法定位抓取内容 No.4 (情景2);XPath是a[position()=4]
无法定位抓取内容 No.5 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/h1/text()[position()=1]
无法定位抓取内容 No.6 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/h1/a[position()=3]
无法定位抓取内容 No.7 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=1]/span[position()=2]/text()
无法定位抓取内容 No.8 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=1]/span[position()=3]
无法定位抓取内容 No.9 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=1]/span[position()=4]
无法定位抓取内容 No.10 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=1]/span[position()=5]
无法定位抓取内容 No.11 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=1]/span[position()=6]
无法定位抓取内容 No.12 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=2]/span[position()=2]
无法定位抓取内容 No.13 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/p[position()=1]/span[position()=2]
无法定位抓取内容 No.14 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/p[position()=1]/span[position()=3]
无法定位抓取内容 No.15 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=3]/p[position()=2]/span[position()=2]/text()
无法定位抓取内容 No.16 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=3]/p[position()=2]/a/@href
无法定位抓取内容 No.17 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/div[position()=3]/p[position()=5]/span[position()=2]/span[position()=3]/a/@href
无法定位抓取内容 No.18 (情景2);XPath是following-sibling::div[position()=1]/div[position()=1]/p[position()=2]/text()[position()=2]
改了好几次规则,请查看我现在的规则,并点击测试,测试结果就是我需要的数据。
以下几个线索,为抓全失败线索,供查看:
http://www.dianping.com/shop/1934668 | http://www.dianping.com/shop/21829897 | http://www.dianping.com/shop/8022978 | http://www.dianping.com/shop/500792 | http://www.dianping.com/shop/1903537 | http://www.dianping.com/shop/4131721 | http://www.dianping.com/shop/500643 | http://www.dianping.com/shop/14684855 |
谢谢。
|
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2017-1-6 09:07