集搜客GooSeeker网络爬虫

标题: 如图,没有定位标志的参数 [打印本页]

作者: 驻在冰箱的企鹅菌    时间: 2015-12-28 15:31
标题: 如图,没有定位标志的参数
没有定位标志的参数,采集出来的数据都是乱的,怎么解决?
作者: xandy    时间: 2015-12-28 15:37
这个需要自定义xpath,常见问题>制作规则—常见问题导航>自定义xpath中有xpath学习教程推荐http://www.gooseeker.com/doc/for ... amp;highlight=xpath

作者: Fuller    时间: 2015-12-28 20:48
楼主这个网页抓取出来的也是乱的?通常情况下,如果网页上的li都有相同的class,那样很容易抓乱,所有抓取内容都抓第一个。那是因为自动生成的抓取规则用了class值。

可以参照这个帖子 :http://www.gooseeker.com/doc/thread-939-1-1.html  ,把首选项重新设置一下,就避开了相同的class。比如,选择绝对定位,那么就不会用上class或者id,根据li的位置编号进行定位。




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2