集搜客GooSeeker网络爬虫

标题: 无法样例复制,信息无法采集,请指教 [打印本页]

作者: Thinking2019    时间: 2019-10-30 18:12
标题: 无法样例复制,信息无法采集,请指教
一级规则名:东风日产经销商
二级规则名:东风日产经销商采集
网址:https://www.dongfeng-nissan.com.cn/buy/find-dealer

按照设定的规则,采集的时候首先北京、天津两个城市不自动采集。另外因为北京区域第一家店名称采集不到,导致样例复制时,后面的名称都是空白的。

请高手指点……

作者: wangyong    时间: 2019-10-30 18:25
第一级规则加载直接就是失败的,不要映射连续动作后才出现的内容

连续动作里的最后一步没必要,不展开内容也都存在

选择省份的xpath现有的只能点第一个省份,不能循环所有的
这是可以循环点击所有省份的xpath
  1. //*[@class='li']/a
复制代码


作者: Thinking2019    时间: 2019-10-30 18:47
名称采集不到,如图

作者: wangyong    时间: 2019-10-30 18:49
直接加载规则查看测就是没采到,要重新映射这个抓取内容
作者: Thinking2019    时间: 2019-10-30 18:54
wangyong 发表于 2019-10-30 18:49
直接加载规则查看测就是没采到,要重新映射这个抓取内容

可以了,谢谢

作者: Thinking2019    时间: 2019-10-31 12:13
现在出现新问题,采集到 福建—其他 这里之后,陷入死循环,一直过不去,不知如何解决
作者: gz51837844    时间: 2019-10-31 14:12
修改xpath从福建的下一个省份开始采集
作者: Thinking2019    时间: 2019-10-31 15:56
gz51837844 发表于 2019-10-31 14:12
修改xpath从福建的下一个省份开始采集

请教福建的xpath是多少,设置了几个都不对

作者: gz51837844    时间: 2019-10-31 16:30
Thinking2019 发表于 2019-10-31 15:56
请教福建的xpath是多少,设置了几个都不对

选择福建之后省份的xpath://*[@class='li']/a[position()>13]
作者: Thinking2019    时间: 2019-10-31 16:50
gz51837844 发表于 2019-10-31 16:30
选择福建之后省份的xpath://*[@class='li']/a

试了好像不行,采集不到数据

作者: gz51837844    时间: 2019-10-31 17:01
Thinking2019 发表于 2019-10-31 16:50
试了好像不行,采集不到数据

采不到数据是连续动作没执行,还是执行了出现的其他情况

作者: Thinking2019    时间: 2019-10-31 17:12
gz51837844 发表于 2019-10-31 17:01
采不到数据是连续动作没执行,还是执行了出现的其他情况

连续动作没有执行

作者: czj19961023    时间: 2019-10-31 17:28
Thinking2019 发表于 2019-10-31 16:50
试了好像不行,采集不到数据

你的切换城市怎么只设置了点击一次,点击一次当然失败

作者: Thinking2019    时间: 2019-10-31 17:48
czj19961023 发表于 2019-10-31 17:28
你的切换城市怎么只设置了点击一次,点击一次当然失败

设置了连续重做依然无效

作者: Fuller    时间: 2019-10-31 18:13
Thinking2019 发表于 2019-10-31 17:48
设置了连续重做依然无效

[attach]11436[/attach]

因为这里有滚动条,从江西开始没有显示出来,如果不打开爬虫的自动滚轮功能(有时候还是会滚动不准),就点击不上了。那么,可以这样设置:第2和3步,点击动作的高级设置那里,不要勾上“模拟点击”。不是模拟点击的,即使没有滚动显示出来也能点。

作者: Thinking2019    时间: 2019-11-1 09:19
Fuller 发表于 2019-10-31 18:13
因为这里有滚动条,从江西开始没有显示出来,如果不打开爬虫的自动滚轮功能(有时候还是会滚动不准), ...

解决了,非常感谢





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2