集搜客GooSeeker网络爬虫

标题: 请达人帮忙看下:采集任务一直显示采集中,但不执行采集动作,怎么解决? [打印本页]

作者: tesla0078    时间: 2022-11-29 10:18
标题: 请达人帮忙看下:采集任务一直显示采集中,但不执行采集动作,怎么解决?
任务执行过程中,执行一段时间后,不定时出现采集任务一直显示采集中,但不执行采集动作(采集线索还未执行完毕)。如下图
[attach]15680[/attach]

作者: Fuller    时间: 2022-11-29 11:28
你的规则里面,有个点击动作,xpath是://*[@class='pi-layout-container']/div[position()=3]/div/div/div[position()=2]/div[position()=5]/div/div/div[position()=2]/div[position()=4]/div/div[position()=2]

我发现这个点击了时间排序,你的本意是要按时间排序?
作者: Fuller    时间: 2022-11-29 11:31
按照你的截图,有很多网页要采集,处于采集中是正常的。鼠标浮在进度球上,可以看到详细状态一直在变,最后两行应该在变,如果一直停留在“确认线索”,那就不对了。

采集数据的时候,不要开360这样的安全卫士,会把网络搞得很慢
作者: Fuller    时间: 2022-11-29 11:34
如果是为了点击每个商品,我觉得用这个xpath比较好://*[@class='main-picture']

这是点击每个商品的图,这个xpath比较精准
作者: tesla0078    时间: 2022-11-29 23:07
Fuller 发表于 2022-11-29 11:28
你的规则里面,有个点击动作,xpath是://*[@class='pi-layout-container']/div/div/div/div/div/div/div/d ...

是的。根据需求,需要进行排序的。

作者: tesla0078    时间: 2022-11-29 23:09
Fuller 发表于 2022-11-29 11:31
按照你的截图,有很多网页要采集,处于采集中是正常的。鼠标浮在进度球上,可以看到详细状态一直在变,最后 ...

360里面已经做了信任白名单设置。应该不是这个引起的





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2