任务执行过程中,执行一段时间后,不定时出现采集任务一直显示采集中,但不执行采集动作(采集线索还未执行完毕)。如下图

任务中断

任务中断

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2022-11-29 23:09

Fuller 管理员 发表于 2022-11-29 11:28:56 | 显示全部楼层
你的规则里面,有个点击动作,xpath是://*[@class='pi-layout-container']/div[position()=3]/div/div/div[position()=2]/div[position()=5]/div/div/div[position()=2]/div[position()=4]/div/div[position()=2]

我发现这个点击了时间排序,你的本意是要按时间排序?
举报 使用道具
Fuller 管理员 发表于 2022-11-29 11:31:27 | 显示全部楼层
按照你的截图,有很多网页要采集,处于采集中是正常的。鼠标浮在进度球上,可以看到详细状态一直在变,最后两行应该在变,如果一直停留在“确认线索”,那就不对了。

采集数据的时候,不要开360这样的安全卫士,会把网络搞得很慢
举报 使用道具
Fuller 管理员 发表于 2022-11-29 11:34:57 | 显示全部楼层
如果是为了点击每个商品,我觉得用这个xpath比较好://*[@class='main-picture']

这是点击每个商品的图,这个xpath比较精准
举报 使用道具
tesla0078 高级会员 发表于 2022-11-29 23:07:41 | 显示全部楼层
Fuller 发表于 2022-11-29 11:28
你的规则里面,有个点击动作,xpath是://*[@class='pi-layout-container']/div/div/div/div/div/div/div/d ...

是的。根据需求,需要进行排序的。
举报 使用道具
tesla0078 高级会员 发表于 2022-11-29 23:09:18 | 显示全部楼层
Fuller 发表于 2022-11-29 11:31
按照你的截图,有很多网页要采集,处于采集中是正常的。鼠标浮在进度球上,可以看到详细状态一直在变,最后 ...

360里面已经做了信任白名单设置。应该不是这个引起的
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 00:08