问题描述:采集任务进行修改(新增采集字段),没有修改原有字段内容,新增字段与原有字段独立关系,但是:执行后,新增采集字段采集结果正确,原有的字段却采集错误。
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2022-12-17 17:44

Fuller 管理员 发表于 2022-12-16 16:50:09 | 显示全部楼层
把规则名字发出来我们分析一下
举报 使用道具
Fuller 管理员 发表于 2022-12-16 16:52:33 | 显示全部楼层
新增字段以后,整个整理箱的定位规则就变化了。如果以前的抓取内容使用了自定义xpath,就会受到影响。还有一种可能,如果没有手工做定位标志映射,如果整理箱的定位规则发生改变,可能会影响到抓取内容自动选择的定位标志
举报 使用道具
tesla0078 金牌会员 发表于 2022-12-16 17:19:22 | 显示全部楼层
Fuller 发表于 2022-12-16 16:52
新增字段以后,整个整理箱的定位规则就变化了。如果以前的抓取内容使用了自定义xpath,就会受到影响。还有 ...

是的。原有字段有用到自定义xpath(非自定义的满足不了需求)。这种要怎么解决呢
举报 使用道具
tesla0078 金牌会员 发表于 2022-12-16 17:29:15 | 显示全部楼层
Fuller 发表于 2022-12-16 16:50
把规则名字发出来我们分析一下

关键词搜索页面构建店铺Prolist02
举报 使用道具
Fuller 管理员 发表于 2022-12-16 18:18:01 | 显示全部楼层
tesla0078 发表于 2022-12-16 17:29
关键词搜索页面构建店铺Prolist02

我加载了这个规则,发现运行的很好。

如果抓取内容有自定义xpath,因为自定义xpath的开头是这样写的 ./xxxx,表示相对于整个整理箱的定位。一旦增加一个抓取内容,整理箱的定位就变了,原先的相对点就错误了,必须重新修改自定义xpath。

如下图,上面红框是整个整理箱的xpath,下面红框是整理箱中其中一个抓取内容的xpath。要检查抓取内容的xpath是否跟整理箱的能够配合的上。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
tesla0078 金牌会员 发表于 2022-12-16 18:20:43 | 显示全部楼层
Fuller 发表于 2022-12-16 18:18
我加载了这个规则,发现运行的很好。

如果抓取内容有自定义xpath,因为自定义xpath的开头是这样写的 ./x ...

运行没问题,但第二个字段内容是错的。
举报 使用道具
Fuller 管理员 发表于 2022-12-17 17:44:12 | 显示全部楼层
tesla0078 发表于 2022-12-16 18:20
运行没问题,但第二个字段内容是错的。

内容表达式那里可以用concat函数,定位表达式那里不能用,因为定位表达式一定要定位到一个dom节点才行
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-13 05:16