遇到“无法定位信息属性”的错误怎么办?

需要修改被抽取数据的映射关系

遇到这个错误,说明语义结构定义工具MetaStudio无法完全成功加载原来定义的信息结构,主要原因是样本页面的结构改变了很多,即使使用GooSeeker专有的FreeFormat技术也无法完全识别目标页面结构,这个错误说明在Bucket Editor工作台上的整理箱中的第1号(从0开始编号)信息属性无法定位,也就是原来生成的XPath定位表达式失效了,使用以前的表达式找不到那个DOM节点。当遇到此类问题时,MetaStudio将尽力定位尽量多的信息属性,剩下的不能识别的需要用户再次执行数据映射和FreeFormat映射操作,重新定义信息提取规则

此类告警不止这一个,处理方法都是一样的,还有:

  1. 无法定位容器 No. x :表示第x号容器节点(Bucket Editor工作台上的整理箱树状结构的节点)无法定位
  2. 无法定位容器的FreeFormat No. x :表示第x号容器节点使用FreeFormat标志进行定位,但是无法定位
  3. 无法定位第二个样例复制品 No.x :表示第x号容器节点使用样例复制品方式定位,但是第二个样例复制品无法定位
  4. 无法定位第二个样例复制品的节点 No.x :表示第x号容器节点使用样例复制品方式定位,但是第二个样例复制品无法定位
  5. 无法定位信息属性 No.x :表示第x号信息属性节点无法定位
  6. 无法定位信息属性的FreeFormat(位于主干上) No.x :表示第x号信息属性节点使用FreeFormat标志进行定位,而且FreeFormat标志位于DOM树的主干上,但是该标志无法定位
  7. 无法定位信息属性的FreeFormat No.x :表示第x号信息属性节点使用FreeFormat标志进行定位,但是该标志无法定位
  8. 没有映射信息属性的内容定位规则:表示没有进行数据映射,用于定义信息属性的内容定位规则
  9. 无法定位信息属性 No.x (情景2):表示第x号信息属性节点无法定位的另外一种情景
  10. 无法定位上下文:表示被提取的内容位于一个IFRAME/FRAME中,但是该IFRAME/FRAME无法定位
  11. 无法确定容器在DOM树中的位置 No.x:表示无法确定第x号容器节点在DOM树中的位置