|
内容映射 |
FreeFormat映射 |
样例复制品映射 |
用途 |
只对信息属性(字段)进行映射。 |
可对信息属性(字段)进行映射;
也可对信息属性组的顶层容器进行映射。 |
只对信息属性组的顶层容器进行映射。 |
原理 |
对网页代码的位置进行映射。
|
对网页代码的结构进行映射。 |
对网页代码的结构进行映射。 |
优劣 |
日后极易受网页更新、修改的影响,而不能再次正确提取。 |
1 基本不受网页代码位置变化的影响。
2 对顶层容器映射时,只需对首条记录做一次即可。 |
需对顶层容器做两次映射。 |
适用 |
多数针对text,亦可对url、自由表达式等。 |
具有id、class标志。 |
-
|
提取 |
单一数据。 |
1 自动为此信息属性添加block特性;
2
并默认为提取此代码段下所有文本内容。
3 以上两个设定,均可根据需要通过双击此信息属性进行再修改。 |
- |
实战 |
对某一信息属性而言,若能进行FreeFormat映射,为更精准提取:
方法1:先为此信息属性做一次内容映射,再利用合适的父级节点为其做一次FreeFormat映射。
方法2:已先做了FreeFormat映射,可手动去掉自动添加的block特性,然后,再做一次精准的内容映射。 |
- |