练习3:FreeFormat法直接创建信息属性&映射
上一页 | 回首页
 
  补充(续1):HTML属性内容的提取。
 
【说明】:内容映射通常用于从text节点提取内容,对于HTML的属性节点,一般用XPATH表达式提取。

【实际操作】
以下利用XPath表达式设定"综合得分"的提取规则:
1 确保"综合得分"已做映射(内容映射、FreeFormat映射,二者同时或单一皆可),否则XPath提取的结果无对应字段。
2 双击信息属性综合得分行,弹出信息属性特性设定对话框。
3 对话框中,首先勾选"block"特性,以对整个块(此处为整个网页)操作;
4 选择"XPath过滤器";
5 选中"文本内容"和"专用定位";
6 在节点定位表达式中输入定位条件,在内容提取表达式中输入提取目标。存储以完成。
再次预览、上载、提取,结果正确。

提示:
虽然网页设计流行的种类并不多,但实际制作中,每个作者的工作习惯千差万别。所以,制定提取规则-检查提取结果,是个需不断循环修正的过程。

 
Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.