练习1:单一网页的数据提取
上一页 | 下一页
 
  步骤四(续2):映射。
 
【目的】:选取网页上首条记录作为样本数据,将其各字段值所对应节点的序号逐一映射到已构建好的各信息属性中。

【实际操作】
为信息属性"地址电话"建立映射:
1 点击网页首条记录的地址电话部分,提示节点所在行:892。
2 找到892行,点击HTML列表项LI前"+"展开。选中子节点"#text"(893行)。
3 "文本内容"框,可见"地址:海淀区皂君庙..."。
4 右键节点"#text"(893行)-选择"内容映射"-选择"地址电话"。即把序号893的节点(代表首条记录的地址电话字段的值"地址:海淀区皂君庙...")映射到信息属性"地址电话"。
5 选中信息属性列表中的"地址电话"。
6 可观察到节点序号为893,表示已为"地址电话"建立了映射。

 
Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.