练习1:单一网页的数据提取
上一页 | 下一页
 
  步骤四:映射。
 
【目的】:选取网页上首条记录作为样本数据,将其各字段值所在位置逐一映射到已构建好的各信息属性中。
 

【实际操作】
为信息属性"饭馆名称",建立映射:
1 勾选,以切换到"反选DOM节点"状态。即点击下方"浏览器"窗口中网页的任一元素,均在上方窗口解析为对应的程序代码及序号(DOM节点)。
2 下拉滚动条,到网页的第一条记录。
3 点击首条记录的特定字段值,譬如"家乡鹅"。
4 弹出提示:"在879行找到相应的节点"。(注意:网页可能随时更新,本例的节点序号仅供参考)

提示:
1 MetaStudio中左上方大窗口,学名"DOM树视窗";
2 DOM树,可理解为:对网页的代码,以树状结构(根、干、叶)重新展现,以厘清代码间的层次关系。
3 DOM节点,DOM下的任一行,均是节点。节点间据包容关系的不同,互称父节点、子节点、兄弟节点等。
4 左图中的"1"处,若不勾选,则下方浏览器与日常浏览器功能基本一致。

Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.