练习3:FreeFormat法直接创建信息属性&映射
下一页
 
  步骤一:找到顶层节点,用FreeFormat识别。
 
【说明】:用FreeFormat直接创建信息属性,以进一步了解FreeFormat的使用特点。

【实际操作】
仍以练习1的页面为例。
1 加载页面后,命名主题(给此项提取任务起名),并"核实"。
2 撰写说明。
3 选中。以使下方"浏览器"处于反选DOM节点状态。
4 有了练习1&2的基础,我们已能很快确定DD(序号:832)是网页首条记录的顶层节点,即此节点正好完全包容第一条记录。
5 右键此节点-选择"FreeFormat识别"。
6 弹出"命名整理箱"对话框。起名(譬如:"全部字段"),存储。
7 切换到"Bucket Editor"(整理箱编辑器)。
8 可见已新建一整理箱,点击"全部字段"前"+"展开。其下:将首条记录节点内具有"id"或"class"的子节点全部映射到(系统自建的)信息属性内。

下一步将其编辑成我们想要的信息属性...

 
 
Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.