【实际操作】 仍以练习1的页面为例。 1 加载页面后,命名主题(给此项提取任务起名),并"核实"。 2 撰写说明。 3 选中。以使下方"浏览器"处于反选DOM节点状态。 4 有了练习1&2的基础,我们已能很快确定DD(序号:832)是网页首条记录的顶层节点,即此节点正好完全包容第一条记录。 5 右键此节点-选择"FreeFormat识别"。 6 弹出"命名整理箱"对话框。起名(譬如:"全部字段"),存储。 7 切换到"Bucket Editor"(整理箱编辑器)。 8 可见已新建一整理箱,点击"全部字段"前"+"展开。其下:将首条记录节点内具有"id"或"class"的子节点全部映射到(系统自建的)信息属性内。
下一步将其编辑成我们想要的信息属性...