练习7:新网页中的新字段的提取(纵向爬行)
下一页
 
  步骤一:建立新主题
 
【说明】:本例演示利用超链接在新网页中提取全新的字段值,即纵向爬行提取。

【实际操作】
仍以练习1的网页为例。此次我们在饭馆列表页面只提取各饭馆的主页链接,而在链接页面中进一步提取各饭馆的地址和电话。
1-2 加载页面后,命名主题和撰写说明。
3 勾选反选DOM节点,以分析页面。
4-5 点击页面首个饭馆的名称"家乡鹅",以寻找其超链接所对应的节点。
6 利用其父节点直接做FreeFormat识别,以快速建立信息属性及映射。(先建信息属性,再做映射的方法也可以)

Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.