练习7:新网页中的新字段的提取(纵向爬行)
上一页 | 下一页
 
  步骤二:创建信息属性,并设置特性。
 
【目的】:创建提取饭馆网址的信息属性,并设置其特性为clue。

【实际操作】
1-2 命名整理箱,并勾选其对应节点为顶层容器。
3 切换到"Bucket Editor",编辑经FreeFormat识别后自动生成的信息属性。删去多余的节点,重命名BL为饭馆主页。
4 去除"block"特性的勾选,以将网址节点做内容映射到饭馆主页。
5 找到HTMLA元素的@href属性,将其内容映射到饭馆主页。
6 选中"饭馆主页",勾选"clue"(线索)特性。即以信息属性"饭馆主页"的值做为进一步提取的线索。因只有超链接可以作为线索,所以,系统自动为此信息属性添加"url"(网页地址)特性。
因本网站中每个饭馆都有自己的主页,所以,可添加"key"特性。

 
 
Copyright(c) 2007-2010, Fuller Hua. All Rights Reserved.