【实际操作】
1 在"MetaStudio"中上载后,再打开"DataScraper"。检索:"北京的*",可见新主题"北京的贵州菜_基本信息"的状态已变为ready。
统计可提取的线索数:右键-线索-统计。本例有10条要提取的线索,即饭馆罗列网页的首页有10个饭馆,需要在他们的各自主页中进行提取。
2 在提取对话框中输入"10",确定后,系统实现提取。(本例提取完毕约需1分钟)
若想实现全部饭馆主页的提取(本例只提取了首页),在原主题"Clue Editor"中,编辑Info Clue时,同时新建一个线索即是(参见练习5和练习6)。
过程小结:
为列表网页创建主题---设某信息属性特性为clue(系统自动添加url特性)---在Info Clue中命名目标主题名---上载并提取---在"Theme List"中找到目标主题名并识别---清空工作台---编辑目标主题(创建信息属性并做映射)---上载提取。 |