整理箱的管理

You can't request more than 20 challenges without solving them. Your previous challenges were flushed.

整理箱是对目标页面上的信息的归类存储,用户可以为同一个目标页面定义多个整理箱,例如,在博客页面上,有个区域是关于博主的个人信息,另一个区域是博主发表的博文的列表,如果在一次信息提取(页面抓取/抽取)任务中同时提取这两类信息,用户需要定义两个整理箱,为第一个整理箱只定义一个样例复制品即可;为第二个整理箱需要定义两个样例复制品,因为要提取一个列表,详见样例复制品的管理

Extraction Editor工作台上,管理整理箱的操作有:

  • 创建整理箱:按Bucket Information操作区的newBckt按钮可以创建一个新的整理箱,创建以后,工作台将被初始化,Common OperationsReplica Management操作区的操作将被激活,并在左栏显示新建的整理箱中的信息属性映射表。
  • 重建整理箱:在Bucket Information操作区有一个右键鼠标菜单Renew,可以将当前工作台上的整理箱清空,删除所有已经创建的信息属性,让用户重新命名整理箱和重新定义整理箱的信息属性。