信息提取(网页抓取/抽取)指令文件总览

信息提取(网页抓取/抽取)指令文件是一组文件,由MetaStudio生成,每组文件对应一个信息结构,这组文件由DataScraper用来提取Web页面上的信息,因此,每组文件可以看做是一个HTML wrapper(包装器)。我们将详细讲述下面这些文件的内容结构。