网站抓取工具下载和安装

网站抓取软件工具包MetaSeeker V4.x的下载和安装方法与以前版本相比没有改变,主要步骤归纳为:

  1. 注册MetaSeeker服务帐号
  2. 根据自己的系统软件环境选择下载合适的软件包,进行安装
  3. 初始运行配置
  4. 观察运行状态

网站抓取工具软件包MetaSeeker V4.x增加了多个帮助子菜单,无论语义结构定义工具MetaStudio还是网站抓取工具DataScraper,在帮助菜单下都有三个子菜单:

  • 手册:点击该菜单项可以查看联机手册,获取帮助以解决网站抓取工具MetaSeeker使用过程中发现的问题
  • 下载:点击该菜单项进入下载页面,手工下载和安装最新软件版本
  • 主页:点击该菜单项进入GooSeeker企业网站主页

下面将详细讲解网站抓取工具MetaSeeker的下载和安装步骤



注册MetaSeeker服务帐号

MetaStudio V4.x和DataScraper V4.x需要从软件下载服务器上下载,只有注册用户才能下载MetaSeeker工具包,请首先访问软件下载服务器进行注册

注意:MetaSeeker服务的注册用户和GooSeeker社区的注册用户是不同的,此处所述注册用户是指前者,需要在MetaSeeker服务器上注册。



下载和安装

下载和安装方式有两种:

  1. 下载的同时进行安装:在下载弹出窗口中选择“运行”,并指定运行程序Firefox
  2. 下载保存后安装:在下载弹出窗口中选择“保存”,以后安装

下面将讲解使用第二种方式下载后怎样安装。

运行Firefox后,只要将两者的程序包文件(分别是metastudio_xxx.xpi和datascraper.xpi)拖到Firefox上即可启动安装过程。

安装完成后,如果在Firefox状态栏的右下角显示“MetaStudio Installed”和“DataScraper Installed”,表示两者安装成功。

如果安装成功,在Firefox的“工具”菜单上会出现“MetaStudio”和“DataScraper”两个菜单项。



初始运行

安装完成后,第一次运行MetaStudio和DataScraper时,会提示输入MetaSeeker在线用户帐号和口令信息,用户可以选择将输入的信息存储在本地,这样以后运行就不用再次输入了。配置文件存储在用户的${HOME}目录下,名字分别是:

  • .metastudio.conf
  • .datascraper.conf


观察状态

在MetaStudio的状态栏的右下角可以看到MetaCamp和DataStore服务器的连接状态,在DataScraper上,连接状态显示在右下栏的Status Monitor操作区上。表示连通,表示未连通。

如果显示,需要检查配置的服务器地址是否正确。MetaStudio和DataScraper都有菜单项配置->服务器地址。输入的地址应该是完整的URL,例如,http://www.metacamp.cn/metacamp/和http://www.metacamp.cn/datastore/。结尾的斜线不能省略

注意:MetaStudio和DataScraper初始安装时自动配置了缺省的服务器地址,不必改变。

注意:在MetaStudio上配置服务器地址,需要重新启动MetaStudio。而DataStore的配置是即时生效的。

如果仍然无法连接服务器,请联系我们