网络采集软件工具包MetaSeeker的客户端软件MetaStudio和DataScraper都是Firefox的扩展软件,DataScraper执行网络采集任务,其性能备受关注,从V4.10.0版本开始,DataScraper采用了新架构而且使用C++直接调用Mozilla的底层接口,性能跨越式提高。然而,DataScraper的好的设计方案固然是性能提高的内在因素,仍然不能忽视Firefox的调优,毕竟DataScraper作为Firefox的扩展,依托其功能和性能。
DataScraper是一个通信密集型软件,几乎绝大多数程序代码都在处理网络通信过程,例如,从目标网站下载网页、DataScraper与MetaSeeker服务器通信等等,提高通信效率是首要目标,跟通信效率有关的Firefox参数有很多,在Firefox的地址输入栏输入about:config后,可以看到一大片可调整参数,在过滤器输入框中输入“network”,就能看到所有有关网络通信的参数,数量仍然很多,我们只需要修改其中几个即可,其它保持缺省值,他们是:
以上建议都是实验获得的经验,用户可以根据自己的体验调整上述参数,找到一个最佳组合。