配套软件版本:V9及更低 集搜客网络爬虫软件 新版本对应教程:V10及更高 数据管家——增强版网络爬虫 的对应教程是《下载安装GooSeeker爬虫软件》 集搜客网页抓取软件经过了10年的演进,先从火狐插件开始,现在发展成一个独立的软件,运行起来看很像一个浏览器,只是多了几个用于爬网页数据的按钮,所以,称为具有网络爬虫能力的浏览器。如下图,如果登录激活了网络爬虫功能,就会出现红框中的按钮。 注:一直关注集搜客网页抓取软件的朋友请注意,火狐插件版爬虫已不再公开发行了,如确属需要,可联系我们,仅支持火狐38版(相当老了)。 注:新用户请先去集搜客网站上注册账号,用于登录集搜客爬虫软件,登录以后才能激活网络爬虫功能。 一、安装说明: 下载GS爬虫浏览器软件,是一个自解压的exe文件,31M左右,如果下载过程被别的软件拦截,文件会远远小于31M,将会安装失败,需要重新下载。请用浏览器自带的下载功能,不用迅雷等下载软件。双击这个exe文件,即开始安装过程。 安装过程每一步都有提示,如果询问是否在桌面上放置快捷运行图标,请选择是,就会在桌面上显示如下图标。这个图标也会出现在Windows的开始菜单中。
二、运行软件双击桌面上的快捷图标,或者选择Windows开始菜单中的集搜客GooSeeker,就能打开软件,在右上角就能看到定义规则、MS谋数台和DS打数机,其中定义规则可以直接对当前页面做规则,非常简便好用,再次点击就可以取消做规则。 第一次运行GS爬虫浏览器,要登录才能激活网络爬虫功能。注意:没有账号的请先在官网注册一个账号,并且要通过邮箱验证才能正常使用。如果是Mac版软件,需要购买专业版才能激活。
三、安装环境介绍硬件环境 为了获得集搜客爬虫软件的最优显示效果和准确的采集结果,建议电脑显示器分辨率在1280×1024以上。因为集搜客爬虫是通过内嵌浏览器模拟人工浏览网页的操作,从而有效提取网页信息。如果电脑的纵向分辨率小于1024(例如笔记本),内嵌浏览器的显示尺寸过小,就会影响操作的便利性以及网页信息显示的完整性。 软件环境 集搜客爬虫软件支持windows/linux/mac三个操作系统,大家可以选择安装。 |