文档

如何将XML结果文件导入excel
如何将XML结果文件导入excel
使用集搜客GooSeeker采集到的数据为XML格式保存在本地电脑中,为方便用户进一步处理数据,以EXCEL2013版为例,讲解如何将XML结果文件导入excel 方法一 将宏文件放在结果文件夹中。 打开宏文件,点击“启用内容”。 ...

2015-8-27 10:11

抓取网页时自动登录和自动输入验证码
抓取网页时自动登录和自动输入验证码
集搜客GooSeeker网页抓取软件可以与在线打码平台对接,如果抓取的网站要求输入验证码,那么就把验证码转发给在线打码平台,GooSeeker将打码平台给回的结果自动录入到网页上,完成打码过程。 ... ... ... ... ... ... ...

2015-8-25 17:30

如何翻页抓取网页数据——以采集天猫搜索列表为例
如何翻页抓取网页数据——以采集天猫搜索列表为例
我们在抓取数据时,通常不会只抓取网页当前页面的数据,往往都会继续抓取翻页后的数据。本文就为大家介绍,集搜客GooSeeker网络爬虫如何在进行数据抓取时,自动抓取翻页后的数据。 在MS谋数台的爬虫路线工作台有三种 ...

2015-8-25 11:46

去资源库下载规则,轻松抓数据
去资源库下载规则,轻松抓数据
如果你不会做规则但又非常想直接抓取数据,或者是觉得做规则很难、耗时费力的初学者,可以到集搜客的资源库直接下载规则模板,直接抓取数据,体验规则是如何定义和运行的,会让你改观对网络爬虫的认识,抓取网页数据 ...

2015-8-21 10:24

如何深入多层级网页采集数据——以采集京东商品信息为例
如何深入多层级网页采集数据——以采集京东商品信息为例
从网站上采集数据,尤其采集大型网站时,被采集的数据往往位于网站的不同层级的网页上,要采集从当前页面(第一级页面)点击后弹出的网页(第二级页面)的内容时就要规划DS打数机的爬行路线,实现层级抓取。 实现层 ...

2015-8-12 10:14

集搜客网络爬虫安装说明
集搜客网络爬虫安装说明
集搜客软件的组成 集搜客GooSeeker网络爬虫是一款简单易用的网页信息抓取软件,能够轻松抓取网页文字、图表、超链接等多种网页元素。 集搜客网页抓取软件包含两个工具,分别是MS谋数台和DS打数机,如图1所示。MS谋数 ...

2015-8-11 14:34

从制作规则到采集数据的三个步骤
从制作规则到采集数据的三个步骤
对集搜客功能按钮有一定了解后,下面将讲解集搜客的实操应用,我们先从最基本的入门,下面将通过定义一个简单的抓取规则,来感受一下集搜客是如何使用的。按照以下三步走,就可以完成抓取规则的定义和抓取数据,如下 ...

2015-8-10 17:12

MS谋数台的操作界面
MS谋数台的操作界面
主界面 MS谋数台是定义抓取规则的软件工具,主界面分成三个区域 网页结构窗口:(左上部区域)用于定位被抓取的内容 工作台窗口:(右上部区域或者浮动工作台)大部分定义抓取规则的操作都在此区域完成 显示窗 ...

2015-8-8 17:07

DS打数机的操作界面
DS打数机的操作界面
菜单栏 菜单栏:包括文件、配置、高级和帮助四部分,通过这些菜单可以更好地控制和优化DS打数机的运行,下面将分别讲解。 文件 第一次运行,最好设置一下爬虫名字和存储路径。 爬虫名字:DS打数机初始名称都是默 ...

2015-8-7 17:31

DS打数机的功能按钮
DS打数机的功能按钮
菜单栏 菜单栏:包括文件、配置、高级和帮助四部分,通过这些菜单可以更好地控制和优化DS打数机的运行,下面将分别讲解。 文件 第一次运行,最好设置一下爬虫名字和存储路径。 爬虫名字:DS打数机初始名称都是默 ...

2015-8-6 15:53

集搜客GooSeeker专有名词解释
集搜客GooSeeker专有名词解释
样本页面 指用户定义抓取规则的网页页面。样本页面的内容结构具有代表性,在一个样本页面上定义的抓取规则可以适用于相同结构的所有页面,比如,针对京东网的一个商品页面定义一个抓取规则,就能用于抓取所有相同结 ...

2015-8-5 16:06

热门排行

关注我们

GMT+8, 2024-4-26 11:00