快捷导航

文档

连续动作:如何把抓到的信息与动作步骤对应起来—以58同城为例 ... ...
连续动作:如何把抓到的信息与动作步骤对应起来—以58同城为例 ... ...
一、操作步骤 想要把抓到的信息与动作步骤一一对应起来,就得把动作对象的信息也提取下来。本教程适用于悬浮、点击、双击、提交等四种动作,讲解如何把其动作对象的节点值给抓取下来;滚屏、打码、回退和滚轮则是没 ...

2017-8-9 16:18

去资源库下载规则,轻松抓数据
去资源库下载规则,轻松抓数据
海量规则模板,免去做规则烦恼。如果你不会做规则但又非常想直接抓取数据,可以到集搜客的资源库直接下载规则模板,直接抓取数据。集搜客的资源库拥有大量成熟的规则模板,提供微信、微博、电商、新闻、论坛、行业等 ...

2017-6-16 09:26

【第60期】集搜客爬虫入门
【第60期】集搜客爬虫入门
我们知道,爬虫是用来收集网络上公开且可访问的信息,而集搜客爬虫是以结构化的格式来把网页信息抓取下来,可以得到二维关系表,即Excel表,要实现这个,要掌握的最基本操作就是映射,通过把网页信息元素映射到自己 ...

2017-6-2 18:12

【第59期】集搜客爬虫入门
【第59期】集搜客爬虫入门
很多人问过爬虫能做什么?作为拥有10年爬虫行业经验的领跑者之一,就给大家科普一下吧。爬虫是一类快速获取数据的程序/工具软件,这里的数据是指互联网上公开的网页信息,你不用先有一个网站或APP,坐在家里,用一台 ...

2017-5-18 15:30

【第58期】集搜客爬虫入门三部曲
【第58期】集搜客爬虫入门三部曲
想要自己使用集搜客爬虫批量采集网页信息,需要掌握如何对网页定义采集规则、如何运行规则采集批量网页、如何把采到的xml数据文件转为其他格式(官网支持转为Excel,其他格式需要自己转),这些东西都可以在教程的“ ...

2017-5-12 14:59

【第57期】电商数据一键采集
【第57期】电商数据一键采集
想要把电商某类商品的价格、图片、文字介绍、商品参数、推广活动等信息搜罗在手,你可以不用学习爬虫软件,也不用学习Python编程,直接使用集搜客爬虫提供的数据DIY资源,上面有各大主流电商平台的爬虫程序,只需选 ...

2017-5-12 14:39

【第56期】汽车之家帖子图文采集
【第56期】汽车之家帖子图文采集
上节培训介绍了汽车之家的一个论坛版块的列表采集,这次培训就会讲解点击进入帖子的详情页面里,把楼主和跟帖的图文信息都采集下来,这里依然会用到样例复制、翻页等列表信息采集常用的技巧,并且,定位标志映射也建 ...

2017-5-12 14:26

【第54期】微博点赞用户采集
【第54期】微博点赞用户采集
要采集微博的点赞用户信息(ID、微博名称、主页网址、头像图片网址等信息),首先得点击该条微博的发布时间,进入该篇微博的独立详情页面,以它为模板来制作点赞用户的规则,此时微博下面显示的是用户评论信息,所以 ...

2017-5-12 12:04

【第53期】热点新闻采集
【第53期】热点新闻采集
互联网上有很多新闻门户网站,它们各自的网页结构都不相同,要采集不同新闻网站发布的新闻全文信息,就要分别做采集规则,例如,通过百度新闻搜索到的是大部分新闻门户网站的新闻摘要,这里是以百度规定的网页结构显 ...

2017-5-12 11:50

【第55期】汽车之家论坛采集培训
【第55期】汽车之家论坛采集培训
采集论坛上的信息,不用一个个帖子采集,通过集搜客爬虫可以实现批量化采集。首先论坛有多个版块的情况,要以一个版块为模板,找到该版块的帖子列表,做第一级采集规则,要把所有帖子的网址采集下来,这是为了下一步 ...

2017-5-12 11:11

知乎话题结构分析
知乎话题结构分析
请注意:一定要用爬虫群模式运行,请仔细看下面的说明。一、采集规则主题名:知乎话题结构分析下载地址:二、运行方法下载了本规则以后,要进入会员中心, ... ... ... ... ...

2017-3-29 23:37

【第52期】今日头条热点新闻采集
【第52期】今日头条热点新闻采集
用集搜客网络爬虫来采集新闻,可以免除人力的烦琐,做好规则就能轻松地批量采集新闻信息。具体操作是:要分别对新闻列表页面和新闻详情页面做采集规则,第一级规则用于采集新闻列表,先把单条的新闻标题、摘要、链接 ...

2017-3-22 15:31

【第51期】赶集网、58同城、房天下房源采集
【第51期】赶集网、58同城、房天下房源采集
利用数据DIY的现成爬虫,可以免做规则,找到想要采集的网页类型,直接添加网址就能采集数据,非常简便省事。本次培训主要是讲解房地产的房源信息采集,以赶集网、58同城、房天下为例,讲解直接用数据DIY上面提供的现 ...

2017-3-13 17:47

【第50期】安居客、链家、Q房网房源采集
【第50期】安居客、链家、Q房网房源采集
利用数据DIY的现成爬虫,可以免做规则,找到想要采集的网页类型,直接添加网址就能采集数据,非常简便省事。本次培训主要是讲解房地产的房源信息采集,以安居客、链家、Q房网为例,讲解直接用数据DIY上面提供的现成 ...

2017-3-13 17:39

【第49期】微博话题、粉丝、评论转发采集
【第49期】微博话题、粉丝、评论转发采集
利用数据DIY的现成爬虫,可以免做规则,找到想要采集的网页类型,直接添加网址就能采集数据,非常简便省事。本次培训主要是讲解从微博话题做为入口,如何一步步拓展采集更多信息。简单来说,通过微博话题可以采集到 ...

2017-3-13 17:26

热门排行

关注我们

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-9-21 04:02