集搜客网络爬虫的核心名词

2016-10-1 12:30| 发布者: Fuller| 查看: 147418| 评论: 14

摘要: 集搜客网络爬虫的操作方法很直观,想要什么,就把他们标记出来,网络爬虫就会自动把他们存下来。标记过程很自由,不讲究顺序。一、直观标注在网页上,看到想采集的内容,点击两次,就弹出一个标签,给标签起个名字。 ...

配套软件版本:V9及更低 集搜客网络爬虫软件

新版本对应教程:V10及更高 数据管家——增强版网络爬虫 的对应教程是《集搜客网络爬虫的核心名词


注:集搜客GooSeeker爬虫从V9.0.2版本开始,爬虫术语“主题”统一改为“任务”,在爬虫浏览器里先命名任务再创建规则,然后登录集搜客官网会员中心的“任务管理”里,就可以查看任务的采集执行情况、管理线索网址以及做调度设置了。

集搜客网络爬虫的操作方法很直观,想要什么,就把他们标记出来,网络爬虫就会自动把他们存下来。标记过程很自由,不讲究顺序。

一、直观标注

在网页上,看到想采集的内容,点击两次,就弹出一个标签,给标签起个名字。把所有要采集的内容逐个这样标注。不分先后顺序。

二、整理箱

采集到的内容要存到一个表格里面,这个表格就叫整理箱,表示:“把网页上的内容整理好,存在一个箱子中”。这个整理箱显示在右边的一个浮动工作台上。


三、映射

“映射”这个词经常出现,表示:“把网页上的内容与整理箱中的标签建立联系”。标注过程就是建立映射关系,有了这个关系,网络爬虫就知道从哪里采集数据并存储到哪里。


开始阅读《从入门到精通


若有疑问可以集搜客网络爬虫
75

鲜花
10

握手
3

雷人
9

路过
11

鸡蛋

刚表态过的朋友 (108 人)

相关阅读

发表评论

最新评论

评论 13738075766 2020-5-18 09:44
wwj
评论 linvo20 2020-3-15 08:32
X抓打不开商品列表,原本想试试能不能替代它或X手工具,结果都看不明怎样用
评论 Fuller 2018-5-30 22:30
wyw_up: 怎么循环点击抓取啊,谁能帮我下
这这里无法贴图,我建议你在“使用交流”版块发个帖子。说说你想要的循环点击是什么?比如,在京东商品列表页上点击每个商品采集他们的详情吗?如果是这个,不用循环点击,用层级采集,层级采集可以并行多个爬虫窗口一起采,大量数据采集的时候最有用。参看:https://www.gooseeker.com/doc/article-343-1.html
评论 wyw_up 2018-5-30 21:33
怎么循环点击抓取啊,谁能帮我下
评论 daiandy 2017-11-9 23:42
打发时光隧道个
评论 shengchengx 2017-8-9 16:05
18021015980: 新手上路???根本看不懂,上啥路?客户一个劲的让定制
可以看视频教程的
评论 18021015980 2017-8-9 16:02
新手上路???根本看不懂,上啥路?客户一个劲的让定制
评论 yanbog 2017-7-5 10:39
一点卵用都没有
评论 shenzhenwan10 2017-5-4 18:57
machuhui: 没意思
可以看教程http://www.gooseeker.com/tuto/tutorial.html, 自己做规则和抓数据. 如果不想学, 也可以使用定制服务, 由专业人员帮你做规则和/或采数据
评论 machuhui 2017-5-4 17:27
没意思
评论 machuhui 2017-5-4 17:27
用不了。。。。。。。。。
评论 xtuisoft 2017-4-10 15:27
直观,简单,赞~~
评论 candormarcia 2017-3-31 17:58
学习了~~~谢谢。
评论 shanyue 2017-3-10 14:25
学习一下

查看全部评论(14)

GMT+8, 2024-12-11 18:18