快捷导航

集搜客网络爬虫的核心名词

2016-10-1 12:30| 发布者: Fuller| 查看: 74991| 评论: 12

摘要: 集搜客网络爬虫的操作方法很直观,想要什么,就把他们标记出来,网络爬虫就会自动把他们存下来。标记过程很自由,不讲究顺序。一、直观标注在网页上,看到想采集的内容,点击两次,就弹出一个标签,给标签起个名字。 ...

集搜客网络爬虫的操作方法很直观,想要什么,就把他们标记出来,网络爬虫就会自动把他们存下来。标记过程很自由,不讲究顺序。

一、直观标注

在网页上,看到想采集的内容,点击两次,就弹出一个标签,给标签起个名字。把所有要采集的内容逐个这样标注。不分先后顺序。

二、整理箱

采集到的内容要存到一个表格里面,这个表格就叫整理箱,表示:“把网页上的内容整理好,存在一个箱子中”。这个整理箱显示在右边的一个浮动工作台上。


三、映射

“映射”这个词经常出现,表示:“把网页上的内容与整理箱中的标签建立联系”。标注过程就是建立映射关系,有了这个关系,网络爬虫就知道从哪里采集数据并存储到哪里。


开始阅读《从入门到精通


若有疑问可以集搜客网络爬虫
35

鲜花
5

握手
2

雷人
6

路过
3

鸡蛋

刚表态过的朋友 (51 人)

相关阅读

发表评论

最新评论

评论 Fuller 2018-5-30 22:30
wyw_up: 怎么循环点击抓取啊,谁能帮我下
这这里无法贴图,我建议你在“使用交流”版块发个帖子。说说你想要的循环点击是什么?比如,在京东商品列表页上点击每个商品采集他们的详情吗?如果是这个,不用循环点击,用层级采集,层级采集可以并行多个爬虫窗口一起采,大量数据采集的时候最有用。参看:https://www.gooseeker.com/doc/article-343-1.html
评论 wyw_up 2018-5-30 21:33
怎么循环点击抓取啊,谁能帮我下
评论 daiandy 2017-11-9 23:42
打发时光隧道个
评论 shengchengx 2017-8-9 16:05
18021015980: 新手上路???根本看不懂,上啥路?客户一个劲的让定制
可以看视频教程的
评论 18021015980 2017-8-9 16:02
新手上路???根本看不懂,上啥路?客户一个劲的让定制
评论 yanbog 2017-7-5 10:39
一点卵用都没有
评论 shenzhenwan10 2017-5-4 18:57
machuhui: 没意思
可以看教程http://www.gooseeker.com/tuto/tutorial.html, 自己做规则和抓数据. 如果不想学, 也可以使用定制服务, 由专业人员帮你做规则和/或采数据
评论 machuhui 2017-5-4 17:27
没意思
评论 machuhui 2017-5-4 17:27
用不了。。。。。。。。。
评论 xtuisoft 2017-4-10 15:27
直观,简单,赞~~
评论 candormarcia 2017-3-31 17:58
学习了~~~谢谢。
评论 shanyue 2017-3-10 14:25
学习一下

查看全部评论(12)

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-12-17 13:18