11 34791

大神两步解释集搜客抓取原理

wangyong 于 2015-11-24 17:14 发表 置顶 [复制链接]
本帖最后由 xandy 于 2016-11-11 14:49 编辑

原理很简单:
第一步:建立一个整理箱,这里就是存储你要抓的内容
第二步:告诉程序,网页上的什么内容要丢到整理箱中。
剩下的就由程序自动做了。

两个新词别怕:
1,整理箱:前面在第一步中已经说了,放东西的,放抓取内容
2,映射:就是第二步要做的事,用“映射”告诉程序:网页上哪些内容是要采的

有些网页本身比较复杂,有些网页结构很乱,就得去一点点掌握些技巧。纯小白入门,可以从一个最简单的教程开始。
所以刚接触集搜客的同学不要觉得集搜客比较难有所畏惧,教程为大家都科学的规划好了,一步一步的学习,数据抓取其实没有大家想象的那么难。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2019-11-1 16:16

wangyong 版主 发表于 2019-11-1 16:16:19 | 显示全部楼层
举报 使用道具
xandy 论坛元老 发表于 2015-11-25 09:51:13 | 显示全部楼层
还是从小白开始
举报 使用道具
elegantcoin 中级会员 发表于 2016-9-1 11:57:48 | 显示全部楼层
还是从小白开始
举报 使用道具
lichenghai20 新手上路 发表于 2016-9-12 08:32:13 | 显示全部楼层
还是从小白开始!看不懂啊
举报 使用道具
markjl 新手上路 发表于 2016-10-8 17:27:31 | 显示全部楼层
哪里有下载链接?
举报 使用道具
Fuller 管理员 发表于 2016-10-8 17:30:14 | 显示全部楼层
markjl 发表于 2016-10-8 17:27
哪里有下载链接?

下载软件在这里:http://www.gooseeker.com/pro/product.html

分mac版和windows版
举报 使用道具
markjl 新手上路 发表于 2016-10-8 17:43:46 | 显示全部楼层
收到,谢谢!
举报 使用道具
fujiale 新手上路 发表于 2016-12-12 21:50:11 | 显示全部楼层
感觉比火车头简单多了
举报 使用道具
kingzmf 新手上路 发表于 2016-12-30 08:53:01 | 显示全部楼层
还是从小白开始
举报 使用道具
skyup123 新手上路 发表于 2017-3-15 22:18:19 | 显示全部楼层
好棒
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结

热门用户

GMT+8, 2024-12-10 09:50