目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
从制作规则到采集数据的三个步骤
对集搜客功能按钮有一定了解后,下面将讲解集搜客的实操应用,我们先从最基本的入门,下面将通过定义一个简单的抓取规则,来感受一下集搜客是如何使用的按照以下三步走,就可以完成抓取规则的定义和抓取数据,如下 ...
从制作规则到采集数据的三个步骤
[i=s] 本帖最后由 wangyong 于 2018-4-10 18:04 编辑 [/i] [media=x,1000,750]http://v.youku.com/v_show/id_XMzI3MzM5OTEzNg==.html[/media] [url=https://pan.baidu.com/s/1HhZpeesRigk70vZph3LI5w]不想看广告?直接下视频[/url]
规则制作失败
[attach]7842[/attach] [attach]7843[/attach] 规则加载失败,规则corp_detail_info
请问用连续动作 做动作的是一个规则 搜集数据一个规则 那我导出数据就从实际取数那个规则导出数据是嘛
请问用连续动作 做动作的是一个规则 搜集数据一个规则 那我导出数据就从实际取数那个规则导出数据是嘛
为什么我按照“模拟点击切换到另一标签窗口采数据”制作的规则,不会链接到二级规则
[attach]6167[/attach] 两个规则的主题分别是 “五八数据测试”和“五八数据测试二级” 可以帮我看下吗
制作规则采集淘宝商品弹出广告了。。
[attach]9219[/attach] 制作淘宝商品规则的时候弹出广告了,没办法映射到要采集的内容,怎样才能关闭?
58采集规则定制
http://bj.58.com/qzwenziluru/ 能否采集到 姓名, 性别,年龄 这些加密数据。能做规则的联系我:[qq]515461845[/qq]
如何从上图内容中采集到下图结果,操作细则询问
[attach]15941[/attach] [attach]15942[/attach] [url]https://www.nutridata.cn/database/ingredient/112?date=1697089348428&baseId=1[/url]
制作规则时弹出广告
我在制作规则时,输入网址,会先弹出一个广告页面,采集的内容覆盖住了,怎么办?
制作规则的常遇问题
mod=viewthread&tid=703&page=1&extra=#pid1353]制作规则—常见问题导航[/url] > 制作规则的常遇问题[/size] [list] [*][url=http://www.gooseeker.comurl] [*][url=http://www.gooseeker.com/doc/article-119-1.html]规则怎么制作url] [*][url=http://www.gooseeker.com/doc/article-124-1.html]规则保存在哪里][url=http://www.gooseeker.com/doc/thread-673-1-1.html]怎么创建新规则
快速制作规则及获取规则提取器API
这就是本篇文章的主要内容了,本文使用一个案例说明怎样将新定义的采集规则融入到爬虫框架中。也就是用可视化的集搜客GooSeeker爬虫软件针对亚马逊图书商品页做一个采集规则,并结合规则提取器抓取网页内容。开始制作抓取规则[/b][/size][size=3] [/size] [size=3][b]3.1 运行规则定义软件[/b]:点击浏览器菜单:工具-> MS谋数台 弹出MS谋数台窗口[/size] [size=3][b]3.2 在网址栏输入我们要采集的网站链接总结[/b][/size][size=3] [/size] [size=3]制作规则时,由于定位选择的是偏好id,而采集网址的第二页对应页面元素的
快速制作规则及获取规则提取器API
在网页抓取工作中,调试正则表达式或者XPath都是特别繁琐的,耗时耗力,工作枯燥,如果有一个工具可以快速生成规则,而且可以可视化的即时验证,就能把程序员解放出来,投入到创造性工作中。
制作规则—常见问题导航
url=http://www.gooseeker.com/doc/forum-55-1.html]常见问题[/url] > 制作规则] [*][url=http://www.gooseeker.com/doc/thread-690-1-1.html]制作规则的常遇问题] [*][url=http://www.gooseeker.com/doc/thread-704-1-1.html]采集多层级网页数据] [*][url=http://www.gooseeker.com/doc/thread-699-1-1.html]规则怎么查看[*][url=http://www.gooseeker.com/doc/thread-700-1-1.html]保存规则失败
#求助#如何制作翻页规则?
不知道为什么做不了记号线索,然后打算试试相对线索,发现12345点完后不是跟着678910,然后还有个后5页,不知道应该怎么制作规则了
定制规则后无法跳转页面无法采集数据
图1是需要采集的数据,主要采集内容:企业简称,企业标签 页面一直停留在第一页,没有自动跳转 规则定制完成后,进行了测试,显示如图2没有具体的采集内容,有人可以帮忙分析一下规则么?