目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
怎样加载分析失败线索?
采集数据的过程中,有一些线索失败了,怎么加载这些线索,修改规则?
根据DS的线索编号加载规则分析失败原因
viewthread&tid=709&page=1&extra=#pid1369]采集过程的常见问题[/url] > 根据DS的线索编号加载规则分析失败原因[/size] 情景描述:在DS打数机进行抓取时可能会遇到抓取失败,这时日志栏会显示失败网址的线索编号 [align=center][attach]292[/attach] [/align] 解决方法: 1)将线索编号记下来,到MS谋数台进行加载,软件会判断规则与网页是否适用,不适用的话就会在输出窗口显示序号为***的抓取内容定位失败,然后重新映射规则2)按线索编号加载规则[b]操作步骤[/b]:进入MS谋数台→MS谋数台工具菜单栏→加载规则→按线索号[attach]9436
相对线索翻页失败,但是加载失败线索不显示失败原因
具体情况:加载后自动显示2018年部分,将2018年节点设为当前位置,2017年设为下一位置,DS抓取显示成功,但是只抓取了,无法点击2017后,抓取2017年内每期列表,再点击2016、并抓取2016年内每期列表,如此类推; 也没办法用定位线索,用2017-2012分别创立线索,用 Li 节点定位,均显示定位失败; 由于没有固定翻页记号,也无法使用记号线索。
抓取线索失败以后怎么跳过失败线索继续抓
[b]问[/b]:我想问下抓取线索失败以后怎么跳过失败线索继续抓?然后就不动了 [align=center][attach]239[/attach][/align] [b]答[/b]:那个失败的超时时间太长了设置1分钟试试,就会很快。现在应该是10分钟。新版本V5.2.0开始,初始超时时间缩短成1分钟,可以下载新版本:[url=http://www.gooseeker.com
失败线索批量导出
]/div/div/div/div[2]/div/ul/li[2]/a/span/span/span/em[2] 抓取失败的线索的内容项div/div[2]/div/ul/li[2]/a/span/span/span/em[2] 我用原来的规则随便加载了一个失败线索(还增加了超时时长),发现可以正常抓取,那为什么批量抓的时候会失败呢?问题二: 我想把所有失败线索批量导出来,统一再制作一个规则看看。但是怎么批量导出失败线索呢?
添加线索总是失败
[attach]1834[/attach] 用这种方法添加线索总是失败是什么原因
自动跳过失败线索
请咨询一下,如果抓多条线索中,其中有一条或几条显示匹配失败,能不能自动跳过失败的线索继续抓取下一条线索呢?
记号线索翻页失败?
按照教程做了记号线索翻页,采集的时候还是没有翻页,不知道什么原因。
怎么查看失败线索?
[i=s] 本帖最后由 bridge4 于 2020-10-14 19:43 编辑 [/i] 我的软件怎么不能查看失败线索中的网址啊
有关线索匹配失败问题
各位好,想问一下,我定义了一个爬虫,线索的话是自己批量导入的网址,在爬取过程中成功率有77%左右,剩下23%是匹配失败,请问一下匹配失败的话一般是什么原因呢,匹配失败如下图:[attach]11202[/attach],规则名称为:test_201908042,谢谢了!
抓取阿里巴巴商品线索,失败以后怎么更快跳过失败的线索继续抓
抓取阿里巴巴商品线索,失败以后怎么更快跳过失败的线索继续抓
激活失败线索结果会重复吗
有些线索采集失败了,重新激活,那最后采集结果会不会有重复
匹配失败的线索反复执行
求高手解答:模拟点击抓评论,当评论不存在的时候,匹配失败,但是线索的状态没有修改为失败,在第三条线索的时候有重复执行,一直反复
抓取失败的线索,不知道是什么原因导致失败的啊!
[i=s] 本帖最后由 759924607 于 2016-8-2 14:02 编辑 [/i] 下图是加载完失败的线索,显示的错误也就是整理箱的内容,全部定位失败了。线索号(70069442),本来准备找出错误原因,进行调整。但是全部定位失败,也无从下手啊。[attach]1191[/attach] 这个规则也并不是完全错误的,也有加载成功的线索。直接从谋数台直接搜索出来,然后加载规则,是完全没问题的。 大神帮分析下是啥原因啊!跪谢!
主题名:“材料抓取”抓取失败分析
主题名:“材料抓取”,失败提示:抓取规则不合适或者时间设置太短,求大神分析一下什么原因