版本更新的详细描述以跟帖的形式发布,请注意查看
全新升级:从V10版本,网络爬虫软件采用最新的浏览器内核,又名“数据管家”,请下载使用数据管家
老版本版本介绍参看版本发布公告
版本发布历史纪录:
V12.3.3 2024-10-07:1. 增强采集瀑布流网页的稳定性
V12.3.1 2024-09-18:1. 自定义xpath包含gs_root标签时,可以含有gs_xpath标签,以采集属性和text节点
V12.3.0 2024-09-11:1. 允许给整理箱自定义xpath;2. 自定义xpath允许包含gs_root标签;3. 在列表页上下载所有图片,将图片网址等信息放在每条数据的xml片段内
V12.1.3 2024-05-26:1. 升级到平台V30;2. 增强iframe内的内容采集功能
V11.4.1 2023-06-06:1. 升级到平台V24;2. 解决bug
V11.1.0 2022-07-07:1. 升级到平台V18;2. 增加设置项,可控制存pdf时是否只存首页;3. 同一个规则中允许设置多个同名输入动作,构成组合输入;
V11.0.1 2021-09-01:1. 解决旗舰版用户使用连续输入动作停止不了的bug;2. iframe加载pdf文档时,会错误地将这个pdf当成整个页面,本版本解决了这个bug
V11.0.0 2021-08-12:1. 启用新的安全保护平台;2. 增加弹窗模式下下载文件功能,实现下载网址跳转后的文件;3. 解决用post消息打开新窗口的bug
V10.8.2 2021-07-15:1. 采集视频评论前禁止播放;2. 解决mac版使用顶部菜单开启定义规则时出现错误提示问题;3. 解决翻页数限制为1页时采集不了多级任务的问题
V10.8.1 2021-07-07:1. 禁止进入省电模式导致爬虫速度变慢;2. F12作为快捷键可进入和退出定义规则状态;3. 优化分析页面的速度
V10.8.0 2021-06-28:1. 实现自动关闭弹窗功能;2. 实现转存规则到其他服务器的功能;3. 升级开发平台到V13
V10.7.1 2021-06-10:1. 解决bug:网页上存在无效namespace时候,采集内容中含有错误信息;2. 解决bug:采集iframe的时候,加载规则失败
V10.7.0 2021-06-07:1. 实现proxy换IP功能,已对接芝麻HTTP;2.采集纯文本内容,可以选择添加换行,采集div, p, li, h1-h6, br这些元素内容的时候都额外添加了换行;3.增加有道词典和百度翻译
V10.6.3 2021-05-11:1. 采集svg图中的文字;2.增加跨域下图功能;3.提升微博采集的速度
V10.6.2 2021-04-25:1. 提高含有iframe的网页的采集性能;2.标注位置随着窗口大小变化进行调整
V10.6.1 2021-04-15:1. 解决因为某个步骤定位不到节点而造成连续动作终止的问题
V10.6.0 2021-04-05:1. 支持滚轮动作采集B站评论;2. 快捷采集连续滚屏的任务可以设定滚动次数;3.采集输入框中的动态内容
V10.5.0 2021-03-22:1. 实现打码功能;2. 解决MacOS Big Sur下闪退问题;3.企业版加密机制升级
V10.4.0 2021-03-08:1. 提供冻结页面功能;2. 提高爬虫的性能,降低磁盘占用率
V10.3.0 2021-02-23:1. 支持弹窗采集(也叫飞掠模式);2. 修改增量采集完成后线索状态错误;3. 解决企业版上载采集结果失败问题
V10.2.0 2021-01-25:1. 优化iframe的提取方式;2. 解决了下载视频和图片的bug
V10.1.2 2021-01-12:1. 解决iframe的翻页规则加载失败的bug;2. 增加复制和粘贴右键弹出菜单
V10.1.1 2021-01-03:1. 优化高精度点击和窗口置顶功能;2. 支持自签发证书网站的打开
V10.1.0 2020-12-23:1. 实现自动截图; 2. 实现监听http; 3. 实现清除老数据
V10.0.4 2020-11-20:1. 解决无法导入大结果文件问题; 2. 实现分析失败线索功能
V10.0.3 2020-11-19:1. 解决无法生成深层文件夹的bug; 2. 解决同步登录会员中心的bug
V10.0.2 2020-11-18:1. 全功能的网络爬虫
V1.7.3 2020-07-19:1. 左栏增加进入微博采集工具箱的按钮;2.工具条增加打开本地文件按钮
V1.7.1 2020-07-10:1. 开启mac版与集搜客网络爬虫软件之间的互通
|
|
|
|
|
共 32 个关于本帖的回复 最后回复于 2 小时前