我现在了最新版数据管家软件,现在版本号是10.0.1了,是不是要接替老版本网络爬虫软件

从新版数据管家左栏下面的帮助按钮进入的网页,已经不是以前的GooSeeker数据管家软件使用指导了,以后不再强调互补,而是全面替换吗?

这是我记录下来的以前的内容


3. 数据管家与网络爬虫互补:

按照集搜客软件开发规划,目前是V1版本,与集搜客网络爬虫V9版本互补。

    a. GooSeeker网络爬虫软件将逐步变成专业领域的海量采集软件,以发挥C++核心引擎的性能优势。

    b. 而内容分析和数据探索领域的数据采集、管理和分析将逐步由数据管家承担。



4. 在过渡期的互补:

    a. 数据管家软件在过渡期不具有自定义爬虫规则的功能,通过与网络爬虫软件互通,共同完成定义规则。参看案例《阿里巴巴外包询价网站用集搜客网络爬虫能采集吗?》

    b. 分散数据的采集使用网络爬虫规则,那么就用数据管家的数据摘录和标注功能,可摘录pdf文档。

    c. 数据管家软件的浏览器具有更好的兼容性,尤其是手机网页,如果网络爬虫软件打不开,那么就用数据管家的浏览器。




举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-11-9 10:19

沙发
Fuller 管理员 发表于 2020-11-9 10:19:11 | 只看该作者


是的,从V10版本开始,老版本网络爬虫软件不再发布新版本了,全面被新版本网络爬虫软件替代,新版本也叫 数据管家,因为集成了网络爬虫功能、文本分词和情感分析、内容摘录等软件功能,常用功能都集成在一起,更加易用。不常用的功能做了适当隐藏,更加简洁。

上面截图可以看出,左边工具条是各种功能的快捷入口。

如果点击最顶端的定义任务按钮,就会显示定义网络爬虫规则工作台,跟老版本的功能一致。在定义规则状态,底部会显示DOM结构,方便精确定位要爬取的网页内容。

在浏览网页区域的右上角和DOM区域的右上角都有一个悬浮菜单,分别为这两个区域提供管理功能


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-26 18:17