有效期2601-01-25

1. 下载说明(扩展模块版本:V5.0.1;配套的数据管家版本:至少V15.1.0;发布时间:2026年2月10日)

通过安装扩展模块,增强了GooSeeker分词和情感分析软件的文本挖掘功能。 可用的扩展功能罗列在本网页的左栏菜单中。这些扩展模块安装并运行在用户的本地电脑上,由 集搜客数据管家软件 调用扩展模块。所以,一定要按照顺序分别安装

  1. 数据管家软件:如果还没有安装,请加入集搜客QQ群(例如:472442022),从群文件夹《下载爬虫软件》下载,双击下载下来的软件即可安装。
  2. 扩展模块:从上述QQ群的群文件夹《下载聚类模块》下载到硬盘。【不要解压下载到的cluster.runner_xxx.zip文件,安装方法请看第二章】。 文件名中的xxx表示不同版本,包括:
    • Win64:windows 64位版本
    • MacOS_arm64:MacOS M系列芯片版本(新mac电脑)
    • MacOS_x64:MacOS Intel芯片版本(旧mac电脑)

我们将陆续发布一系列扩展模块,将逐步涵盖文本分类、主题分析、基于机器学习的其他文本分析,以及视频分析等等。下面是已经发布的模块:

2. 扩展模块的安装步骤

假定已经安装了 集搜客数据管家软件 (否则看第一章第一步),那么执行下面的步骤:

  1. 集搜客数据管家 软件中,点击左栏按钮“词”,即可打开 分词和情感分析软件 的界面
  2. 点击 分词和情感分析软件 的左栏菜单项:“聚类+其他”,就会再次进入本网页
  3. 点击本网页左栏的功能菜单(例如,文本聚类),如果还没有安装扩展模块,会弹出提示框,提示您下载和安装。点击安装按钮,选中刚刚下载到的cluster.runner_xxx.zip文件
  4. 【MacOS用户注意】由于不是从App Store下载的,如果运行扩展功能遇到错误(没有遇到错误就忽略本条),有可能要求对刚安装好的扩展模块进行授权。请看教程进行授权

3. 版本配套关系

扩展模块必须与指定版本的数据管家配套使用。请看下表:

扩展模块版本 数据管家版本 备注
V5.0.0及以上 V15.1.x 选词矩阵、共词矩阵采用边表格式;LDA增加洗牌功能
V4.0.0 V15.0.x 支持文本聚类、LDA分析、中英文分词、基于深度学习的情感分析、情绪聚类等功能
V3.0.0至V3.9.9 V14.5.x 支持文本聚类、LDA分析、情绪聚类等功能

4. 其他Python源代码:基于Jupyter Notebook

扩展模块虽然有直观的图形化界面,但是处理功能是固定的。如果您需要更多功能,请联系集搜客官方,我们将根据情况开发更多功能。 也可以自己编写python程序实现自定义的功能。我们提供了一系列python源代码,放在notebook中,实现对 GooSeeker分词和情感分析软件 生成的数据做进一步挖掘,比如,社会网络分析、数据清洗 等等。请进《 用集搜客分词软件和Jupyter Notebook做文本分析和数据探索的案例汇总

问题反馈