问题1:在分词工具页面有操作说明,内容里有说可以利用分词结果出来的各种数据,“通过统计运算和数据挖掘运算,可以得出很多量化的结论。”然后下面就出现一些图表,可是不知道这些图表都是如何做出来的?在分词工具里没找着,然后操作说明里也没说清楚,是不是还要借助其他统计软件来制作,具体操作过程是什么?
问题2:用分词工具做的社会网络分析图看不出中心词,于是就把共词矩阵表拿UCINET软件中用Netdraw再去做社会网络图,结果图跟一团乱麻一样,黑乎乎的一团,图很难看,不知道是不是共词数据太多了还是别的什么原因,我也曾尝试将原始采集数据直接用ROST CM软件去做词频分析和社会网络分析,结果Netdraw竟然出不来图,都不知道为什么,哪里操作有误,而且我发现用ROST做的词频分析和集搜客分词工具做的词频分析结果不太一样,到底要怎么用这些软件才能做出能够显示中心词的那种社会网络图呢?

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-4-20 23:41

沙发
Fuller 管理员 发表于 2020-4-20 23:41:30 | 只看该作者
关于问题1:集搜客分词工具是一个基础工具,在分词、筛选特征词、情感分析和分类的基础上,对词或者类别进行统计,可以做一些图表。集搜客网站上介绍的一些图表不是分词工具直接生成的,是自己确定一个数据统计的指标体系以后统计出来的。

关于问题2:首先分析的内容确实要有中心词才行,有些网络内容东扯西拉,说了一堆话,提到很多主题,这种堆砌起来的内容通常没有中心词。而一些正式的文章,尤其是论述某个问题的文章,中心词就很明显。

连线太多了就看不清了,要选择少量的词,比如,50几个词。

每个分词软件的分词算法不太一样,词频统计会不一样。有些专用名词很容易被切开,就会统计数量变少
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-4 19:52