资讯

用皮尔森相关系数表示共词矩阵是否能用来做社会网络分析
用皮尔森相关系数表示共词矩阵是否能用来做社会网络分析
皮尔森相关系数和余弦相似度系数是一类的,他们度量的是夹角的cosine值;而协方差和点积(共词矩阵是点积的结果)是一类的,他们度量的是一个向量向另一个向量投影后的大小。但是,在向量空间中,这些变化都不能改善 ...

2022-9-5 10:37

Gephi案例-基于引文网络和语义分析的技术演化路径识别及拓展研究 ...
Gephi案例-基于引文网络和语义分析的技术演化路径识别及拓展研究 ...
本文提出了一种将专利引文网络与 SAO 语义分析方法结合,以提取技术演化路径从而识别技术发展趋势的方法,并以全固态锂离子电池为例进行了分析。该方法在构建专利引文网络基础上,通过社群划分及 SPC 算法提取主路径 ...

2022-9-1 11:08

对共词关系求协方差矩阵后是否有更好的社会网络分析结果? ... ... ... ... ...
对共词关系求协方差矩阵后是否有更好的社会网络分析结果? ... ... ... ... ...
本notebook准备使用协方差矩阵来描述共词关系,同共词矩阵相比,这可以看作是更加细腻的考察,因为通过去中心化计算,词在文档中的分布规律不再是非负数描述的,而是有正有负,可以看作是有涨有跌 ... ... ... ... ...

2022-8-30 15:49

使用Python设置边权重阈值裁剪共词关系社会网络图
使用Python设置边权重阈值裁剪共词关系社会网络图
用MST的时候,发现裁剪的太厉害,而且由于两个普遍词造成MST树几乎就是一个星状结构,很难观察到有价值的信息。当时我们计划采用其他度量距离的方法再看看能否有更多发现。而在这之前,我们先试试通过设定边的权重阈 ...

2022-8-29 12:04

用MST(minimum or maximum spanning tree)算法简化共现词关系图
用MST(minimum or maximum spanning tree)算法简化共现词关系图
本notebook将演示MST计算方法,下一篇notebook将演示通过设定边权重的阈值来简化图。MST一般是minimum spanning tree的简称,是图算法中的一个最最基础的算法,基于这个算法,可以把graph变成tree,每个节点只留一条 ...

2022-8-26 09:38

在Jupyter Notebook中为GooSeeker分词结果计算tf-idf
在Jupyter Notebook中为GooSeeker分词结果计算tf-idf
在什么场合下需要计算tf-idf?《GooSeeker分词和情感分析结果excel表怎样计算tf-idf》做了详细说明,在这里就不重复说了。在本notebook中重点对比一下计算tf或者tf-idf会对原始数据产生什么样的影响。 ... ... ...

2022-8-24 16:59

用networkx和python编程可视化分析共现词关系图
用networkx和python编程可视化分析共现词关系图
本notebook将演练使用networkx画社会网络分析图。然后在接下来的notebook中演练对图的化简,分别根据边权重化简和利用MST算法化简。

2022-8-23 15:59

共词分析中的共词关系是怎么得到的?
共词分析中的共词关系是怎么得到的?
本文将GooSeeker分词和情感分析软件生成的选词矩阵和共词矩阵excel文件读入到NumPy数组中,而且可以看到共词矩阵实际上是可以由选词矩阵生成的。我们把选词矩阵叫做关系矩阵R,那么共词矩阵叫做邻接矩阵A(adjacency ...

2022-8-22 11:22

GooSeeker分词和情感分析的结果怎样计算tf-idf
GooSeeker分词和情感分析的结果怎样计算tf-idf
GooSeeker分词和情感分析软件导出的数据表已经为计算TF-IDF准备了所有素材,用户只需选定合适的公式和公式中的参数(比如,log函数的底数)即可计算出来需要的TF或者TF-IDF。 ... ...

2022-8-18 15:28

GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式
GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式
Gephi支持相当多的输入格式,GooSeeker共词矩阵是一种邻接矩阵,可直接导入Gephi,不用转换。那么,本notebook仅仅是为了练习Python编程,练习输入文件格式转换,并熟悉Gephi的输入数据格式。 ... ...

2022-7-28 12:04

Gephi社会网络分析数据的批量生成和导入
Gephi社会网络分析数据的批量生成和导入
那么要使用Gephi进行网络分析,有哪几种生成和导入数据的方式可以使用呢?今天我们就此做探讨和学习。按照Gephi官网的介绍,Gephi的数据来源,下面几种是比较常用的: ...

2022-7-19 10:36

Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例 ...
Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例 ...
上一篇《社会网络可视化分析方法探索—Gephi分析工具的下载和安装》,记录了Gephi社会化网络工具在下载和安装过程中会碰到哪些问题及对应的处理方法。今天分享一篇范例《基于社会网络分析的网络公益信息传播研究—— ...

2022-7-18 16:51

GooSeeker分词软件手工加词和情感词是否会重叠统计
GooSeeker分词软件手工加词和情感词是否会重叠统计
GooSeeker分词和情感分析软件的用户常问的问题中有这两个:1. 如果我要分析的文本比较特殊,有很长的词,那么,我采取手工加词的方法,所加的词里面也有短词,而且,长词中会包含短词,词频统计结果是怎样的?2. 情 ...

2022-7-14 17:09

爬网页数据时怎样实现配对输入查询条件
爬网页数据时怎样实现配对输入查询条件
集搜客网络爬虫软件可以自动编排一组连续动作,实现在网页上输入查询条件、执行点击和选择,而且可以嵌套多层循环,不用手工定义循环,是自动编排的。虽然很早的版本已经实现了组合词输入法,但是,如果想在组合词输 ...

2022-7-7 08:48

互联网背景下知识付费发展与付费意愿影响因素探析——基于LDA与结构方程模型的分析 ...
互联网背景下知识付费发展与付费意愿影响因素探析——基于LDA与结构方程模型的分析 ...
本研究范例以慕课在线教育平台的一门计算机语言课程为例,使用集搜客网络爬虫工具,在多个官方网站获取了2004年至2019年期间,中国与美国的在线教育行业的市场规模、消费者价格指数(CPI) ...

2022-7-4 16:03

GMT+8, 2024-5-24 02:30