快捷导航

资讯

在Jupyter Notebook中为GooSeeker分词结果计算tf-idf
在Jupyter Notebook中为GooSeeker分词结果计算tf-idf
在什么场合下需要计算tf-idf?《GooSeeker分词和情感分析结果excel表怎样计算tf-idf》做了详细说明,在这里就不重复说了。在本notebook中重点对比一下计算tf或者tf-idf会对原始数据产生什么样的影响。 ...

2022-8-24 16:59

用networkx和python编程可视化分析共现词关系图
用networkx和python编程可视化分析共现词关系图
本notebook将演练使用networkx画社会网络分析图。然后在接下来的notebook中演练对图的化简,分别根据边权重化简和利用MST算法化简。

2022-8-23 15:59

共词分析中的共词关系是怎么得到的?
共词分析中的共词关系是怎么得到的?
本文将GooSeeker分词和情感分析软件生成的选词矩阵和共词矩阵excel文件读入到NumPy数组中,而且可以看到共词矩阵实际上是可以由选词矩阵生成的。我们把选词矩阵叫做关系矩阵R,那么共词矩阵叫做邻接矩阵A(adjacency ...

2022-8-22 11:22

GooSeeker分词和情感分析的结果怎样计算tf-idf
GooSeeker分词和情感分析的结果怎样计算tf-idf
GooSeeker分词和情感分析软件导出的数据表已经为计算TF-IDF准备了所有素材,用户只需选定合适的公式和公式中的参数(比如,log函数的底数)即可计算出来需要的TF或者TF-IDF。 ...

2022-8-18 15:28

GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式
GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式
Gephi支持相当多的输入格式,GooSeeker共词矩阵是一种邻接矩阵,可直接导入Gephi,不用转换。那么,本notebook仅仅是为了练习Python编程,练习输入文件格式转换,并熟悉Gephi的输入数据格式。 ... ...

2022-7-28 12:04

Gephi社会网络分析数据的批量生成和导入
Gephi社会网络分析数据的批量生成和导入
那么要使用Gephi进行网络分析,有哪几种生成和导入数据的方式可以使用呢?今天我们就此做探讨和学习。按照Gephi官网的介绍,Gephi的数据来源,下面几种是比较常用的: ...

2022-7-19 10:36

Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例 ...
Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例 ...
上一篇《社会网络可视化分析方法探索—Gephi分析工具的下载和安装》,记录了Gephi社会化网络工具在下载和安装过程中会碰到哪些问题及对应的处理方法。今天分享一篇范例《基于社会网络分析的网络公益信息传播研究—— ...

2022-7-18 16:51

GooSeeker分词软件手工加词和情感词是否会重叠统计
GooSeeker分词软件手工加词和情感词是否会重叠统计
GooSeeker分词和情感分析软件的用户常问的问题中有这两个:1. 如果我要分析的文本比较特殊,有很长的词,那么,我采取手工加词的方法,所加的词里面也有短词,而且,长词中会包含短词,词频统计结果是怎样的?2. 情 ...

2022-7-14 17:09

爬网页数据时怎样实现配对输入查询条件
爬网页数据时怎样实现配对输入查询条件
集搜客网络爬虫软件可以自动编排一组连续动作,实现在网页上输入查询条件、执行点击和选择,而且可以嵌套多层循环,不用手工定义循环,是自动编排的。虽然很早的版本已经实现了组合词输入法,但是,如果想在组合词输 ...

2022-7-7 08:48

互联网背景下知识付费发展与付费意愿影响因素探析——基于LDA与结构方程模型的分析 ...
互联网背景下知识付费发展与付费意愿影响因素探析——基于LDA与结构方程模型的分析 ...
本研究范例以慕课在线教育平台的一门计算机语言课程为例,使用集搜客网络爬虫工具,在多个官方网站获取了2004年至2019年期间,中国与美国的在线教育行业的市场规模、消费者价格指数(CPI) ...

2022-7-4 16:03

社会网络可视化分析方法探索—Gephi分析工具的下载和安装
社会网络可视化分析方法探索—Gephi分析工具的下载和安装
1. 说明近期社交媒体比如微博上的热点事件很多,吸引了很多用户参与讨论。这些为数据采集,数据预处理,数据分析和可视化的练手提供了很好的素材。借此机会,我们计划使用集搜客网络爬虫软件,集搜客微博采集工具箱 ...

2022-6-30 16:46

微博评论采集下来后怎样把发布时间转换成统一格式
微博评论采集下来后怎样把发布时间转换成统一格式
微博发布时间有很多格式,不统一就没法做进一步数据分析,那么,对微博评论采集结果进行格式化或其它数据预处理的时候怎样同意转换时间格式?在Jupyter Notebook下使用python进行处理的方法是怎样的? ...

2022-6-21 11:31

Jupyter Notebook将京东商品参数数据表做行列转换
Jupyter Notebook将京东商品参数数据表做行列转换
本模板对采集结果数据表进行类似于Excel的处理,把采集到的每个商品的多条excel记录(对应多个参数),清洗成:每个商品一行,每个参数一列。

2022-5-30 16:44

集搜客分词软件情感分析算法升级通知
集搜客分词软件情感分析算法升级通知
用户添加自定义情感词的时候,可以加单字的情感词、程度词、否定词,因为单字匹配到的概率大大提高,往往会与多字的词发生重叠识别,老版本会分析出很不准确的结果。新版本对这种情况也做了改进。 ... ... ...

2022-5-13 16:08

为什么要为层次分析法(AHP)计算特征值和特征向量
为什么要为层次分析法(AHP)计算特征值和特征向量
很多文章或者教程一开始就提到判别矩阵是“正互反矩阵”以及一堆特性,这样白白增加了畏惧感,增大了理解的阻力。那么,正确的做法是:从层次分析法的判别矩阵的生成过程来理解,先忽视“互反”这些令人畏惧的字眼。 ...

2022-5-10 09:57

GMT+8, 2022-12-10 12:37