资讯

GooSeeker分词和情感分析的结果怎样计算tf-idf
GooSeeker分词和情感分析的结果怎样计算tf-idf
GooSeeker分词和情感分析软件导出的数据表已经为计算TF-IDF准备了所有素材,用户只需选定合适的公式和公式中的参数(比如,log函数的底数)即可计算出来需要的TF或者TF-IDF。 ... ...

2022-8-18 15:28

GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式
GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式
Gephi支持相当多的输入格式,GooSeeker共词矩阵是一种邻接矩阵,可直接导入Gephi,不用转换。那么,本notebook仅仅是为了练习Python编程,练习输入文件格式转换,并熟悉Gephi的输入数据格式。 ...

2022-7-28 12:04

Gephi社会网络分析数据的批量生成和导入
Gephi社会网络分析数据的批量生成和导入
那么要使用Gephi进行网络分析,有哪几种生成和导入数据的方式可以使用呢?今天我们就此做探讨和学习。按照Gephi官网的介绍,Gephi的数据来源,下面几种是比较常用的: ...

2022-7-19 10:36

Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例 ...
Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例 ...
上一篇《社会网络可视化分析方法探索—Gephi分析工具的下载和安装》,记录了Gephi社会化网络工具在下载和安装过程中会碰到哪些问题及对应的处理方法。今天分享一篇范例《基于社会网络分析的网络公益信息传播研究—— ...

2022-7-18 16:51

GooSeeker分词软件手工加词和情感词是否会重叠统计
GooSeeker分词软件手工加词和情感词是否会重叠统计
GooSeeker分词和情感分析软件的用户常问的问题中有这两个:1. 如果我要分析的文本比较特殊,有很长的词,那么,我采取手工加词的方法,所加的词里面也有短词,而且,长词中会包含短词,词频统计结果是怎样的?2. 情 ...

2022-7-14 17:09

爬网页数据时怎样实现配对输入查询条件
爬网页数据时怎样实现配对输入查询条件
集搜客网络爬虫软件可以自动编排一组连续动作,实现在网页上输入查询条件、执行点击和选择,而且可以嵌套多层循环,不用手工定义循环,是自动编排的。虽然很早的版本已经实现了组合词输入法,但是,如果想在组合词输 ...

2022-7-7 08:48

互联网背景下知识付费发展与付费意愿影响因素探析——基于LDA与结构方程模型的分析 ...
互联网背景下知识付费发展与付费意愿影响因素探析——基于LDA与结构方程模型的分析 ...
本研究范例以慕课在线教育平台的一门计算机语言课程为例,使用集搜客网络爬虫工具,在多个官方网站获取了2004年至2019年期间,中国与美国的在线教育行业的市场规模、消费者价格指数(CPI) ...

2022-7-4 16:03

社会网络可视化分析方法探索—Gephi分析工具的下载和安装
社会网络可视化分析方法探索—Gephi分析工具的下载和安装
1. 说明近期社交媒体比如微博上的热点事件很多,吸引了很多用户参与讨论。这些为数据采集,数据预处理,数据分析和可视化的练手提供了很好的素材。借此机会,我们计划使用集搜客网络爬虫软件,集搜客微博采集工具箱 ...

2022-6-30 16:46

微博评论采集下来后怎样把发布时间转换成统一格式
微博评论采集下来后怎样把发布时间转换成统一格式
微博发布时间有很多格式,不统一就没法做进一步数据分析,那么,对微博评论采集结果进行格式化或其它数据预处理的时候怎样同意转换时间格式?在Jupyter Notebook下使用python进行处理的方法是怎样的? ...

2022-6-21 11:31

Jupyter Notebook将京东商品参数数据表做行列转换
Jupyter Notebook将京东商品参数数据表做行列转换
本模板对采集结果数据表进行类似于Excel的处理,把采集到的每个商品的多条excel记录(对应多个参数),清洗成:每个商品一行,每个参数一列。

2022-5-30 16:44

集搜客分词软件情感分析算法升级通知
集搜客分词软件情感分析算法升级通知
用户添加自定义情感词的时候,可以加单字的情感词、程度词、否定词,因为单字匹配到的概率大大提高,往往会与多字的词发生重叠识别,老版本会分析出很不准确的结果。新版本对这种情况也做了改进。 ... ... ... ...

2022-5-13 16:08

为什么要为层次分析法(AHP)计算特征值和特征向量
为什么要为层次分析法(AHP)计算特征值和特征向量
很多文章或者教程一开始就提到判别矩阵是“正互反矩阵”以及一堆特性,这样白白增加了畏惧感,增大了理解的阻力。那么,正确的做法是:从层次分析法的判别矩阵的生成过程来理解,先忽视“互反”这些令人畏惧的字眼。 ...

2022-5-10 09:57

在Jupyter Notebook中将分词结果转换成数组或矩阵
在Jupyter Notebook中将分词结果转换成数组或矩阵
1,本Notebook背景介绍如果将集搜客分词和情感分析软件生成的结果文件交给sklearn都机器学习库做进一步计算,那么通常需要转换成numpy数组,也可能需要转换成numpy矩阵。而从numpy数组到numpy矩阵,只需要调用numpy ...

2021-11-26 11:49

在Jupyter Notebook中使用word2vec和k-means进行词聚类
在Jupyter Notebook中使用word2vec和k-means进行词聚类
1,本Notebook背景介绍通常我们对文档进行聚类,目的是:面对一堆文档,想自动划分成N类。其实也可以对一堆词聚类,目的是:面对一堆词,想自动划分成N类。可见,这两件事是类似的,其中,N这个数字可以自己定,当然 ...

2021-11-25 15:32

网络评价对水产品线上销量影响的实证分析——基于天猫网站大闸蟹评价数据分析 ...
网络评价对水产品线上销量影响的实证分析——基于天猫网站大闸蟹评价数据分析 ...
随着我国互联网普及率的提高、经济和信息技术的飞速运行以及电子商务突飞猛进的发展,作为生鲜电商市场的细分市场——水产品电商,这几年出现了快速发展的情况。本范例对水产品电商用户评价和销量之间的关系进行研究 ...

2021-11-11 15:43

GMT+8, 2024-10-16 16:01