快捷导航

如何使用集搜客分词平台做社会网络图分析?

2020-4-13 19:23| 发布者: ym| 查看: 12267| 评论: 5

摘要: 社会网络关系图在文本挖掘分析中,可以探索发现两两词语之间的关系、哪些词语处于核心地位,下面我们利用集搜客的文本分词和分类检索平台的“社会网络”菜单,就能得到网络图和矩阵表。 1、新建任务并导入符合格式要 ...

社会网络关系图在文本挖掘分析中,可以探索发现两两词语之间的关系、哪些词语处于核心地位,下面我们利用集搜客的文本分词和分类检索平台的“社会网络”菜单,就能得到网络图和矩阵表。

1、共词匹配

新建任务并导入符合格式要求的文本数据后,详细操作见《分词和分类检索平台使用手册》,然后点进“社会网络”菜单,如果前面步骤做了选词操作,那么直接点击“共词匹配”按钮,就会计算两两词语在原数据(导入的文本数据)里的共现次数;如果没有选词,那么可以点“加词”按钮,把手工整理好的词语添加进去即可。


2、生成网络图

做完上面第1步,点击“网络图”按钮,就可以生成网络图,如果需要引用,可以截图,暂不支持调整样式和大小。


2.1、看核心词的连线

网络图默认是展示共词矩阵表里的所有词语关系,所以当词语太多时,就会看到密密麻麻一团。通过设置要展示的连线数量,系统就会根据词语关联度从大到小排序,优先画出处于核心地位的词语间连线,这样可以更好地发现核心词语与其他词语之间的共现关系。


2.2、看词语的关联度

在网络图里,用圆点大小来表示词语的关联度大小,即与该词有连线的词语数量,把鼠标悬浮在圆点上,即可看到该词语的关联度数值。由于使用的是无向网络图,所以这里的关联度也能表示点的中心性,即核心地位大小,所以,词语的关联度越大,圆点越大,词语就越重要。


2.3、看两个词语的共现次数

网络图里有共现关系的两个词语是用线条连接的,把鼠标悬浮在连线上,就能看到两个词语的共现次数,即这两个词语同时出现在多少条原数据里,一般是用连线的粗细来表示,这里为了整体效果则用一样粗细的线条表示。


3、下载共词矩阵表

点击“下载共词矩阵”按钮,即可下载到共词矩阵表。如果进一步挖掘网络关系,可以基于矩阵表,再整理出网络图节点的属性表、样式表。


矩阵表里,水平、垂直相交的单元格里,就是两个词语的共现次数,大于0就是有共现关系,等于0就是没有共现关系;词语的关联度可以通过计算大于0的单元格数量来表示。

8

鲜花
2

握手

雷人

路过

鸡蛋

刚表态过的朋友 (10 人)

相关阅读

发表评论

最新评论

评论 Fuller 2022-3-23 09:25
如果你的正文都很长,尤其是正文数很少,但是文字很长,那么,你选的词大部分都会出现在同一个正文中,这样的话,每个词跟其他词关联次数几乎完全一样,圆点就一样大了。这需要你手工先把长正文分成小段小段的,每一段一条正文。
QR123456: 绘制社会网络关系图时,“词语的关联度越大,圆点越大,词语就越重要。”可是我的圆点我感觉都是一样大,咋肥事呢 ...
评论 QR123456 2022-3-23 09:10
绘制社会网络关系图时,“词语的关联度越大,圆点越大,词语就越重要。”可是我的圆点我感觉都是一样大,咋肥事呢
评论 QR123456 2022-3-23 09:10
绘制社会网络关系图时,“词语的关联度越大,圆点越大,词语就越重要。”可是我的圆点我感觉都是一样大,咋肥事呢
评论 内容分析应用 2020-8-20 11:16
绿皮大甜梨: 原点大小看不出来啊,怎么分析呢?
鼠标放上去, 会显示数值的。
另外下载的excel表,有一张是专门的社交网路数据,可以基于数据做分析。
评论 绿皮大甜梨 2020-8-20 10:34
原点大小看不出来啊,怎么分析呢?

查看全部评论(5)

GMT+8, 2024-3-19 15:38