社会网络关系图在文本挖掘分析中,可以探索发现两两词语之间的关系、哪些词语处于核心地位,下面我们利用集搜客的文本分词和分类检索平台的“社会网络”菜单,就能得到网络图和矩阵表。 1、共词匹配 新建任务并导入符合格式要求的文本数据后,详细操作见《分词和分类检索平台使用手册》,然后点进“社会网络”菜单,如果前面步骤做了选词操作,那么直接点击“共词匹配”按钮,就会计算两两词语在原数据(导入的文本数据)里的共现次数;如果没有选词,那么可以点“加词”按钮,把手工整理好的词语添加进去即可。 2、生成网络图 做完上面第1步,点击“网络图”按钮,就可以生成网络图,如果需要引用,可以截图,暂不支持调整样式和大小。 2.1、看核心词的连线 网络图默认是展示共词矩阵表里的所有词语关系,所以当词语太多时,就会看到密密麻麻一团。通过设置要展示的连线数量,系统就会根据词语关联度从大到小排序,优先画出处于核心地位的词语间连线,这样可以更好地发现核心词语与其他词语之间的共现关系。 2.2、看词语的关联度 在网络图里,用圆点大小来表示词语的关联度大小,即与该词有连线的词语数量,把鼠标悬浮在圆点上,即可看到该词语的关联度数值。由于使用的是无向网络图,所以这里的关联度也能表示点的中心性,即核心地位大小,所以,词语的关联度越大,圆点越大,词语就越重要。 2.3、看两个词语的共现次数 网络图里有共现关系的两个词语是用线条连接的,把鼠标悬浮在连线上,就能看到两个词语的共现次数,即这两个词语同时出现在多少条原数据里,一般是用连线的粗细来表示,这里为了整体效果则用一样粗细的线条表示。 3、下载共词矩阵表 点击“下载共词矩阵”按钮,即可下载到共词矩阵表。如果进一步挖掘网络关系,可以基于矩阵表,再整理出网络图节点的属性表、样式表。 矩阵表里,水平、垂直相交的单元格里,就是两个词语的共现次数,大于0就是有共现关系,等于0就是没有共现关系;词语的关联度可以通过计算大于0的单元格数量来表示。 |