多词共现分析方法在暴雨-地质灾害应急任务研究中的应用

2023-11-27 09:41| 发布者: Fuller| 查看: 2313| 评论: 0

摘要: 通过关联规则挖掘对暴雨-地质灾害事故案例中的应急任务进行提取,并进行共现词集网络可视化分析,结果表明该方法能够有效的将应急任务提取出来,为快速制定救援行动方案提供依据 ...

今天分享的这篇范例,通过关联规则挖掘对暴雨-地质灾害事故案例中的应急任务进行提取,并进行共现词集网络可视化分析,结果表明该方法能够有效的将应急任务提取出来,为快速制定救援行动方案提供依据。 

GooSeeker文本分词和情感分析软件,除了分词,选词,情感分析,词云图这些功能外,还有基于共现词的社会网络分析和数据导出,对于很多分析任务已经能够满足分析的需求。

以上功能在《如何采集微博博主主页并生成共现矩阵用于Gephi社会网络分析》里有介绍。

另外我们也基于GooSeeker文本分词和情感分析软件导出的各种excel数据和矩阵数据,使用专业网络分析软件Gephi进行了很多网络分析方面的实验,有兴趣的同学可以参考。

相关的文章列在这个帖子里:Gephi社会网络分析软件常用功能讲解

1,范例简介

标题: 多词共现分析方法在暴雨-地质灾害应急任务研究中的应用

作者: 杨炼卿 许铭 马成龙 戴彩岩 赵红 龙昭岳

作者单位

1. 中国地质大学(北京)工程技术学院

2. 中国地质大学(北京)自然资源部深部地质钻探技术重点实验室

3. 贵州省劳动保护科学技术研究院

关键词:暴雨-地质灾害;应急任务;文本挖掘;多词共现;关联规则挖掘;K-means聚类算法;

发表日期:2023-11

基金资助

贵州省科技计划项目“基于暴雨-崩滑-泥石流灾害链情景构建的救援推演关键技术研究与示范”(黔科合支撑[2021]一般513);

摘要

为快速制定救援行动方案,提出了一种多词共现分析方法将灾害应急任务从历史发生的灾害案例中提取出来的方法。该方法首先利用K-means聚类算法将预处理好的文本进行聚类分析,归纳出应急任务集。然后利用关联规则挖掘Apriori算法提取案例文本中的频繁项集作为共现词集,分析解释共现词集与应急任务之间的关系。最后,运用Gephi软件将共现词语网络可视化,进一步分析应急任务中要素之间的相关关系。以暴雨引发的地质灾害事故为例,对该方法进行了实验,结果表明该方法能有效的将暴雨-地质灾害事故案例文本中的应急任务提取出来,并通过网络可视化分析发现,在救援过程中,应急任务之间是联动配合的一个体系,协调好各个应急任务能缩短应急响应的时间,为制定或完善救援行动方案提供参考。

文章目录

1 多词共现分析方法

    1.1 语义关联关系

    1.2 关联规则挖掘

    1.3 词共现分析流程

2 应急救援案例文本预处理与表示

3 暴雨-地质灾害应急救援任务分析

4 共现词集提取与分析

    4.1共现词集提取

    4.2共现词集分析

5 词集网络可视化

6 结语

2,本研究范例主要研究方法、相关知识点、工具和数据来源

2.1 研究目的

我国西南地区山地面积占比大,地质环境脆弱。极端降雨常演变为洪灾,极易引发崩塌、滑坡、泥石流等地质灾害[1-3]。灾害发生后需要立即展开应急救援,但山地救援受到地势地貌及气象等因素影响,需要根据灾情及救援任务的变化随时制定或修订现场处置方案,否则不仅影响救援效率,还会给救援人员带来很大风险。基于文本挖掘技术,将以往救援案例进行结构化、信息化处理,分析应急任务中核心要素的相关关系,可为快速制定新的处置方案提供参考。

2.2 词共现分析流程

(1)案例收集:本文根据研究目的,从各大新闻网以及当地政府官网收集 2005-2022 年我国西南地区 34例暴雨-地质灾害应急救援典型案例报道或总结报告,建立数据样本集。

(2)文本预处理:主要是对数据样本集进行清洗、文本抽取、分词、去除重复词、去除停用词等。

(3)文本表示:主要包括特征词抽取、特征词权重计算、文本表示。抽取出来的特征词作为后续关联规则挖掘分析中的词语。

(4)多词共现词集抽取:主要采用关联规则挖掘算法中满足最小支持度的频繁项集作为共现词集。

(5)词集网络可视化:将抽取出来的共现词集作为网络的节点,词语之间的关联度作为网络的边,直观显示核心词集的地位及其关联关系。


鲜花

握手

雷人

路过

鸡蛋

最新评论

GMT+8, 2024-10-4 20:15