Gephi案例-基于引文网络和语义分析的技术演化路径识别及拓展研究 ...

2022-9-1 11:08| 发布者: Fuller| 查看: 3995| 评论: 0

摘要: 本文提出了一种将专利引文网络与 SAO 语义分析方法结合,以提取技术演化路径从而识别技术发展趋势的方法,并以全固态锂离子电池为例进行了分析。该方法在构建专利引文网络基础上,通过社群划分及 SPC 算法提取主路径 ...

今天分享一篇和Gephi相关的范例《基于引文网络和语义分析的技术演化路径识别及拓展研究》,这篇范例对专利数据进行时间窗口划分,利用Gephi软件构建专利引文网络;然后,运用Girvan-Newman算法对引文网络进行社群划分,对综合排序前三的社群通过SPC算法提取主路径;接着,对主路径所涉及专利进行SAO结构提取,经规范化处理后构建基于SAO结构的技术演化路径;最后,将最新科技文献及专利通过语义相似性计算链接至技术演化路径末端,进而克服引文的时滞性缺陷。 

之前我们已经发布过几篇Gephi相关的文章:

  1. 社会网络可视化分析方法探索—Gephi分析工具的下载和安装
  2. Gephi社会网络分析数据的批量生成和导入
  3. Gephi案例分享:基于社会网络分析的网络公益信息传播研究-以微博为例
  4. GooSeeker共词矩阵excel怎样转换成Gephi支持的csv格式

另外,在最近发布的一篇Jupyter Notebook《用networkx和python编程可视化分析共现词关系图》中,探索了怎样使用GooSeeker分词和情感分析软件生成的共词矩阵Excel表来生成社会网络分析图。文中提到了使用Gephi对网络图进行美观和更直观的调优,我们会在后续的文章中做专门的探讨。

1,范例简介

标题: 基于引文网络和语义分析的技术演化路径识别及拓展研究

作者:冯立杰1,2 周炜1 刘鹏1 张珂1

作者单位

1. 郑州大学管理工程学院

2. 上海海事大学中国(上海)自贸区供应链研究院

关键词:技术演化;引文网络;SAO语义分析;主路径分析;技术社群探测;

发表日期:2022-08-12

基金资助

上海市科技计划资助项目“元易创新方法在港航物流工程与海洋装备关键技术领域的应用研究”(项目编号:20040501300); 河南省高校人文社会科学研究一般项目“科技创新起高峰情境下河南本土企业创新方法理论及应用研究”(项目编号:2023-ZZJH-039); 国家科技部创新方法工作专项“‘端端驱动、融合赋能’创新方法新系统研究与应用示范”(项目编号:2019IM020200); 郑州大学青年人才企业合作创新团队支持计划项目“中原企业科技起高峰的创新方法应用研究”的成果;

摘要

[目的/意义]

提出了一种融合专利引文网络和SAO语义分析的技术演化路径识别及拓展方法,对企业精准高效开展技术创新活动意义重大。

[方法/过程]

首先,对专利数据进行时间窗口划分,利用Gephi软件构建专利引文网络;

其次,运用Girvan-Newman算法对引文网络进行社群划分,对综合排序前三的社群通过SPC算法提取主路径;

再次,对主路径所涉及专利进行SAO结构提取,经规范化处理后构建基于SAO结构的技术演化路径;

最后,将最新科技文献及专利通过语义相似性计算链接至技术演化路径末端,进而克服引文的时滞性缺陷。

[结果/结论]

将该方法应用于全固态锂电池技术领域,揭示了全固态锂电池相关技术的演进热点、发展脉络及未来趋势,验证了所提方法的可行性与实用性,为相关企业明晰创新路径提供了科学的决策理论支持。

2,本研究范例主要研究方法、相关知识点和工具

2.1 Girvan-Newman算法是什么?

Girvan-Newman算法是一种社交网络的聚类方法,简称GN算法。

以下对社区发现和GN算法的解释和图片,参考了这篇知乎文章《社区发现算法-GN》:

社区发现:

什么是社区发现:一个社区由一组连接紧密的结点组成,同时这些结点与社区外部的结点连接稀疏,如下图所示。那么,社区发现就是在复杂网络中发现这些连接紧密的社区结构。其实,我个人觉得,社区发现就是网络中的结点聚类。

GN算法:

GN算法是社区发现中的第一个算法,也就是它开启了这个研究领域。它的基本思想是删除掉那些社区之间的连接,那么剩下的每个连通部分就是一个社区。那么问题来了,就是哪些是社区之间的边呢?作者巧妙地借助最短路径解决了这个问题,他们定义一条边的介数(betweeness)为网络中所有结点之间的最短路径中通过这条边的数量,而介数高的边要比介数低的边更可能是社区之间的边。其实,这也比较好理解,因为两个社区中的结点之间的最短路径都要经过那些社区之间的边,所以它们的介数会很高。

GN算法每次都删除网络中介数最大的边,直至网络中的所有边都被删除。这样GN的过程对应着一颗自顶向下构建的层次树。在层次树中选择一个合适的层次分割即可。

后续我们会出一篇GN算法测试的Jupyter Notebook。

2.2 SAO语义分析方法

下面对语义分析方法的描述来自原范例:

SAO(Subject-Action-Object)语义分析方法因在文本信息中能够经由准确的语义结构提取而受到众多学者的关注,并被广泛应用于语义链、技术树、形态矩阵及技术路线图的构建[10]。如 Miao 等[11]通过从专利信息中提取 SAO 结构并构建技术路线图,识别了未来技术创新路径的变化趋势;Ma 等[12]通过整合主题聚类、SAO 语义分析及机器学习等多种方法得到了染料敏化太阳能电池技术的技术路线图。近年来,基于提取的 SAO 结构探讨主体(Subject)与客体(Object)间的关联关系以识别技术演变趋势也逐渐成为 SAO 语义分析方法发展的一个方向[12]。如马铭等[13]通过提取科技论文和专利数据的 SAO 结构,构建了SAO 语义信息网络,并通过多个社会网络指标分析了核心技术主题的演化趋势;任海英等[10]利用提出的基于输入输出型 SAO 网络的核心技术链识别方法,参照相关专利对核心技术链进行了解读。

有鉴于此,本文将运用 SAO 语义分析方法进行主路径分析,构建基于技术要素的技术演化路径,通过对主路径所涉及的全部专利进行 SAO 结构提取,得到关键技术要素并构建基于 SAO 结构提取的技术演化路径,在追踪其技术演化发展方向及趋势基础上,为企业精准把握技术研发动态进而适时调整技术研发方向提供较为完整的语义信息。

2.3 中文文本分词和社会网络矩阵生成

本系列Gephi相关的文章,及最近发布的系列基于共词矩阵Excel表所做的算法分析和社会网络图分析,用到的中文分词和共词矩阵,都是在GooSeeker中文文本分词和情感分析软件导出的结果表基础上做进一步的分析。搞研究写论文的同学们可以多使用:

3,本范例作者总结与建议

本文提出了一种将专利引文网络与 SAO 语义分析方法结合,以提取技术演化路径从而识别技术发展趋势的方法,并以全固态锂离子电池为例进行了分析。该方法在构建专利引文网络基础上,通过社群划分及 SPC 算法提取主路径,并利用 SAO 语义分析方法对主路径技术节点信息进行深入剖析构建了技术演化路径,最终通过语义相似性计算,将最新的科技文献及专利链接至原有路径,进而实现了技术演化路径的拓展。

    本文无论在理论创新抑或是在方法创新层面均具有一定的学术贡献。就提出的研究框架而言,一方面本文在提取的主路径基础上构建了基于 SAO 结构的技术演化路径,能够高效挖掘出专利中的技术组件及其关联性语义信息,同时可以明晰具象技术的新兴、融合及分裂状态,为后续精准研判技术机会提供参考依据;另一方面,本文利用语义相似性计算将技术演化路径延伸并拓展到前沿技术,能够克服专利引文的时滞性可能带来的弊端,有利于及时、完整、准确地表征当前的热点技术。就技术创新方法的实践应用而言,本文提出的一种基于引文网络与语义分析的技术演化路径识别方法能够具象解读相关技术中的关键技术组件及其演化状态,并综合运用前沿期刊文献及专利信息进行路径链接与拓展,为相关企业科学合理地调整研发方向与研发决策提供了参考依据。


鲜花

握手

雷人

路过

鸡蛋

最新评论

GMT+8, 2024-4-18 22:53