集搜客GooSeeker网络爬虫

标题: LDA话题分析结果是否可以作为内容分析的单元? [打印本页]

作者: 发誓学好内容分析    时间: 2021-6-23 10:35
标题: LDA话题分析结果是否可以作为内容分析的单元?
我看了这篇文章《微博内容分词后怎样用JupyterNotebook做LDA主题模型分析》,学会了用Python做LDA主题分析。我又看了这么一个内容分析案例《政策工具视角下我国旅游科技政策文本分析研究》,使用政策文件中的条款作为内容分析单元的。

我产生了一个想法,是否可以先用LDA主题分析,然后用主题作为内容分析单元,做编码、分类和统计?



作者: Fuller    时间: 2021-6-23 10:40
你这个项目很有意思,但是我觉得应该纠正一下,仅供探索讨论。
LDA主题分析最后一步一般是要做主题推断,就是决定一篇内容是属于哪个主题。我认为按照你的设想,不要做这个主题分类。而是把要分析的内容向量化。也就是说,本来分析单元是一段话,你嫌读起来太麻烦,先用文档生成算法把原始文档再造一下。再造成一个词向量。然后对着这个向量做编码。

不知道行不行?是否符合内容分析的要求?

作者: 发誓学好内容分析    时间: 2021-6-23 10:56
Fuller 发表于 2021-6-23 10:40
你这个项目很有意思,但是我觉得应该纠正一下,仅供探索讨论。
LDA主题分析最后一步一般是要做主题推断,就 ...

那我这个想法是不是胡思乱想?

作者: Fuller    时间: 2021-6-23 11:03
发誓学好内容分析 发表于 2021-6-23 10:56
那我这个想法是不是胡思乱想?

我觉得内容分析法是一种量化研究文本内容的研究范式,符合这个范式,可以让研究结论更有说服力。

LDA可以从大量的数据中识别出来潜在主题,我觉得可以尝试用LDA做一些预备工作,协助整理出来编码和分类表。如果全靠一条条看,然后手工整理,应该不如用多轮lda分析快、全面。也许应该尝试一下。

另外,我觉得在大数据工程项目中采用LDA主题分析可以很灵活,有效就行,比如,有这么一个案例《基于LDA主题模型的专利内容分析方法》,我估计这类项目不会按照内容分析范式去做严格的信度和效度分析,只要体验效果符合预期,就行了吧





欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2