本帖最后由 内容分析应用 于 2020-8-18 09:28 编辑

原文发表于微信公众号:设计师、研究人员,如何做文本分析或建构理论, 《设计师、研究人员,如何做文本分析或建构理论》

用户深度访谈做完记录整理稿不知道从何分析?
收集了一大堆文本数据就只会做词频分析?
高引文章里的主题词是怎么提取出来的?
生活中我们会遇到各种各样的文本需要去处理,我们到底应该怎么从中提取到我们需要的信息的?靠自己的主观分析总结出观点吗?No!
为大家介绍一个来源于质性研究中扎根理论的三阶段编码方法,它不仅能实现一般文本分析方法的关键词词频分析,聚类分析等,
更加厉害的是可以:
(1)了解主题词与主题词之间同阶段或与次阶段可能存在某种相互链接的“关系”
(2)其提取过程是一种可供检验的可视化路径对于科研工作者来说,这种方法还可以生成出新理论、新模型(感觉非常厉害的样子)!!!
因为它来源扎根理论,而扎根理论本身就是预期在资料、文献以及个人经验和专业经验的基础上形成理论。

关于扎根理论
一、什么是编码(coding)?
指将所搜集或转译的文字资料加以分解、指认现象、将现象概念化,再以适当方式将概念重新抽象、提升和综合为类属(也有叫范畴)以及核心类属的操作化过程。而对概念命名的目的, 则是为了让研究者能够将类似的事件、事例、事物等加以群组, 并归类在一个共同的标题或分类之下。

二、什么是三阶段编码?
三阶段编码主要通过开放、主轴、选择等三阶段的编码, 提取事例或事件所共同的特征或相关的意义, 使得它们能够被群组起来。看着还是有点懵,没关系,下面慢慢分别进行解释。

1、开放性编码(open coding)(一级编码)
开放编码是通过对现象的仔细研究, 以便进行命名和分类的分析工作, 亦即分析、检视数据并对其进行概念化的归纳、比较的过程。它的目的是从资料中发现概念类属, 对类属加以命名确定类属的属性和维度, 然后对研究的现象加以命名及类属化。类属(categories) 包含了概念的特性(properties)和维度(dimension)。特性比较好理解,维度是指特性的范围。
这样说可能有点抽象,说明白了就是“打标签”,把原始资料打散,贴上概念化的标签,然后按照它的特点和程度进行归类,相似的就归到一个组里(类属)。开放编码的过程类似于一个漏斗, 由一个较为宽广的范围逐渐缩小和集中。(如果最终要生成理论,那么需要原始资料尽量详实,直到译码呈现饱和。)
在开放编码的过程中, 会产生十几个甚至上百个概念, 因此编码者必须将相似的概念分类,而此阶段中的类属概念是暂时性的, 随时可能会因为新发现而出现必须修改的情况。那么如何恰当地编码?
在开放性编码的阶段,对概念的命名一般采用三种方式:
(1)自行创建:编码者不断进行资料对比, 借由事物所唤起的意义或意象, 创造能反映该意义或意象的名字;
(2)沿用已存在名字:这样的命名, 因为在权威文献中概念本身已包含了极为丰富的分析意义, 且都是已经发展得近乎完整的概念, 故而非常严谨, 但缺点则是缺乏弹性, 未必能与自己想表达的概念一致;
(3)见实编码 (Code in vivo):编码者从受访者本身所使用的话语中提取字词作为编码。

2、主轴性编码(axical coding)(二级编码)
主轴编码是借由演绎与归纳, 通过不断比较的方法将近似编码链接在一起的复杂过程。其主要任务是选择和构建主要类属的内容, 并将主要概念类属与次要概念类属连接起来, 以重新组织数据。那么这样的操作会使得两级编码之间形成一个关系网。在合并前面已经形成的概念类属中,发现和建立概念类属之间的相互关系,如因果关系、情景关系、功能关系、过程关系、时间先后关系等。
主轴性编码进行的步骤分别是:
(1)检查各次要概念类属与各现象彼此的关系, 在这个基础上思考类属与概念之间可能存在的假设性关系;(2)检证实际资料是否支持上述这种假设性的关系;(3)持续不断地寻找主要概念类属与次概念类属的性质, 并不断确认它们在当中的定位 (dimensional locations) ;(4)检证实际应用数据中的证据、事故、事件, 并予以解释、说明。通过反复推导和归纳整理, 编码者将开发出一些针对研究现象的概念类属。

3、选择性编码(selective coding)(三级编码,也叫核心性编码)
数据分析的最后阶段称之为选择性编码, 这一阶段的主要工作是通过整合与凝练, 在所有命名的概念类属中, 提炼一个“核心类属” (core category) 。核心类属是浓缩所有分析结果后得到的关键词, 这几个关键词足以说明整个研究的内涵, 即使条件改变导致所呈现出的现象有所不同, 但仍具备解释效力。在选择性编码之后,可以发展出一条“故事线”,指的是,用前两级编码发展出的类属、关系等提炼一个可扼要说明全部现象的核心,并且可以用资料去验证。
20200818-1.png

选择性编码主要通过5个步骤:
(1)创建一条清楚明确的故事线 (story line) ;
(2)通过译码范式模型连接主要概念类属之次概念类属;
(3)在面向的层级 (dimensional level) 发展派系类型;
(4)通过数据检证各派系中概念类属间的关系;
(5)填满可能需要补充或发展的类属。通过这些步骤, 编码者得以发展派系类型, 并在此基础上构建理论(如需要)。
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-8-18 09:32

内容分析应用 金牌会员 发表于 2020-8-18 09:32:28 | 显示全部楼层
本帖最后由 内容分析应用 于 2020-8-18 10:44 编辑

上面的纯理论大家可能听着有点抽象,这里有一个实际案例:研究生培养质量影响因素研究
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 13:20