定性数据编码

定性数据编码简介

定性数据编码

编码是分析定性数据(通常是文本)的过程,通过为数据片段分配标签(代码)来捕捉其本质或意义。它使你能够浓缩、组织和解释数据。

代码是一个词或简短的短语,捕捉了为什么你认为某部分数据可能有用的本质。一个好的类比是代码描述数据就像标签描述推文一样。

定性编码

代码通常附加在不同大小的“片段”上——词、短语、句子或整段文字。它们可以采取直接描述性的标签形式,也可以采取更复杂的解释性形式(例如比喻)。

编码是一个迭代过程,研究人员随着对数据理解的深入不断精炼和修改代码。

最终目标

最终目标是开发一个连贯且有意义的编码方案,捕捉参与者体验的丰富性和复杂性,并帮助回答研究问题。

步骤1:熟悉数据

  • 多次阅读你的数据(访谈记录、田野笔记、文件等)。这个过程称为沉浸。
  • 在做出任何关于想法或潜在模式的决定之前,思考和反思数据中可能重要的内容。

步骤2:确定编码方法

  • 你将使用预定义的演绎代码(基于理论或先前研究),还是让代码从数据中浮现(归纳编码)?
  • 一条数据将有一个代码还是多个代码?
  • 你会编码所有内容还是选择性编码?更广泛的研究问题可能需要更全面地编码。

如果你决定不编码所有内容,至关重要的是:

  1. 明确你将编码和不编码的标准
  2. 在研究报告中透明地说明你的选择过程
  3. 保持开放态度,在分析后期重新审视未编码的数据

步骤3:进行第一轮编码

开始识别初步代码,这些代码突出数据的重要特征,可能与研究问题相关。

  • 浏览数据并为突出的片段分配初始代码
  • 创建一个代码名称(一个词或短语),捕捉每个片段的本质
  • 保持代码手册——包含代码及其描述或定义的列表
  • 保持开放态度,随时添加、修订或合并代码

一级编码主要使用这些描述性、低推断的代码,这些代码在总结数据片段方面非常有用,并为后来的高层次编码提供基础。

描述性代码

  1. 原语言编码 / 语义编码:此方法使用参与者自己的语言中的词或短语作为代码。它处理表面内容,标记参与者直接说或描述的内容。它识别关键词、短语或句子,捕捉字面内容。 参与者:“我只是被一切压得喘不过气。” 代码:“压倒性”
  2. 过程编码:使用动名词(“-ing”词)表示数据中的可观察或概念性行动。 参与者:“我先头脑风暴想法,然后缩小范围。” 代码:“头脑风暴想法”,“缩小范围”
  3. 开放式编码:一种初始编码形式,研究人员对数据可能指示的任何理论方向保持开放。 参与者:“我发现这门课真的很有挑战性,但我学到了很多。” 代码:“有挑战性的课程”,“学习经历”
  4. 描述性编码:用一个词或短语总结一段文字的主要主题。 参与者:“我通常在图书馆学习,因为那里很安静。” 代码:“学习环境”

步骤4:审查和精炼代码

后期代码可能更具解释性,需要一定程度的推断超出数据本身。

  • 回顾初始代码,看看是否有可以合并、拆分或修订的代码
  • 确保代码名称清晰传达数据的意义
  • 检查代码是否在整个数据集中一致应用
  • 如果可能,向同行或导师寻求第二意见

解释性(潜在)代码

解释性代码超越简单的描述,反映了研究人员对数据中捕获的潜在(潜在)意义、体验或过程的理解。

这些代码要求研究人员根据研究问题和理论框架解释参与者的言语和行为。

它们通常借鉴现有理论或概念来解释数据,提供对参与者所说内容的更概念化的“解读”。

潜在代码要求研究人员挖掘表面之下,基于他们的专业知识和知识进行推断。潜在编码需要比语义编码更多的经验和理论知识。

例如,潜在编码是一种解释性编码,超越数据的表面意义。它挖掘潜在的情绪、动机或参与者可能没有明确陈述的未说出口的想法。

潜在编码寻找潜台词,解释所说内容背后的“为什么”,并考虑上下文(例如文化影响或无意识偏见)。

  • 示例:参与者可能会说,“每当我看到蜘蛛时,我感觉快要昏倒了。这让我回想起小时候的一次糟糕经历。”这里的潜在代码可以是“蜘蛛引发的恐慌感”,因为它超越了表面的恐惧,探讨了情感反应和潜在原因。

问自己以下问题是有用的:

  • 参与者做出了哪些假设?
  • 数据中表达了或暗示了哪些情绪或感受?
  • 参与者在数据中如何与他人互动?
  • 参与者的体验或观点随着时间如何变化?
  • 数据中有哪些令人惊讶、意外或矛盾之处?
  • 数据中没有说什么或展示什么?沉默或缺失是什么?

理论代码

理论代码是最抽象和概念化的代码类型。它们用于将数据与现有理论联系起来,或发展新的理论见解。

理论代码通常在分析过程后期出现,研究人员开始识别描述性和解释性代码之间的模式和联系。

示例

  1. 结构编码:将基于内容的短语应用于与特定研究问题相关的数据段。 研究问题:是什么激励学生成功? 参与者:“我想让父母感到骄傲,成为家族中第一个大学毕业的人。” 解释性代码:“家庭动机” 理论代码:“社会认同理论”

  2. 价值编码:此方法根据参与者的价值观、态度和信念对数据进行编码,代表他们的视角或世界观。 参与者:“我相信每个人都应该获得高质量的医疗保健。” 解释性代码:“医疗保健准入”(价值) 理论代码:“分配正义”

模式代码

二级编码通常关注模式代码。模式代码更具推断性,是一种“元代码”。

模式代码将材料整合成更少但更有意义的单元……模式代码是一个更抽象的概念,将不太抽象、更描述性的代码整合在一起。

模式编码通常在数据分析的后期阶段使用,此时研究人员已经彻底熟悉数据,并识别了初始的描述性和解释性代码。

通过识别数据中的模式和关系,模式代码有助于发展对现象的更连贯和有意义的理解,并可以促进理论的发展或完善。

例如

假设一位研究者正在研究新手母亲产假后重返工作的体验。他们对几位参与者进行了访谈,并最初使用描述性和解释性编码来分析数据。这些编码可能包括:

  • “离开宝宝的内疚感”
  • “平衡工作和家庭的挣扎”
  • “同事的支持”
  • “灵活的工作安排”
  • “母乳喂养的挑战”

当研究者回顾已编码的数据时,他们可能会注意到这些编码中的几个与更广泛的“工作-家庭冲突”主题相关。

他们可能会创建一个称为“应对工作-家庭冲突”的模式编码,将参与者描述的各种体验和挑战整合在一起。

定性研究

编码根据它们之间的相似性和关系被分组为类别(子主题)。然后进一步分析和组合这些类别,以识别捕捉数据中核心意义、模式或概念的总体主题。这一过程涉及类别的持续精炼、比较和抽象。研究者利用他们的解释技能来识别类别所代表的核心思想或反复出现的主题,这些主题提供了对定性数据更高层次的理解。


引用来源

本文翻译自以下网站:

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。

如果你有任何问题或建议,请随时联系微信公众号。

回到首页