心理学中的观察方法:自然观察、参与观察和控制观察
心理学中的观察方法
心理学中的观察方法涉及在自然或人为设置的环境中直接和系统地见证和记录可测量的行为、行动和反应,而不试图干预或操纵所观察的内容。
用于描述现象、生成假设或验证自我报告,心理观察可以是受控的或自然的,研究者施加不同程度的结构。
观察方法有不同类型,需要区分以下几种:
- 控制观察
- 自然观察
- 参与观察
除了上述类别外,观察还可以是公开/披露(参与者知道他们正在被研究)或秘密/未披露(研究者对其真实身份保密,作为群体的真正成员行事)。
总体而言,进行观察研究相对便宜,但在数据处理和分析方面仍然非常耗时且资源密集。
在编码员的时间投入、维持可靠性、防止偏差以及编码复杂动态交互方面所需的重大投资,对资源有限的观察者构成了实际障碍。
控制观察
控制观察是一种在精心控制和结构化的环境中研究行为的研究方法。
研究者设定特定的条件、变量和程序,以系统地观察和测量行为,从而实现更大的控制和不同条件或组之间的比较。
研究者决定观察将在何处、何时、与哪些参与者以及在什么情况下进行,并使用标准化程序。参与者被随机分配到每个独立变量组。
与其详细描述所有观察到的行为,通常更容易根据事先商定的行为量表对行为进行编码(即进行结构化观察)。
研究者系统地将观察到的行为分类为不同的类别。编码可能涉及数字或字母来描述特征,或使用量表来衡量行为强度。
量表上的类别被编码,以便收集的数据可以轻松计数并转化为统计数据。
例如,玛丽·艾因斯沃斯使用行为量表研究婴儿对短暂分离的反应。在陌生情境过程中,测量了婴儿指向母亲的互动行为,例如:
- 接近和寻求接触
- 维持接触
- 避免接近和接触
- 抵抗接触和安慰
观察者记录了每15秒间隔内表现出的行为,并在1到7的量表上对行为强度进行评分。
有时,通过双向镜观察参与者的行為,或对他们进行秘密录像。阿尔伯特·班杜拉使用这种方法研究儿童的攻击性(波波娃娃研究)。
许多研究也在睡眠实验室中进行。这里,电极连接到参与者的头皮上。观察的是大脑在睡眠期间的电活动变化(机器称为EEG)。
控制观察通常是公开的,因为研究者会向小组解释研究目的,使参与者知道他们正在被观察。
控制观察也通常是非参与的,因为研究者避免与小组直接接触并保持距离(例如,在双向镜后面观察)。
优点
- 控制观察可以通过使用相同的观察量表由其他研究者轻松复制。这意味着容易测试其可靠性。
- 结构化观察获得的数据更容易和更快地分析,因为它是定量的(即数值的)——这使得该方法比自然观察更省时。
- 控制观察进行得相对较快,这意味着可以在短时间内进行多次观察。这意味着可以获得较大的样本,从而使结果具有代表性并能够推广到大范围的人群。
局限性
- 控制观察可能缺乏有效性,因为存在霍桑效应/需求特征。当参与者知道自己被观察时,他们可能会表现不同。
自然观察
自然观察是一种研究方法,研究者在自然环境中研究行为,不进行干预或操纵。
它涉及观察和记录行为的自然发生,提供对现实生活中行为和互动的洞察,这些行为和互动在其自然背景下进行。
自然观察是心理学家和其他社会科学家常用的研究方法。
这种技术涉及在自然环境中观察和研究参与者的自发行为。研究者只需记录他们看到的一切,以任何方式记录。
在非结构化观察中,研究者使用编码系统记录所有相关行为。可能记录的内容太多,而且记录的行为不一定是最重要的,因此这种方法通常用作预试验,以确定应记录哪种类型的行为。
与控制观察相比,这就像在动物园和自然栖息地中研究野生动物的区别。
关于人类对象,玛格丽特·米德使用这种方法研究生活在南太平洋岛屿上的不同部落的生活方式。凯西·西尔瓦通过在牛津郡的游乐小组中观察儿童的行为,研究了儿童的游戏行为。
收集自然行为数据
技术进步正在启用新的、不显眼的方式收集自然行为数据。
电子激活录音器(EAR)是一种数字录音设备,参与者可以佩戴,定期采样环境声音,允许对日常体验进行代表性采样(Mehl等,2012)。
研究将EAR编程为每小时多次记录30-50秒的声音片段。虽然编码录音需要大量资源,但EAR可以捕捉到自发行为,如争吵或笑声。
EAR最小化了参与者的反应性,因为采样发生在他们的意识之外。这减少了霍桑效应,即人们在被观察时改变行为。
SenseCam是另一种可穿戴设备,被动地捕捉图像,记录日常活动。尽管目前主要用于记忆研究(Smith等,2014),但通过SenseCam系统采样环境和行为,未来可以进行创新的心理学研究。
优点
-
能够在其自然环境中观察行为的流动,研究具有更高的生态效度。
-
与案例研究类似,自然观察常用于生成新想法。因为它让研究者有机会研究整个情况,常常提出以前未曾想到的研究方向。
-
能够实时捕捉实际行为,分析互动的顺序模式,测量行为的基础率,以及检查人们可能不准确自我报告的社会不可取或复杂行为。
局限性
-
这些观察通常在微观(小)规模下进行,可能缺乏代表性样本(与年龄、性别、社会阶层或种族有关的偏差)。这可能导致研究结果无法推广到更广泛的社会。
-
自然观察的可靠性较低,因为其他变量无法控制。这使得其他研究人员很难以完全相同的方式重复研究。
-
在数据编码阶段高度耗时和资源密集(例如,培训编码员、维持评分者间的一致性、防止判断偏移)。
-
通过观察,我们没有变量操作(或对额外变量的控制),这意味着无法建立因果关系。
参与观察
参与观察是上述(自然观察)的一种变体,但在这里,研究者加入并成为他们正在研究的群体的一部分,以获得对其生活的更深入洞察。
如果是在动物研究,我们现在不仅会在它们的自然栖息地中研究它们,还会与它们一起生活!
莱昂·费斯廷格在一个著名的关于宗教邪教的研究中使用了这种方法,该邪教相信世界末日即将来临。他加入了这个邪教,研究当预言未实现时他们的反应。
参与观察可以是秘密的或公开的。秘密观察是指研究以“卧底”的方式进行。研究者的真正身份和目的对被研究的群体保密。
研究者采用虚假的身份和角色,通常伪装成群体的真实成员。
另一方面,公开观察是指研究者向群体透露其真实身份和目的,并请求允许进行观察。
局限性
- 很难找到记录的时间/隐私。例如,在秘密观察中,研究者不能公开记笔记,因为这会暴露他们的身份。这意味着他们必须等到独处时再依靠记忆记录。这是一个问题,因为他们可能会忘记细节,也不太可能记住直接引用的话。
- 如果研究者过于投入,他们可能会失去客观性并产生偏见。总是有危险我们会“看到”我们期望(或希望)看到的东西。这个问题是因为他们可能会选择性地报告信息,而不是记录他们观察到的一切。从而降低数据的效度。
数据记录
在控制/结构化观察研究中,研究者需要做出的一个重要决定是如何分类和记录数据。通常,这将涉及一种抽样方法。
在大多数编码系统中,编码或评级要么按行为事件,要么按指定时间间隔进行(Bakeman & Quera, 2011)。
三种主要的抽样方法:
-
事件抽样。观察者事先决定她感兴趣的行为什么类型(事件),并记录所有发生的情况。所有其他类型的行为主被忽略。
基于事件的编码涉及识别和分割互动为有意义的事件,而不是时间单位。
-
例如,父母-孩子互动可以分割为控制或教学事件进行编码。区间记录涉及将互动分为固定的时间间隔(例如,6-15秒)并在每个间隔内编码行为(Bakeman & Quera, 2011)。
-
事件记录允许计算事件频率和顺序,同时通过定时事件记录还可以捕捉事件持续时间。这提供了关于行为花费时间的信息。
-
-
时间(间隔)抽样。时间抽样的关键特征是将互动分为连续的固定时间间隔(例如,每15秒、每小时10分钟、每天1小时),观察者在每个间隔期内编码发生的行为主。
- 区间记录在微观分析编码中很常见,用于在短暂的时间样本中抽样离散行为。时间单位可以从几秒到几分钟到整个互动不等。区间记录要求根据时间而非事件来分割互动(Bakeman & Quera, 2011)。
-
瞬间(目标时间)抽样。观察者事先决定预先选定的观察时刻,并记录那一刻发生的事情。之前或之后发生的一切都被忽略。
- 瞬间抽样在某些时刻提供快照编码,而不是总结整个区间内的行为。这允许更快的编码,但可能会错过目标时间之间的行为。
编码系统
编码系统应关注与指导研究的理论相关的行为主、模式、个人特征或关系质量(Wampler & Harper, 2014)。
编码的推断程度各不相同,从具体的可观察行为(如眼神接触的频率)到更抽象的概念(如治疗师与来访之间的亲密度)(Hill & Lambert, 2004)。更多的推断可能会降低可靠性。
编码方案的详细程度或粒度也可以不同。微观层面的方案捕捉细粒度的行为,如特定的面部动作,而宏观层面的方案可能编码更广泛的行为主状态或互动。适当的粒度水平取决于研究问题和研究的实际约束。
另一个重要的考虑因素是编码的具体性。一些方案使用基于物理的编码,这些编码可以直接观察(例如,“闭眼”),而其他方案则使用需要一定程度推断的社会性编码(例如,“表现出共情”)。虽然基于物理的编码可能更容易一致应用,但基于社会性的编码通常能捕捉更有意义的行为构念。
大多数编码方案努力创建互斥且穷尽(ME&E)的代码集。这意味着对于任何给定的代码集,一次只能应用一个代码(互斥性),并且总有一个适用的代码(穷尽性)。这一属性简化了编码过程和后续的数据分析。
例如,用于编码婴儿状态的简单ME&E集合可能包括:1)安静警觉,2)哭泣,3)烦躁,4)REM睡眠,5)深度睡眠。在任何给定时刻,婴儿将处于这些状态之一且仅此一个。
宏观分析编码系统
宏观分析编码系统涉及使用较大的编码单元和更广泛的类别来评估行为,反映长时间互动中的模式,而不是编码小的或离散的行为单元。
宏观分析编码系统侧重于捕捉总体主题、全局质量或一般行为模式,而不是具体、离散的动作。
例如,宏观分析编码系统可能在全球范围内评估整个治疗过程中治疗师的温暖程度或来访的参与程度,要求编码者在整个互动中总结和推断这些构念,而不是编码较小的行为单元。
这些系统要求观察者进行更多的推断(更加耗时),但能更好地捕捉上下文因素、随时间的稳定性以及行为的相互依赖性(Carlson & Grotevant, 1987)。
宏观分析编码系统的例子:
- 情感可用性量表(EAS):该系统评估照顾者和儿童之间的情感连接质量,包括敏感性、结构化、非侵入性和非敌意等维度。
- 课堂评估评分系统(CLASS):评估教室中师生互动的质量,包括情感支持、课堂组织和教学支持等领域。
微分析编码系统
微分析编码系统涉及使用更小、更离散的编码单元和类别来评定行为。
这些系统专注于捕捉特定的、离散的行为或事件,这些行为或事件是逐时发生的。行为通常以秒为单位或在非常短的时间间隔内进行编码。
例如,一个微分析系统可能会在治疗过程中对每次眼神接触或点头进行编码。这些系统在行为发生时对特定的、分子级的行为进行编码,而不是对较长时间内的行为进行总结。
微分析系统要求编码者进行较少的推断,并允许分析治疗师与来访之间的行为条件和顺序互动。然而,与宏观分析方法相比,它们的实施更加耗时且昂贵。
微分析编码系统的例子:
- 面部动作编码系统(FACS):编码细微的面部肌肉运动以分析情绪表达。
- 特定情感编码系统(SPAFF):用于婚姻互动研究,编码特定的情感行为。
- Noldus Observer XT:一个软件系统,允许实时或从视频记录中详细编码行为。
中观分析编码系统
中观分析编码系统试图平衡宏观和微观分析方法。
与将行为汇总成较大块的宏观分析系统不同,中观分析系统使用中等大小的编码单元,针对更具体的行为或互动序列(Bakeman & Quera, 2017)。
例如,一个中观分析系统可能会对特定类型的治疗师陈述或来访情感表达的每个实例进行编码。然而,中观分析系统仍然使用比每句话的开始/结束更大的单元。
平衡特异性和可行性使中观分析系统适合许多研究问题(Morris et al., 2014)。中观分析代码可以在保留一些顺序信息的同时,保持足够的效率,适用于资源充足但有限的研究。
例如,一个中观分析夫妻互动编码系统可以针对验证序列等关键行为模式,而不需要逐句编码对话。
通过这种方式,中观分析编码可以在不需大量培训或观察的情况下,合理地保持可靠性和特异性。中等水平的关注点在分析互动时提供了深度和广度之间的实用折衷。
中观分析编码系统的例子:
- 母亲-婴儿互动喂养量表:评估5分钟内的喂养互动,编码特定行为和总体质量。
- 夫妻互动评分系统(CIRS):在夫妻互动的片段中编码特定行为并评估总体质量。
- 教学风格评分量表:结合特定教师行为的频率计数和课堂片段中教学风格的整体评分。
防止编码者偏移
编码者偏移是由操作定义不明确导致的测量误差,特别是在行为编码未明确定义时,编码者对观察结果的评级逐渐发生变化。
当编码者未能定期回顾构成或不构成所测量行为的具体观察时,这种类型的错误会逐渐出现。
防止偏移是指采取积极措施以保持一致性并最小化编码者随时间变化或偏离评级或评估行为的方式。具体来说,防止编码者偏移的一些关键方法包括:
- 操作化编码:编码定义必须明确区分哪些互动代表了每个编码行为的实例。
- 持续培训:通过持续培训回顾这些操作定义,有助于重新校准编码者的解释并强化准确识别。定期举行“检查”会议,让编码者练习编码相同的互动,可以监控他们是否继续可靠地应用编码,而不会逐渐改变解释。
- 使用参考视频:编码者定期编码相同的“黄金标准”参考视频,可以锚定他们的判断并校准原始培训。如果没有定期锚定到原始规范,编码者的决策往往会偏离初始测量的可靠性。
- 评估编码者间信度:统计跟踪编码者在整个研究过程中保持高一致性的水平,而不仅仅是开始时,可以标记出任何表明偏移的下降。维持编码者间的高一致性需要减轻在长期编码任务中观察者判断变化的常见倾向。
- 通过讨论重新校准:召开会议让编码者公开讨论分歧,探索判断随时间变化的原因。对编码应用达成共识。
- 调整模糊编码:如果可靠性问题持续存在,重新审视和改进模糊的编码定义或锚点可以消除由编码者困惑引起的不一致。
本质上,防止编码者偏移的目标是保持标准化并最小化可能缓慢改变观察数据评级方式的无意偏差。
通过技能维护、持续校准基准和监控一致性,研究人员可以注意到并纠正编码者决策随时间逐渐变化的情况。
减少观察者偏差
观察研究容易受到观察者偏差的影响,这些偏差源于编码者的主观视角塑造了复杂互动的解释(Burghardt et al., 2012)。在编码时,个人期望可能无意识地影响判断。然而,存在严格的减少此类偏差的方法。
编码手册
详细的编码手册通过明确定义观察者应编码的行为和互动动态来最小化主观性(Bakeman & Quera, 2011)。
高质量的手册具有坚实的理论和实证基础,制定了明确的编码程序,并提供了丰富的行为示例以锚定编码定义(Lindahl, 2001)。
明确界定构成每个编码的行为的频率、强度、持续时间和类型,有助于可靠的判断并减少编码者的模棱两可。如果编码者不清楚编码如何转化为可观察的互动,应用风险可能会导致评分者之间的一致性问题。
编码者培训
合格的编码者需要具备人际感知能力和科学严谨性(Wampler & Harper, 2014)。培训全面回顾了编码结构的理论基础,并教授编码系统本身。
多个“黄金标准”标准视频展示了编码范围,培训生独立应用。然后,编码者每周开会,确保彼此之间以及与主标准编码的可靠性达到80%或更高的一致性(Hill & Lambert, 2004)。
持续培训管理编码者随时间的偏移。修订不清晰的编码也可能提高可靠性。仔细选择并投资严格的培训可以提高质量控制。
盲法方法
为了防止偏差,编码者应不知道具体的研究预测或参与者详情(Burghardt et al., 2012)。数据收集团队和编码团队分开工作有助于保持盲法。
编码者不应知道可能导致编码偏差的研究细节或参与者身份(Burghardt et al., 2012)。
数据收集团队和编码团队分开工作可以减少偏差。
此外,调度程序可以防止编码者对与其有个人接触的参与者直接收集的数据进行评级。保持编码者的独立性和盲法可以增强客观性。
数据分析方法
行为观察中的数据分析旨在将原始观察数据转换为可进行统计分析的量化指标。
需要注意的是,分析方法的选择不是任意的,而应由研究问题、研究设计和收集的数据性质指导。
间隔数据(在固定时间点记录行为)、事件数据(记录行为的发生)和定时事件数据(记录行为的发生和持续时间)可能需要不同的分析方法。
同样,测量水平(分类、有序或连续)将影响统计检验的选择。
研究人员通常从简单的描述性统计开始,以了解他们的数据,然后再进行更复杂的分析。这种逐步的方法可以彻底理解数据,并经常揭示值得进一步调查的意外模式或关系。
简单描述统计
描述统计提供了行为模式的整体图景,通常是分析的第一步。
- 频数计数告诉我们某一特定行为发生的频率,而比率则表示这一频率与时间的关系(例如,每分钟的发生次数)。
- 持续时间测量行为持续的时间,提供有关其持久性或强度的见解。
- 概率计算表明在特定条件下行为发生的可能性,相对频率或持续时间统计显示不同行为在一次会话或整个研究中的比例发生情况。
这些简单的统计数据构成了行为分析的基础,为研究人员提供了行为模式的广泛图景。
它们可以揭示哪些行为最常见,通常持续多长时间,以及在不同的条件或对象之间如何变化。
例如,在一项关于课堂行为的研究中,这些统计数据可能显示学生举手的频率,他们通常专注于任务的时间,或者在不同活动上花费的时间比例。
联合分析
联合分析有助于识别某些行为是否倾向于一起或按顺序发生。
- 联合表,也称为交叉表,显示两个或多个行为的共同发生情况,使研究人员能够看到某些行为是否倾向于一起发生。
- 优势比提供了一种衡量行为之间关联强度的指标,表明一种行为在另一种行为存在时发生的可能性有多大。
- 调整残差可以揭示观察到的共同发生情况是否显著不同于偶然情况下的预期值。
例如,在一项关于亲子互动的研究中,联合分析可能会揭示父母的表扬是否更可能跟随孩子成功完成任务,或者孩子的发脾气是否更可能发生在父母拒绝请求之后。
这些分析可以揭示社会互动、学习过程或行为链中的重要模式。
序列分析
序列分析对于理解行为之间的过程和时间关系至关重要。
- 滞后序列分析考察一个行为在特定数量的事件或时间单位内跟随另一个行为的可能性。
- 时间窗口序列分析检查目标行为是否在给定行为后的定义时间范围内发生。
这些方法对于理解随着时间展开的过程特别有价值,例如对话模式、问题解决策略或社交技能的发展。
观察者一致性
由于人类观察者经常编码行为,因此检查可靠性很重要。这通常通过观察者一致性的度量来完成。
- Cohen’s kappa常用于分类数据,提供了一个考虑偶然一致性的观察者间一致性度量。
- 组内相关系数(ICC):用于连续数据或评分。
良好的观察者一致性对于研究的有效性至关重要,因为它表明观察到的行为在不同的观察者或时间点之间被一致地识别和编码。
高级统计方法
当研究人员深入挖掘数据时,他们通常会采用更高级的统计技术。
- 方差分析(ANOVA)可用于比较不同组或条件下的行为频率或持续时间。
- 例如,ANOVA可能会揭示来自不同社会经济背景或不同学校环境的儿童在攻击行为频率上的差异。
- 多层次建模在行为观察研究中特别有用,其中数据是嵌套的——例如,个体内的行为,群体内的个体,或跨多个时间点的观察。
- 这种方法允许研究人员考虑数据中的依赖性,并检查行为如何受到不同层次因素的影响(例如,个体特征、群体动态和情境因素)。
- 时间序列分析是另一个强大的工具,特别是对于涉及长时间连续观察的研究。
- 这种方法可以揭示随时间变化的行为趋势、周期或模式,这些模式在简单分析中可能不明显。例如,在一项动物行为研究中,时间序列分析可能揭示喂食、交配或领地行为的日常或季节性模式。
表示技术
表示技术帮助组织和可视化数据:
-
代码单元网格:将数据表示为行为和时间单位的矩阵
- 许多研究人员使用代码单元网格,将数据表示为以行为作为行,时间单位作为列的矩阵。
- 这种格式便于进行多种分析,并允许轻松可视化行为模式。
-
序列数据交换标准(SDIS):标准化分析的数据格式
- 标准化的格式如序列数据交换标准(SDIS)有助于确保研究之间的数据表示一致性,并促进专门分析软件的使用。
- 确实,行为观察数据的复杂性通常需要使用专门的软件工具。GSEQ、Observer和INTERACT等程序专为观察数据的分析设计,可以高效准确地执行上述许多分析。
视频/计算机技术的进步使行为观察更加可行,但仍需要仔细规划编码方案、观察者培训和数据分析方法。
参考文献
Bakeman, R., & Quera, V. (2017). 序列分析和行为科学中的观察方法. Cambridge University Press.
Burghardt, G. M., Bartmess-LeVasseur, J. N., Browning, S. A., Morrison, K. E., Stec, C. L., Zachau, C. E., & Freeberg, T. M. (2012). 减少行为研究中的观察者偏差:综述与建议. Ethology, 118(6), 511-517.
Hill, C. E., & Lambert, M. J. (2004). 心理治疗过程和结果研究中的方法论问题. In M. J. Lambert (Ed.), Bergin 和 Garfield 的心理治疗和行为改变手册 (第 5 版, 第 84-135 页). Wiley.
Lindahl, K. M. (2001). 家庭观察研究中的方法论问题. In P. K. Kerig & K. M. Lindahl (Eds.), 家庭观察编码系统:系统研究资源 (第 23-32 页). Lawrence Erlbaum Associates.
Mehl, M. R., Robbins, M. L., & Deters, F. G. (2012). 健康相关社会过程的自然观察:电子激活记录仪方法在心身医学中的应用. Psychosomatic Medicine, 74(4), 410–417.
Morris, A. S., Robinson, L. R., & Eisenberg, N. (2014). 发展心理学研究中的多方法视角. In H. T. Reis & C. M. Judd (Eds.), 社会和人格心理学研究方法手册 (第 2 版, 第 103-123 页). Cambridge University Press.
Smith, J. A., Maxwell, S. D., & Johnson, G. (2014). 日常生活的微观结构:通过可穿戴传感器数据的自动捕获和处理分析日常例行公事的复杂编排. In B. K. Wiederhold & G. Riva (Eds.), 2014 年网络治疗和远程医疗年鉴:技术带来的积极变革 (第 199 卷, 第 62-64 页). IOS Press.
Traniello, J. F., & Bakker, T. C. (2015). 跨学科研究行为互动. In T. K. Shackelford & R. D. Hansen (Eds.), 性别的进化 (第 119-147 页). Springer.
Wampler, K. S., & Harper, A. (2014). 夫妻和家庭评估中的观察方法. In H. T. Reis & C. M. Judd (Eds.), 社会和人格心理学研究方法手册 (第 2 版, 第 490-502 页). Cambridge University Press.
引用来源
本文翻译自以下网站:
simplypsychology.org
使用声明
本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。
如果你有任何问题或建议,请随时联系微信公众号。