系统综述指南:学生版

什么是系统综述?

系统综述是对特定主题现有研究的全面、结构化的分析。它使用预定义的标准来识别、评估和综合相关研究,旨在提供当前证据的无偏见总结。

系统综述的明确和系统方法使其区别于传统综述和评论。

系统综述与叙述性综述的区别:

  • 目标: 叙述性综述提供一个主题的概述或总结,而系统综述回答一个聚焦的综述问题。
  • 文献来源: 叙述性综述通常使用不完整且未声明的文献体,可能导致发表偏倚。系统综述考虑了数据库列表、灰色文献和其他来源。
  • 选择标准: 叙述性综述通常使用主观或没有选择标准,可能导致选择偏倚。系统综述有一个清晰和明确的选择过程。
  • 研究质量评估: 叙述性综述在评估研究质量方面各不相同。系统综述使用标准清单进行严格的研究质量评估。

系统综述耗时且需要具备多种技能和贡献的研究团队。在某些情况下,系统综述可能无法满足综述问题的必要目标。

在这种情况下,[范围综述](/blog_q/sub/steps-for-conducting-a-scoping-review_cn)(有时称为范围练习/范围研究)可能更有用。

[范围综述与系统综述不同](/blog_q/sub/scoping-review-vs-systematic-review_cn),因为它们可能不包括对纳入研究的强制性批判性评估或综合个别研究的结果。

系统综述

评估系统综述的需求

在评估系统综述的需求时,首先必须检查是否存在任何现有的或正在进行的综述,并确定是否需要新的综述。

范围综述通常是进行全面系统综述之前的初步步骤。它们帮助评估可用文献的广度,识别关键概念,并确定更全面综述的可行性。

这一初步探索指导研究人员在后续深入分析中改进他们的方法。

这个过程应从搜索相关数据库开始。

考虑搜索的资源包括:

  • NICE:国家卫生和临床卓越研究所
  • Campbell Library of Systematic Reviews:教育、犯罪和司法、社会福利领域的综述
  • EPPI:政策和实践信息中心,特别是其公共卫生干预措施的系统和非系统综述数据库(DoPHER)
  • MEDLINE:主要涵盖医学领域,是涉及医疗干预措施的系统综述的主要资源
  • PsycINFO:心理学、精神病学、行为科学和社会科学领域的研究
  • Cochrane Library (特别是CDSR):专注于医疗保健干预措施的系统综述,提供定期更新和批判性评估的综述

如果找到针对感兴趣问题的现有综述,应评估其质量以确定其是否适合指导政策和实践。

如果找到高质量的相关综述,但完成日期较早,更新综述可能是必要的。

评估当前相关性非常重要,尤其是在快速发展的研究领域。在更新过程中与原始研究团队合作可能有益,因为他们可以提供数据访问权限。

如果综述被认为质量适中且仍然相关,则可能不需要进行另一项系统综述。

当新的系统综述或更新被认为是必要的,下一步是建立综述团队并可能建立咨询小组,然后开发综述协议。

如何进行系统综述

PRISMA(系统综述和元分析的首选报告项目)是一个旨在提高系统综述报告透明度和完整性的报告指南。

PRISMA 的创建是为了应对系统综述中常见的报告不足问题:

  • 清单:PRISMA 包含一个27项清单,涵盖了系统综述的所有方面,从理由和目标到结果的综合和局限性的讨论。每个清单项目都附有详细的报告建议,详见解释和详细说明文件
  • 流程图:PRISMA 还包括一个流程图,以直观地表示研究选择过程,提供一种清晰、标准化的方式展示研究人员如何到达最终纳入的研究集。

系统综述3

第一步:编写研究协议

在系统综述的背景下,协议是一个详细计划,概述了整个综述过程中将采用的方法。

协议作为路线图,引导研究人员通过综述的每个阶段,确保透明性和可重复性。

该文档应提供关于研究过程每个阶段的具体细节,包括识别、选择和分析相关研究的方法。

例如,协议应指定相关研究的搜索策略,包括搜索是否涵盖未发表的作品。

应在开始研究过程之前制定协议,以确保透明性和可重复性。

这个预先确定的计划确保综述过程中做出的决策是客观的,不受偏见影响,因为它们基于预先确定的标准。

在系统综述过程中有时需要修改协议。虽然遵守协议对于最小化偏见至关重要,但在某些情况下,修改是合理的。例如,从审查主要研究中获得的对研究问题的更深入理解可能需要对协议进行更改。

系统综述应在启动时(在协议阶段)注册,原因如下:

  • 避免意外重复
  • 使报告的综述方法与协议中的计划进行比较

这可以防止重复(研究浪费),并在完整的系统综述提交出版时简化流程。

PROSPERO 是一个国际性的前瞻性注册系统综述数据库,涵盖健康和社会护理领域。非Cochrane协议应在PROSPERO上注册。

研究方案

引用

Rasika Jayasekara, Nicholas Procter. 认知行为疗法对老年人重度抑郁的影响:系统综述. PROSPERO 2012 CRD42012003151 可从: https://www.crd.york.ac.uk/prospero/display_record.php?ID=CRD42012003151

回顾问题

认知行为疗法(CBT)与其它干预、安慰剂或标准治疗相比,在防止复发和改善心理健康方面对患有重度抑郁症的老年人有多有效?

搜索策略

搜索策略旨在找到已发表和未发表的研究和出版物。搜索将限制在2002年至2012年期间以英语发表的论文。

将开发一个三步搜索策略,使用MeSH术语和关键词,确保所有与回顾相关的材料都被捕捉到。

首先,将对MEDLINE和CINAHL进行初步有限搜索,随后分析标题和摘要中包含的文本词以及用于描述文章的索引词。然后,将使用所有识别出的关键词和索引词进行第二次搜索。

第三,将搜索所有已识别报告和文章的参考文献列表,以查找额外的研究。

要搜索的数据库包括:

  • MEDLINE
  • CINAHL
  • Cochrane Central Register of Controlled Trials
  • Controlled Trials
  • EMBASE
  • Current Contents
  • PsycINFO
  • Ageline

未发表研究的搜索将包括:

  • 数字论文(Proquest)
  • 会议论文集
  • MEDNAR

将联系该领域的专家,获取正在进行和未发表的试验信息。专家将通过期刊出版物来确定。

要纳入的研究类型

所有评估CBT作为治疗老年人重度抑郁症的有效性,与标准护理、特定药物、其他疗法和无干预相比的随机对照试验(RCTs)都将被考虑。

在没有RCTs的情况下,将检查其他研究设计,如准实验研究、病例对照研究和队列研究。然而,描述性研究和专家意见将被排除。

研究的状况或领域

根据DSM IV或ICD 10标准诊断重度抑郁症。

如果试验未能采用诊断标准,将通过使用标准化评分量表(包括汉密尔顿抑郁评分量表、蒙哥马利-阿斯伯格评分量表和老年抑郁评分量表)来描述抑郁症的严重程度。

将排除包括明确诊断为痴呆症、帕金森病和其他精神疾病的参与者的研究。

回顾将包括在初级、二级、社区、疗养院和住院环境中进行的试验。

参与者/人群

回顾将包括描述为老年人、老年或老年人的研究,或所有患者年龄在55岁及以上的研究(许多北美老年人口研究使用55岁作为分界点)。

回顾将包括任何性别受试者的试验。在可能的情况下,参与者将被归类为社区居民或长期护理居民。

干预/暴露

回顾将重点评估CBT对患有重度抑郁症的老年人的影响。

认知行为疗法这一标签已被应用于多种干预措施,因此很难提供单一、明确的定义。

为了被分类为CBT,干预措施必须清楚地展示以下组成部分:

  1. 干预涉及接受者建立其思想、感受和行动与目标症状之间的联系;
  2. 干预涉及纠正个人与目标症状相关的误解、非理性信念和推理偏见。
  3. 干预应包括以下一项或两项:
    • 接受者监测自己与目标症状相关的思想、感受和行为;
    • 促进应对目标症状的替代方法。

此外,所有不符合这些标准(或提供的信息不足)但被标记为“CBT”或“认知疗法”的疗法将被归类为“定义不明确”的CBT。

对照/控制

其他干预、安慰剂或标准治疗

主要结果

主要结果:

  1. 通过汉密尔顿抑郁评分量表、蒙哥马利-阿斯伯格评分量表或老年抑郁评分量表评估的抑郁水平。
  2. 复发(按个别研究定义)。
  3. 死亡(突然、意外死亡或自杀)。
  4. 心理健康(按个别研究定义)。

效果测量

回顾将把结果分为短期(治疗开始后12周内)、中期(治疗开始后13至26周内)和长期(治疗开始后超过26周)测量的结果。

其他结果

次要结果:

  1. 心理状态
  2. 生活质量
  3. 社会功能
  4. 再次住院
  5. 意外或不良影响(副作用),如焦虑、抑郁和对治疗师关系的依赖

数据提取(选择和编码)

将使用JBI-MAStARI从纳入回顾的论文中提取数据。在此阶段,将提取与人口、干预、研究方法和结果相关的任何相关研究。

如果数据缺失或不清楚,将联系作者以获取信息。

偏倚风险(质量)评估

所有选定的论文将在纳入回顾之前由两名独立评审员评估其方法学有效性。

由于回顾仅评估实验研究,将使用Joanna Briggs研究所元分析统计评估和审查工具(JBI-MAStARI)评估每项研究的方法学有效性。

如果两名评审员之间存在分歧,将与第三名评审员讨论以解决差异。

数据综合策略

在可能的情况下,将使用Cochrane协作组的Review Manager软件对定量研究结果进行统计元分析。

将计算每个研究的比值比(对于分类结果数据)或标准化均数差(对于连续数据)及其95%置信区间。

将使用标准卡方检验评估异质性。如果无法进行统计汇总,将以叙述形式呈现结果。

第二步:制定研究问题


制定一个聚焦的研究问题是系统综述的关键,因为它支撑着综述过程的每一个阶段。

问题定义了综述的性质和范围,指导相关研究的识别,并塑造数据提取和综合过程。

研究问题必须是可回答的,并在综述方案中明确陈述,以确保综述的边界清晰。

过于狭窄的问题可能会限制相关研究的数量和普遍性,而过于宽泛的问题则可能难以得出具体结论。

PICO框架

PICO框架是一种创建聚焦临床研究问题的模型。PICO的首字母代表:

  • Population/Patient/Problem:这一元素定义了研究问题所涉及的具体人群。
  • Intervention:这是正在考虑的人群的治疗、测试或暴露。
  • Comparison:这是与干预相比的替代干预或对照组。
  • Outcome:这一元素指定了正在调查的干预结果或效果。

在设计研究时使用PICO格式有助于最小化偏差,因为问题和综述的方法是在查阅任何文献之前制定的。

PICO元素也有助于定义用于选择系统综述来源的纳入标准。

PICO框架通常用于主要分析来自[随机对照试验]的数据的系统综述。

并非每个研究问题都需要PICO的所有元素。例如,并非总是需要比较。

可以使用PICO回答的问题类型:

疗法

“对于最近急性中风(少于6周)且活动能力下降的患者(P),任何特定的物理治疗方法(I)与不进行物理治疗(C)相比,在提高日常生活活动独立性和步速方面(O)是否更有益?”

预防

“对于经历过家庭暴力的女性(P),倡导项目(I)在提高生活质量方面(O)的效果与其他治疗方法(C)相比如何?”

病因/伤害

有盆腔炎病史的女性(P)患妇科癌症的风险(O)是否高于没有盆腔炎病史的女性(C)?

诊断

在低风险结肠癌的无症状成人中(P),粪便免疫化学检测(FIT)(I)在诊断结肠癌方面的敏感性和特异性(O)是否与结肠镜检查(C)相同?

预后

在患有肺炎的成人中(P),患有慢性肾病(CKD)的人(I)的死亡率(O)是否高于没有CKD的人(C)?

替代框架

选择适当的研究问题框架很大程度上取决于将框架与所审查的证据类型对齐。

  • PICOCS:这个框架用于公共卫生研究,增加了“Context”(背景)元素到PICO框架中。这有助于考察干预措施的实施环境或设置如何影响其有效性。
  • PICOC:这个框架扩展了PICO,增加了“Costs”(成本)作为研究问题的一个要素。它特别适用于涉及干预措施经济评估的研究问题。
  • ECLIPSEExpectations(期望)、Client group(来访群体)、Location(地点)、Impact(影响)、Professionals involved(参与的专业人员)、Service(服务)、和 Evaluation(评估)。这是一个助记符,旨在帮助搜索健康政策和管理信息。
  • PEO:这个缩写代表 Patient(患者)、Exposure(暴露)和 Outcome(结果),是PICO的一个变体,用于研究问题集中在风险因素暴露与特定结果之间的关系时。
  • PIRD:这个缩写代表 Population(人群)、Index Test(指数测试)、Reference Test(参考测试)和 Diagnosis of Interest(感兴趣的诊断),指导研究问题集中在评估特定测试的诊断准确性。
  • PFO:这个缩写代表 Population(人群)、Prognostic Factors(预后因素)和 Outcome(结果),适用于旨在调查特定预后因素与特定健康结果之间关系的研究问题。
  • SDMO:这个框架代表 Studies(研究)、Data(数据)、Methods(方法)和 Outcomes(结果),有助于构建专注于研究方法论方面的研究问题,考察不同研究方法或设计对研究结果质量的影响。

第三步:搜索策略


PRISMA(系统评价和荟萃分析的首选报告项目)为报告定量文献搜索提供了适当的指导。

提供所有数据库、注册表和网站的完整搜索策略,包括使用的任何过滤器和限制。

PRISMA 2020 检查表

搜索策略是一种全面且可重复的计划,用于识别所有解决特定研究问题的相关研究。

这种系统的搜索方法有助于最小化偏差,并将系统评价与其他类型的文献综述区分开来。

透明地记录搜索策略并记录所有决策以确保可审计性非常重要。目标是识别所有潜在的相关研究以供考虑。

以下是搜索策略的分解:

搜索字符串构建

建议咨询评审团队和顾问委员会的主题专家,以创建尽可能完整的每个概念的搜索词列表。

为了检索最相关的结果,使用搜索字符串。该字符串由以下部分组成:

  • 关键词:搜索词应与研究问题的主题领域相关,并应为研究问题的所有组成部分(例如,人群、干预、对照组和结果——PICO)确定。使用相关关键词有助于减少无关的搜索结果。词典、教科书和已发表的文章可以帮助识别合适的关键词。
  • 同义词:这些是与关键词意义相似的词语或短语,因为作者可能使用不同的术语来描述相同的概念。包含同义词有助于覆盖术语的变化,增加找到所有相关研究的机会。例如,药物干预可能被称为其通用名或其多个专有名称之一。
  • 截断符号:这些符号通过捕捉关键词的变化来扩大搜索范围。它们的功能是定位以特定词根开头的每一个词。例如,如果用户正在研究吸烟的干预措施,他们可能会使用截断符号搜索“smok*”以检索包含“smoke”、“smoker”、“smoking”或“smokes”的记录。这可以节省时间和精力,无需将每个词的每个变化输入数据库。
  • 布尔运算符:使用布尔运算符(AND/OR/NEAR/NOT)有助于有效地组合这些术语,确保搜索策略既敏感又具体。例如,使用“AND”将搜索范围缩小到仅包含两个术语的结果,而使用“OR”则将搜索范围扩大到包含任一术语的结果。

信息来源

主要目标是找到所有符合研究问题预定义标准的已发表和未发表的研究。这包括考虑典型数据库之外的各种来源。

系统评价的信息来源可以包括广泛的资源,如学术数据库、未发表的文献、会议论文、书籍,甚至是专家咨询。

指定所有搜索或咨询以识别研究的数据库、注册表、网站、组织、参考列表和其他来源。指定每次来源最后一次搜索或咨询的日期。

PRISMA 2020 检查表

在专业图书管理员的帮助下制定了详尽的系统搜索策略。

  • 电子数据库:搜索应包括七个关键数据库:CINAHL、Medline、APA PsycArticles、Psychology and Behavioral Sciences Collection、APA PsycInfo、SocINDEX with Full Text 和 Web of Science: Core Collections。
  • 灰色文献:除了数据库,还可以进行法医或“扩展”搜索。这包括:灰色文献数据库搜索(例如 OpenGreyWorldCatEthos),会议论文、未发表的报告、论文临床试验数据库、按相关出版物作者姓名搜索。独立研究机构也可能是材料的良好来源,例如 种族关系研究中心约瑟夫·罗恩特里基金会英国照顾者协会
  • 引文搜索:参考列表通常会引导到领域内被高度引用和有影响力的论文,为审查提供有价值的背景信息。
  • 手工搜索:手动逐页搜索特定期刊或会议论文集是另一种确保捕获所有相关研究的方法,特别是那些尚未被数据库索引的研究。
  • 联系专家:联系领域内的研究人员或专家可以获取未公开的数据或正在进行但尚未公开的研究。

需要注意的是,这可能不是所有潜在数据库的详尽列表。

示例:

对1974年至2018年期间在英文期刊上发表的文献进行了系统化的计算机搜索。搜索了四个数据库,包括PsychINFO、Embase、OVID MEDLINE和AMED。使用与依恋(“attachment” OR “working model” OR “safe haven” OR “secure base” OR “felt security”)和浪漫伴侣(“dyad” OR “couple” OR “spous” OR “partner” OR “romantic” OR “wife” OR “husband” OR “close relationship” OR “interpersonal” OR “intimate” OR “mari”)以及社会支持(“support prov” OR “caregiving” OR “support giv” OR “social support” OR “enacted support” OR “support received” OR “receiv support” OR “prov support” OR “dyadic coping” OR “interpersonal coping” OR “collaborative coping” OR “help‐seeking” OR “emotional support” OR “tangible support” OR “instrumental support” OR “perceived support” OR “responsive” OR “buffer” OR “partner support” OR “Support avail” OR “available support”)相关的搜索词组合进行数据库搜索。检索到的研究的参考文献列表被检查以找到其他相关出版物,这些出版物未在计算机化数据库搜索中识别。

来源: McLeod, S., Berry, K., Hodgson, C., & Wearden, A. (2020). 依恋与浪漫伴侣中的社会支持:系统综述。Journal of clinical psychology, 76(1), 59-101.

纳入标准

指定综述的纳入和排除标准。PRISMA 2020 清单

在开始文献搜索之前,研究人员应建立明确的研究纳入资格标准。

纳入标准用于选择系统综述的研究,并应基于研究方法和PICO元素。

为了保持透明度并最小化偏差,应在事前确定研究纳入的资格标准。理想情况下,研究人员应旨在仅包括符合意向治疗原则的高质量随机对照试验

研究的选择不应是任意的,纳入和排除标准的理由应在研究协议中明确阐述。

纳入标准应通过将其应用于论文样本进行试点测试,以检查它们是否可以可靠地解释和适当分类研究。试点阶段可以完善和澄清纳入标准,确保多个评审员可以一致地应用这些标准。

在指定纳入和排除标准时,考虑以下方面:

  • 干预特征: 研究人员可能决定,为了被纳入综述,干预措施必须具有特定特征。他们可能要求干预措施持续一定时间,或者他们可能确定只有具有特定理论基础的干预措施适合他们的综述。
  • 人群特征: 系统综述可能关注特定人群的干预效果。例如,研究人员可能会选择只关注包括护士或医生的研究。
  • 结果测量: 研究人员可能选择仅包括使用符合特定标准的结果测量的研究。
  • 参与者年龄: 如果系统综述正在研究儿童的治疗或干预效果,综述作者可能会选择排除任何未包括目标年龄段儿童的研究。
  • 参与者的诊断状态: 进行焦虑症治疗系统综述的研究人员可能会排除任何参与者未被诊断为焦虑症的研究。
  • 研究设计: 研究人员可能决定仅包括使用特定研究设计的研究,如随机对照试验。
  • 对照组: 在干预的系统综述中,研究人员可能会选择仅包括包含某些类型对照组的研究,如等待名单对照或其他类型的干预。
  • 出版状态: 决定是否仅包括已发表的研究,或者未发表的作品,如学位论文或会议论文,也将被考虑。

示例:

符合以下标准的研究被纳入:(a) 处于承诺浪漫关系中的夫妇(无论性别)的经验研究;(b) 测量成人依恋与该关系中支持之间的关联;(c) 文章是用英文全文发表的报告;(d) 文章是经验研究、学位论文、综述文章和会议报告的报告。

来源: McLeod, S., Berry, K., Hodgson, C., & Wearden, A. (2020). 依恋与浪漫伴侣中的社会支持:系统综述。Journal of clinical psychology, 76(1), 59-101.

迭代过程

开发系统综述搜索策略的迭代性质源于需要根据每个阶段遇到的信息来调整和完善搜索过程。

一次尝试很少能产生完美的最终策略。相反,这是一个涉及一系列测试搜索、结果分析和团队讨论的不断演变的过程。

以下是迭代过程的展开方式:

  1. 初始策略制定: 基于研究问题,团队制定了初步的搜索策略,包括识别相关关键词、同义词、数据库和搜索限制。
  2. 测试搜索和改进: 初始搜索策略在选定的数据库上进行测试。审查结果的相关性,并相应地改进搜索策略。这可能涉及添加或修改关键词、调整布尔运算符或重新考虑使用的数据库。
  3. 讨论和迭代: 搜索结果和建议的改进在团队内部进行讨论。团队协作决定最佳的修改方案,以提高搜索的全面性和相关性。
  4. 重复循环: 测试搜索、分析、讨论和改进的循环重复进行,直到团队对策略捕捉所有相关研究的能力感到满意,同时尽量减少无关结果。

开发搜索策略的迭代性质对于确保系统综述的全面性和无偏见至关重要。

通过不断根据结果和反馈改进搜索策略,研究人员可以更有信心地识别所有相关研究。

这一迭代过程确保了应用的搜索策略足够敏感,能够捕捉所有相关研究,同时保持可管理的范围。

在整个过程中,详细记录搜索策略,包括任何修改,对于透明度和未来复制系统综述至关重要。

搜索是一项务实的活动:如果搜索识别出15,000个项目,而评审团队由两名在空闲时间工作的人员组成,可能需要缩小综述和纳入标准的范围。这可以通过修订出版日期(例如,过去十年而不是二十年的文章),和/或感兴趣的人群和/或研究设计来完成。

步骤4:文献搜索

使用明确定义的搜索词和数据库进行系统的文献搜索。

应用搜索策略涉及将构建的搜索字符串输入相应的数据库搜索界面。这些搜索字符串使用布尔运算符、截断符号、通配符和数据库特定语法构建,旨在检索所有可能与研究问题相关的研究。

在此阶段,研究人员与数据库的功能互动,以优化搜索并管理检索结果。

这可能涉及使用数据库提供的搜索过滤器,专注于特定的研究设计、出版类型或其他相关参数。

应用搜索策略不仅仅是机械地输入术语,它需要对数据库功能有深入的了解,并且能够根据检索结果的性质调整搜索。

步骤5:筛选和选择研究文章

一旦搜索策略最终确定,就将其应用于选定的数据库,生成一组搜索结果。

然后根据预先定义的纳入标准对这些搜索结果进行筛选,以确定其是否有资格纳入综述。

目标是识别既与研究问题相关又质量足够的研究,以贡献有意义的综合。

符合纳入标准的研究通常保存在电子数据库中,如EndnoteMendeley,包括标题、作者、日期和出版期刊以及摘要(如果可用)。

研究选择

指定用于决定一项研究是否符合综述纳入标准的方法,包括每条记录和每份报告的筛选者数量,他们是否独立工作,以及在适用的情况下,自动化工具在过程中的使用详情。

PRISMA 2020 检查表

系统综述的选择过程涉及多位评审员以确保严谨性和可靠性。

为了最小化偏见并增强研究选择过程的可靠性,建议至少两名评审员独立评估每项研究的资格。这种独立评估有助于减少个人偏见或判断错误的影响。

两名评审员应独立筛选标题和摘要,根据预先定义的纳入和排除标准去除重复和不相关的研究。

  1. 初步筛选标题和摘要: 在应用文献搜索策略后,下一步是根据预先定义的纳入和排除标准筛选已识别文章的标题和摘要。在此初步筛选中,评审员的目标是识别潜在相关研究,同时排除明显超出综述范围的研究。在此阶段优先考虑过量纳入至关重要,这意味着评审员应在研究的相关性存在不确定性时倾向于保留研究。这种谨慎的方法有助于最小化无意中排除潜在有价值研究的风险。
  2. 获取和评估全文: 对于仅凭标题和摘要无法做出明确决定的研究,评审员需要获取文章的全文进行全面评估,以符合预先定义的纳入和排除标准。此阶段涉及仔细审查每篇潜在相关研究的全文,以确定其资格。
  3. 解决分歧: 当评审员对研究的资格存在分歧时,应有预先定义的策略,通过共识构建讨论或由第三方评审员仲裁来达成最终决定。这种协作方法确保了公平和公正的选择过程,进一步增强了综述的可靠性。

示例:

首先,将来自不同数据库的搜索结果合并,并删除任何重复项。首席作者(S. M.)和一名研究生(F. N.)以标准化方式应用描述的纳入标准。首先,对文章的标题和摘要进行评估以确定其相关性。如果根据标题和/或摘要,研究看起来可能符合纳入标准,则获取手稿的硬拷贝。如果对手稿的适用性有疑问,则将其纳入下一步。剩余的文章获取全文进行审查,阅读方法和结果部分以检查文章是否符合纳入标准。如果在这一阶段对手稿的适用性有疑问,则与另一位作者(C. H.)讨论。最后,检查合格文章的参考文献列表,以查找计算机化搜索期间未识别的其他相关文章。对于选定的文章(n = 43),关于依恋和支持关系的结果被纳入本综述(见图1,PRISMA 流程图)。

来源:McLeod, S., Berry, K., Hodgson, C., & Wearden, A. (2020). 依恋和浪漫伴侣中的社会支持:系统综述。临床心理学杂志, 76(1), 59-101.

PRISMA 流程图

PRISMA 流程图 是系统综述中研究选择过程的可视化表示。

流程图展示了基于预先定义的纳入和排除标准筛选、过滤和选择研究的逐步过程。

流程图视觉化展示了以下阶段:

  • 识别: 通过数据库搜索初步识别的标题和摘要数量。
  • 筛选: 基于标题和摘要的筛选过程。
  • 资格: 获取剩余记录的全文并评估其资格。
  • 纳入: 应用预先定义的纳入标准,纳入符合所有综述标准的出版物。
  • 排除: 流程图详细列出了排除剩余记录的原因。

这种系统和透明的方法,如 PRISMA 流程图所示,确保了一个稳健且无偏见的选择过程,增强了系统综述发现的可靠性。

流程图作为研究选择过程中决策的视觉记录,使读者能够评估综述的严谨性和全面性。

prisma 流程图

来源:McLeod, S., Berry, K., Hodgson, C., & Wearden, A. (2020). 依恋和浪漫伴侣中的社会支持:系统综述。临床心理学杂志, 76(1), 59-101.

第 6 步:批判性评价纳入研究的质量

质量评估提供了综述中呈现证据强度的衡量标准。

高质量的研究具有严谨的方法论,有助于形成更稳健和可靠的证据基础,增加对综述结论的信心。

相反,包含方法论薄弱的低质量研究可能会削弱综述的发现,可能导致不准确的建议。

为了判断系统综述中纳入研究的质量,通常使用标准化工具,如检查表和量表。这些工具有助于确保透明和可重复的评估过程。

工具的选择应得到合理解释,并与研究设计和所需细节水平相一致。单独使用质量评分是不鼓励的;相反,应考虑方法论质量的各个具体方面。

以下是一些来源中提到的具体工具:

示例:

研究质量不是纳入标准;然而,进行了研究质量检查。两名独立评审员(S. M. 和 C. H.)对符合纳入标准的研究进行了评级,以确定证据的强度。调整了有效公共卫生实践项目质量评估工具,以评估每项研究的方法学质量(Thomas, Ciliska, Dobbins, & Micucci, 2004)。该工具进行了调整,以包括与每项研究方法相关的领域。例如,对于非实验研究,去除了盲法。根据 Thomas 等人(2004)的建议,每个领域被评为弱(3 分)、中等(2 分)或强(1 分)。问题的平均得分用作总体质量的指标,研究被赋予总体质量评级为强(1.00–1.50)、中等(1.51–2.50),

来源:McLeod, S., Berry, K., Hodgson, C., & Wearden, A. (2020). 依恋和浪漫伴侣中的社会支持:系统综述。临床心理学杂志, 76(1), 59-101.

证据表

审查中包括的研究的评估方面应记录为证据表(NICE 2009):研究设计和范围的简要文本表。

审查的读者可以使用证据表来检查细节,并评估特定研究的发现的可信度和普遍性。

对所包括研究的质量进行批判性评估可以与数据提取表结合使用。

质量评估表

来源: McLeod, S., Berry, K., Hodgson, C., & Wearden, A. (2020). 伴侣关系中的依恋和社会支持:系统回顾. 临床心理学杂志, 76(1), 59-101.

第7步:从研究中提取数据


为了有效地从符合你的系统评价纳入标准的研究中提取数据,你应该遵循一个确保准确性、一致性和最小化偏见的结构化过程。

1. 开发数据提取表:

  • 设计一个标准化表格(纸质或电子版),以指导数据提取过程:此表格应根据你的具体审查问题和所包括的研究类型进行定制。
  • 试点测试表格:在一小部分已包含的研究上测试表格(例如,3-5项)。评估其清晰性、完整性和可用性。根据反馈和初步经验完善表格。
  • 可靠性:确保所有团队成员了解如何一致地使用表格。

2. 提取数据:

  • 一般信息:这包括基本的书目详细信息(期刊、标题、作者、卷、页码),作者陈述的研究目的,研究设计和资金来源。
  • 研究特征:捕获关于研究人群(人口统计学、纳入/排除标准、招募程序)、干预措施(描述、传递方法)和比较对象(如适用,描述)的详细信息。
  • 结果数据:记录干预的结果及其测量方式,包括使用的具体统计数据。明确定义所有提取数据的结局指标。
  • 偏见风险评估:记录用于评估所包括研究的质量和任何潜在偏见来源的方法。这可能涉及使用标准化清单或量表。
  • 附加信息:根据你的审查,你可能需要提取其他变量的数据,如不良反应、经济评估或特定的方法学细节。

3. 双重独立审查:

  • 确保至少两名评审员使用标准化表格独立地从每项研究中提取数据。交叉检查提取的数据以确保准确性,减少偏见并帮助识别任何差异。
  • 制定解决分歧的预设策略:这可能涉及讨论、共识或由第三方评审员仲裁。
  • 记录在数据提取阶段排除任何研究的原因:这增强了你审查的透明度和可重复性。
  • 如有必要,联系研究作者以获取缺失或澄清不清楚的信息:这对于对你的审查结果至关重要的数据尤为重要。
  • 清楚记录整个数据提取过程,包括遇到的任何挑战和做出的决定:这增强了你的系统评价的透明度和严谨性。

通过遵循这些步骤,你可以有效地从符合你纳入标准的研究中提取数据,为分析和综合阶段打下坚实的基础。

第8步:综合提取的数据


系统评价的关键要素是综合:即将来自一组纳入研究的发现汇总在一起,以便基于证据库得出结论。

系统评价中的数据综合涉及收集、合并和总结来自所包括研究的发现。

这一过程旨在通过考虑证据的强度、检查观察到的效果的一致性以及调查任何不一致性,提供一个可靠且全面的回答,以回应审查问题。

数据综合将在系统评价的结果部分呈现。

  • 编写一个清晰的文字叙述,解释关键发现
  • 使用逻辑标题结构引导读者浏览你的结果综合
  • 确保你的文字叙述解决了审查的研究问题
  • 使用表格总结发现(可以是与数据提取相同的表格)

识别跨研究的模式、趋势和差异

叙事综合使用文本方法分析研究内部和之间的关系,以提供对证据稳健性的整体评估。所有系统评价都应包含叙事综合的元素,如表格和文本。

系统评价数据提取表 - 患者结局

来源: Head, B. A., Schapmire, T. J., & Zheng, Y. (2017). 终末期护理中的远程医疗:患者报告结局的系统评价. 临终关怀与姑息护理杂志, 19(2), 130-139.

记住,叙事综合的目标不仅仅是简单地总结个别研究。你旨在通过系统和透明的方式整合和解释现有证据,创造新的理解。

组织你的数据:

  • 按主题、干预措施或结局分组研究
  • 创建摘要表以显示跨研究的关键信息
  • 使用概念图等视觉辅助工具展示研究之间的关系

描述研究:

  • 总结所包括研究的特征(例如,设计、样本量、环境)
  • 突出研究之间的相似性和差异
  • 讨论证据的整体质量

发展初步综合:

  • 从描述个别研究的结果开始
  • 将类似发现归类在一起
  • 识别总体主题或趋势

探索关系:

  • 寻找数据中的模式
  • 识别可能导致研究结果差异的因素
  • 考虑研究特征与结局的关系

解决矛盾:

  • 考虑研究人群、干预措施或背景的差异
  • 查看可能解释差异的方法学差异
  • 考虑不一致结果的影响
  • 不要忽视冲突的发现
  • 讨论矛盾的可能原因

避免投票计数:

  • 不要简单地统计正面与负面结果
  • 相反,考虑每个发现的证据强度和质量

评估综合的稳健性:

  • 反思每个发现的证据强度
  • 考虑主要研究中的空白或局限性如何影响你的结论
  • 讨论综合过程中可能存在的任何偏见

第9步:讨论部分和结论


总结关键发现:

  • 根据你的研究问题总结关键发现
  • 突出研究中的主要主题或模式
  • 解释证据中的细微差别和复杂性
  • 讨论证据的整体强度和一致性
  • 这为读者提供了清晰的要点信息

考虑研究质量和背景:

  • 评估高质量研究是否倾向于显示不同的结果
  • 检查研究设置或参与者特征是否导致发现不同
  • 这有助于读者权衡冲突发现的相对重要性

讨论意义:

  • 对实践的意义:专业人士如何应用这些发现?
  • 对政策的意义:哪些政策变化可能得到证据的支持?
  • 考虑积极和消极的影响
  • 这有助于将你的发现转化为实际应用

识别空白和未来研究:

  • 指出证据缺乏或不一致的领域

  • 建议具体的研究问题或研究设计以解决这些空白

  • 这有助于指导该领域的未来研究工作

    陈述优势和局限性

  • 讨论你的综述的优势(例如,全面的搜索,严谨的方法)

  • 承认局限性(例如,语言限制,发表偏倚的可能性)

  • 这种平衡的方法展示了批判性思维,有助于读者解读你的发现

减少偏倚

为了减少系统综述中的偏倚,建立一个系统且透明的综述过程以在每个阶段最小化偏倚是至关重要的。来源提供了实现这一目标的策略和方法。

  1. 协议开发和发布:在开始综述之前制定全面的协议是必不可少的。在PROSPERO或Cochrane Library等存储库中发布协议可以提高透明度,帮助避免偏离计划的方法,从而最小化偏倚的风险。
  2. 透明报告:遵循PRISMA等报告指南确保综述的所有关键方面都得到充分记录,增加读者对系统综述报告透明性和完整性的信心。
  3. 双重独立评审:在综述过程的多个阶段(研究选择、数据提取、质量评估)使用两名或更多独立评审者可以最小化偏倚。评审者之间的任何分歧应通过讨论或咨询第三方评审者来解决。这种方法减少了个别评审者的主观解释或错误的影响。
  4. 严格的质量评估:评估纳入研究的方法学质量对于最小化综述结果中的偏倚至关重要。使用标准化的批判性评价工具和清单有助于识别单个研究中的潜在偏倚,如选择偏倚、实施偏倚、失访偏倚和检测偏倚。
  5. 减轻发表偏倚:系统综述应力求包括所有相关研究,无论其发表状态如何。
    • 超越已发表文献的搜索:探索“灰色文献”的来源,如会议论文、未发表的报告、论文和正在进行的临床试验数据库。
    • 联系领域内的专家:研究人员可以联系作者和调查人员,询问未发表或正在进行的研究。
    • 考虑语言偏倚:扩展搜索范围,包括用英语以外的语言发表的研究,可以帮助减少语言偏倚,尽管这可能会增加综述的复杂性和成本。

阅读清单


引用来源

本文翻译自以下网站:

simplypsychology.org

使用声明

本文仅供教育和参考用途。如需转载或引用,请注明出处和作者。

如果你有任何问题或建议,请随时联系微信公众号。

回到首页