如何阅读医学论文:循证医学的基础

对“垃圾”论文的理解

当学生知道一些(甚至大部分)发表的论文应该扔进垃圾箱时，他们是肯定的。

当它不能用于指导临床实践时，他们通常会感到惊讶。论文在本文的第一个框图中列出。

被有同行评审程序的杂志拒绝的一些常见原因。

目前，大多数发表在医学期刊上的论文或多或少都是以标准的IMRAD格式撰写的:也就是说，以前

文字(作者为什么决定进行这项研究)，方法(作者是如何进行这项研究的，他是如何分析的？

得出的结果)、结果(作者发现了什么)和讨论(得出的结果有什么意义)。如果

如果你要判断一篇论文是否值得一读，你要审查这篇论文方法论部分的科研设计，以及

不是回顾研究假设的重要性、研究结果可能产生的影响或讨论的深度。

严格评估

许多EBM教材2-6和Sackett及其同事撰写的医学文章发表在JAMA杂志上。

用户指南7-21详细介绍了科研方法质量的评价方法(严格评价)。

如果你是一个有经验的杂志读者，这些作者提供的大部分结构化清单是不言自明的。

做爱。如果你不是，请尝试回答以下基本问题。

这篇文章的要点

许多发表在医学期刊上的论文在方法论上存在潜在的严重缺陷。

在判断一篇论文是否有效，是否与临床相关时，首先确定论文阐述了哪些临床问题。

标题

应使用双盲随机对照临床试验来解释与药物治疗或其他医学干预相关的问题。

需要纵向队列研究来解释预后。当阐述与病因学有关的问题时，有必要

队列研究或病例对照研究

病例报告虽然在方法论上不够严谨，但能快速完成，并能提醒医生注意用药。

不良反应

问题1:为什么进行这项研究？作者阐述了哪些临床问题？

一篇科研论文的前言应该简要说明这项研究的背景。例如，“Gro

Mmet插入术是儿童常见的手术，所以有人认为临床上并不是所有的手术都有。

必要的。“这一解释之后，应简要回顾已发表的文献。

为什么论文被拒绝发表？

。这项研究没有详细阐述重要的科学课题。

。这项研究不是原创的(其他人已经做了相同或类似的研究)

。这项研究并没有真正验证作者提出的假设。

。应该进行另一种类型的研究。

。实施中的困难(例如，筛选研究对象)使作者改变了原来的研究计划。

。样本量太小了

。研究中没有对照组或对照组不足。

。统计分析方法是错误的或不恰当的。

。作者从研究数据中得出的结论是不正确的。

。存在明显的利益冲突(其中一个作者或赞助商可能通过发表这篇文章获得经济利益)

而且也没有足够的证据证明没有偏见。

。论文写作水平太差，看不懂。

作者应在文章的前言中明确说明要检验的假设，否则应在方法论部门明确说明。

这确实意味着。如果假设以否定的方式表达，例如“在碘脲治疗的最大剂量上加2”

二甲双胍不能改善ⅱ型糖尿病的控制”，这就是所谓的零假设。

当一项研究的作者开始研究时，他们很少真正相信他们无效的假设。如同

普通人，他们通常会开始揭示他们所研究的两个方面的差异。但是科学家使用它的方式

是的，“我们先假设没有区别，然后再试图否定这个理论。”如果你跟着卡尔·波普，

尔的教学，这种假设-演绎法(建立无效假设，然后进行检验)是科学的研究方法。

最基本的元素22。

问题2:进行了什么样的研究？

首先，确定这篇论文描述的是原创研究还是二手(或综合)研究。

。原研究报告第一手研究数据，二手研究总结第一手研究并从中吸取经验教训。

得出结论。医学期刊上发表的大部分研究都是原创性研究，通常可以分为以下三类。

。实验:在实验中，实验措施是在模拟和受控的环境中对动物或志愿者进行的。

ok；

。临床试验:在临床试验中，首先对一组患者进行干预措施，如药物治疗，

然后对这组患者进行随访，观察他们的情况；

。调查:在调查中，研究人员对一组病人、医务工作者或其他一些人进行抽样调查。

做些测试。

本文的第二个方框显示了用于描述研究设计的一些常用术语。

二手研究包括:

。审查，可分为:

(非系统性)综述:总结原研究；

系统综述:按照预先确定的、严格的方法对原研究进行总结；

汇总分析:综合一个以上研究的数据。

。指南:从最初的研究中得出临床医生应该如何操作的结论。

。决策分析:应用医务工作者和患者的原创研究成果，建立概率的树形结构。

临床治疗的选择24-26

。经济分析:利用原始研究的结果来确定某种处理措施在资源应用上是否合理。

。

用于描述临床研究设计特征的术语

组间平行比较——每组接受不同的治疗，两组同时开始研究；获得的结果

对两组进行比较分析。

配对比较-接受不同治疗的受试者被配对以平衡潜在的混杂因素，如年龄。

和性别；通过配对受试者之间的差异来分析结果。

受试者自身的比较——在治疗前后检查受试者，并将结果与研究进行比较

喜欢自己的变化被分析。

单盲-受试者不知道他们接受了什么样的治疗。

双盲-受试者不知道他们接受了什么样的治疗，研究人员也不知道。

交叉-每个受试者接受干预和控制治疗(以随机顺序)，在此期间，他们经常使用

未处理空白期分离

安慰剂对照——对照受试者接受安慰剂(无效药丸),它应该在外观和味道上

这和有效的药片是一样的。舒适(假)手术也可用于外科临床试验。

因子设计-这种研究可以根据预先确定的结果对一个以上的自变量产生影响(

无论是单独还是联合)。例如，2×2因子设计可以单独测试安慰剂

阿司匹林、单用链激酶或阿司匹林加链激酶在急性心脏病发作中的作用23

问题3:科研设计适合这个研究吗？

解释这个问题最好的方法是考虑这个研究涉及到哪个一般的科学研究领域。广阔的

大多数研究是关于下面方框中的一个或多个一般领域。

科学研究的一般领域

。治疗:检验药物、手术、其他医疗服务或其他干预措施的效果。

首选的研究设计是随机对照临床试验。

。诊断:确认一个新的诊断实验是否有效(我们能相信吗)和可靠(我们是

不，你每次都能得到相同的结果。首选的研究设计是横断面调查。在横断面调查中，

研究对象应采用新的测试方法和金标准方法进行检验。

。筛查:可用于大规模人群检查，在症状出现前发现疾病的一种检查方法。

价值。首选的研究设计是横断面调查。

。预后:确定早期发现某种疾病的患者可能会发生什么。首选研究设计

纵向排队研究

。病因学:确定一些假定的有害物质，如环境污染，是否与疾病的发生有关。成为首选

研究设计是队列研究或病例对照研究，取决于疾病的罕见性，但疾病

报告还可以提供关键信息。

随机对照临床试验

在随机对照临床试验中，参与者根据一个程序(类似于扔硬币)被随机分组

分配给干预组(如药物)或另一组(如安慰剂治疗或另一种不同的药物)。两组都是

特定时期的随访，并根据初步发现(死亡、心脏病发作、血清胆固醇

甾醇水平等。).总的来说，除了治疗措施，两组是一样的。因此，从

理论上，研究结果的任何差异都归因于治疗措施。

比较治疗组和对照组的一些临床试验不是随机试验。在这些试验中随机分配

这可能是不可能的、不现实的或不道德的——例如，将在家出生的婴儿与在医院出生的婴儿进行比较。

生活的结果。更常见的是，缺乏经验的研究人员将一个群体(如A病房的患者)与另一个群体进行比较。

组(如病房b中的患者)使用这种设计，不可能在统计水平上比较两组。

对它们进行合理的比较。

随机对照临床试验应用于回答以下问题:

。对于特定疾病，这种药物是否优于安慰剂或另一种药物？

。对于一个特定的疾病，宣传页能帮助患者做出比口头建议更好的治疗方案吗？

做出明智的选择

然而，应该记住，随机试验有一些缺点(见框图)。还应该记住的是，随机试验的结

结果由于排除标准(确定哪些患者不应进入研究)的原因，适用性存在一些限制

然后)偏向；纳入标准的偏倚(从不代表疾病的特定人群中选择受试者)

；拒绝对纳入研究的某些患者群体的知情同意28；只分析预定的

“客观的”最终结果可能会排除干预措施质量的重要方面；和出版偏差(

选择性发表积极成果的研究论文)29。

目前医学期刊报道随机对照临床试验推荐格式为30，如果你写的是这一面的话。

报纸应该尽力遵循它的要求。

随机对照临床试验设计

优势

。允许在一个精确选择的患者群体(如50 ~ 60岁的更年期妇女)中，进行单次变更。

量(如药物治疗和安慰剂效果比较)进行严格评价。

。前瞻性设计(来自研究开始后发生的病例的数据)

。通过假设-演绎推理(寻求否认，而不是证实自己的假设)

。通过比较具有相同基线指标的两组来消除潜在偏差(见下文)

。允许汇总分析(后期对多个类似临床试验的数字结果进行联合分析)

劣势

昂贵且耗时，因此在实践中:

。很多随机对照临床试验从来没有进行过，或者研究的患者太少，或者已经进行了研究。

调查时间太短

。绝大多数随机对照临床试验是由大型研究机构(大学或政府)或制药公司资助的。

最后，这些单位将决定研究时间表。

。频繁使用替代终点指标代替临床测量结果会导致“潜在偏差”，尤其是

。随机化并不理想(见上文)

。并非所有合格的患者都是随机分配的(临床医生只是在临床试验中让他们知道)

对于可能对干预反应良好的患者)

。数据评估人员没有对患者的随机状态进行盲目分析。

群组研究

在队列研究中，暴露于特定物质(如疫苗、药物或环境)

毒素)，选择两组(或多组)人，然后随访观察每组有多少人发生。

某种疾病或其他后果。队列研究中的随访时间通常为年(有时为10年)。

要算，因为很多疾病，尤其是癌症，都需要这么长的时间。值得注意的是，随机

对照临床试验通常从已经患有某种疾病的患者开始，但大多数队列研究都是这样

从实验对象开始，这些实验对象可能会生病，也可能不会生病。

有一种特殊类型的队列研究可以用来确定疾病的预后(有疾病的人可能会怎么样？

后果)。一组早期患者，他们被诊断患有某种疾病，或在筛查试验中呈阳性结节。

结果收集患者(初始队列)，然后重复随访，观察不同结果的发生率。

(每年都有新病例发生)和病程。

世界上最著名的队列研究是由奥斯丁·布拉德福德·希尔爵士和理查德·多尔爵士进行的。

以及后来的理查德·佩托。这项研究为前两位作者赢得了头衔。他们跟进了。

我们采访了40，000名英国医生，并将他们分为四个队列(不吸烟者、轻度吸烟者和中度吸烟者)

和重度吸烟者)，应用全因死亡率(任何死亡)和特定原因死亡率(某种疾病

造成的死亡)作为观察结果。在1964中发表的10的初步报告中表明，吸烟者不管他们的肺

癌症死亡率和全因死亡率都大大增加，并且存在“剂量反应”相关性(吸烟

越多，患肺癌的几率就越大。他们走了很长一段路，31，最后证明了吸烟与健康损害。

伤害的联系是病因性的，不是偶然的。这项重要研究在20和40年后的结果(对于那些

在1951年无死亡收集的受试者随访率达到了惊人的94)，这不仅表明吸烟

它还显示了从执行良好的队列研究中获得的证据的重要性32，3。

3。

应使用队列研究来回答以下临床问题:

。高血压会随着时间好转吗？

。早产儿将来的成长和学习成绩会怎么样？

病例对照研究

在病例对照研究中，确定患有特定疾病的患者，并与对照组(患有某些疾病的患者)进行比较

其他疾病患者、总人口、邻居或亲属)。然后收集过去接触过的某种

疾病的可能致病因素的信息(例如，通过查找这些人的病例记录，或让他们回忆起来)

病史)。像队列研究一样，病例对照研究通常研究疾病的原因(什么原因

病)，而不是疾病的治疗。病例对照研究在证据级别中排名较低(见下文)。

但这种设计往往是罕见病研究的唯一选择。在病例对照研究中，主要

难点和潜在偏差在于准确确定谁是“案例”，因为只要一个研究对象被错误分配，

这会严重影响结果。另外，这种设计在病例对照研究中不能显示因果关系-A和A。

不能因为b有关联就证明a导致了b。

应使用病例对照研究来回答以下临床问题:

。俯卧睡姿会增加婴儿猝死(婴儿猝死综合征)的风险吗？

。百日咳疫苗会导致脑损伤吗？

。架空线缆会导致白血病吗？

横断面调查

我们可能都被要求参加调查，甚至有人问我们最喜欢哪个品牌。

牙膏。流行病学家进行与此相同的调查:研究对象的代表性样本(或

患者)进行访问，通过检查或研究来获得特定临床问题的答案。在横断面研究中

在调查中，数据是在单一时间收集的，但过去的经历可以追溯，如研究。

调查以前的病例记录，以了解在过去5年中记录了多少次患者的血压。

应使用横断面调查来回答以下临床问题:

。3岁孩子的“正常”身高是多少？

。精神科护士对重度抑郁症患者使用电休克治疗有多大信心？

。一半的糖尿病患者没有确诊是真的吗？

个案报告

病例报告以故事的形式描述了单个患者的病史:“B夫人是一个54岁的秘密。

书，她在6月份开始有胸痛1995...".案例报告通常被合并成一个案例系列。

在病例系列中，描述了患有某种疾病的多个患者的病史，以说明该疾病。

在某一方面，疾病的治疗，或目前更普遍的，解释治疗的不良反应。尽管

传统上，这种类型的研究提供的证据是“快速和模糊的”，但病例报告可以极大地传播。

临床试验或研究中可能丢失的信息量34，35。

一个值得纪念的案例报告

一个医生在他的医院观察到两个新生儿缺肢(海豹肢畸形)。这两位母亲

父母在怀孕早期服用了一种新药(沙利度胺)。医生希望尽快提醒大家。

注意这种药物引起损害的可能性。

证据等级

在对临床干预措施进行决策时，应根据不同类型原创研究的相对权重进行决策。

标准符号(“证据等级”)可以按照以下顺序安排这些研究36:

(1)系统回顾和总结分析

(2)有明确结果的随机对照临床试验(置信区间和临床显著效应的阈值)

不重叠)

(3)没有明确结果的随机对照临床试验(估计有临床显著效果，但可信)

性间隔与临床显著影响的阈值重叠)

(4)排队研究

(5)病例对照研究

(6)横断面调查

(7)案例报告