企业信誉 常见问题 期刊大全
期刊
投稿邮箱

mlunwen@163.com

服务热线

18516839603

【医学论文写作技巧】医学论文中这两个重要表格,你是不是一直误解了?

发表日期 2026-04-13 11:33:25    91

此前,在一篇题为《信不信?在临床研究中,OR值也够咱喝一壶的》的文章里,我们分享了斯坦福大学普外科Jeff Choi教授撰写的一篇统计方法学文章。但由于篇幅有限,那篇文章未能完整呈现其内容,今天我们继续深入探讨。

在医学研究论文里,“研究人群基线特征表(Table 1)”和“多因素回归分析结果表(Table 2)”是读者理解研究设计与结论的关键要素。

不过,Jeff Choi教授指出,研究人员在这两个表格的呈现与解读方面,普遍存在一些长期以来的误区,这些误区很可能会导致对研究结果的错误判断。

【医学论文写作技巧】医学论文中这两个重要表格,你是不是一直误解了?

一、关于Table 1的误区

Table 1属于统计描述内容,研究人员希望借助这个表格,向读者展示研究人群的基本特征,像年龄、性别、教育状况、基础疾病等信息。

在论文中展示“Table 1”主要有两个目的:
其一,通过“Table 1”,让读者了解研究人群的具体情况,并评估研究结果能否推广到其他人群。
其二,利用“Table 1”初步观察不同研究组别之间是否存在显著的基线差异。若存在基线差异,就意味着可能出现了混杂偏倚,这种偏倚会严重歪曲分组与结局之间的真实关系,甚至可能得出相反或错误的结论。

那么,“Table 1”的主要误区究竟是什么呢?
Jeff Choi教授认为,常见的误区是在“Table 1”中报告组间假设检验的p值,并依据p值来判断基线资料在组间是否均衡。

这看起来不太合理,不禁让人产生疑问:为什么会这样呢?
Jeff Choi教授给出了如下解释:

  1. “Table 1”作为统计描述结果的表格,仅用于统计描述,无需进行假设检验。因为这里的假设检验既无法用于因果推断,也不能判断“混杂因素”,没有实际意义。

  2. “Table 1”不能用于因果推断,这比较容易理解。但为什么不能用来判断“混杂因素”呢?
    这是因为p值并不能说明是否均衡。p > 0.05只能表明:“根据现有样本,没有足够证据来拒绝原假设(例如H0:总体中两组糖尿病患病率相等)”。它只是不能拒绝原假设,并不意味着两组患者在糖尿病史上一定均衡。

例如,如果干预组糖尿病患病率为20%,对照组为15%,可能由于样本量较小,导致p > 0.05。若忽视这个差异,这5%的差异完全有可能在后续分析中造成混杂偏倚。

这与“不能在多因素回归分析前用p值筛选变量”的道理是一样的。

那我们该如何处理呢?
在Table 1中放弃假设检验,摒弃p值,让Table 1仅发挥统计描述的作用。依据专业或相关前期研究证据,审视这些基线数据差异的临床意义,结合临床知识判断其是否足以引入偏倚,并考虑在后续分析中对其进行统计调整(如倾向评分匹配PSM、多因素回归等)。

值得注意的是,这并非作者个人观点,该观点已被《加强流行病学观察性研究报告规范》(STROBE)指南推荐。不良帅认为,这个观点非常合理,很有可能成为临床研究中的普遍共识。

二、关于Table 2的误区

Table 2是展示多因素回归分析结果的表格,目的是探究结局变量与自变量之间的关系。

Jeff Choi教授认为,Table 2的主要误区在于:研究者常常把表格中所有变量对应的效应量估计值(如OR、HR等)都解释为“该变量对结局的独立影响”,这种做法不太合理,尤其是对“混杂变量”的结果解释。

大家都知道,在回归模型中,自变量一般包括“暴露变量”和“混杂变量”。
“暴露变量”是我们重点关注的变量,目的是探索它们与“结局变量”之间的真实关系。
而“混杂变量”是用于控制偏倚的变量,只有控制了混杂偏倚,才能发现“暴露变量”和“结局变量”之间的真实关系。

Jeff Choi教授认为,我们只能估计“暴露变量”对“结局变量”的影响,无法推断“混杂变量”对“结局变量”的作用。

具体原因有两点:

  1. 我们的“混杂变量”都是为“暴露变量”挑选的。控制了“暴露变量”的“混杂变量”,才能得到暴露变量的真实效应。然而,我们并未为这些混杂变量去选择并调整它们各自的混杂变量。
    因此,混杂变量的系数估计可能仍受其残余混杂的影响,并非真实效应的可靠估计。

  2. “混杂变量”是指“既对暴露变量有影响,又对结局变量有影响的因素”。所以,实际上“暴露变量”可能是“混杂变量”与“结局变量”之间的一个中介变量。
    而调整“暴露变量”后,“混杂变量”通过“暴露变量”介导的效应会从模型中剥离出去,其效应估计值会被严重低估,并非真实效应。

我们应该怎么做呢?
在进行回归分析前,一定要严格区分“暴露变量”和“混杂变量”;
在解释结果时,要重点关注“暴露变量”的结果,说明在调整了哪些“混杂变量”的影响后其效应如何(包括估计值和置信区间)。
正确看待“混杂变量”,不过度解读其统计学意义。它们的主要价值在于“是否合理地调整了系统性偏倚”,不必过分苛求其本身的效应大小。

不良帅认为,Jeff Choi教授对“Table 2”常见误区的批评很有道理。
我感觉这个观点其实借鉴了计量经济学的传统,经济学领域的学者在其论文中对“因变量、解释变量和控制变量”的区分一直都非常清晰。
不仅如此,近年来医学统计中越来越提倡的“敏感性分析”“工具变量”“双重差分”“断点回归”以及“因果推断理论”等内容,一直都是实证经济学家的拿手好戏。
很高兴看到这种跨学科的借鉴与融合,它正不断推动着医学建模研究朝着更精细、更科学的方向发展。