【医学论文写作技巧】医学论文中这两个重要表格，你是不是一直误解了？

发表日期 2026-04-13 11:33:25 91

此前，在一篇题为《信不信？在临床研究中，OR值也够咱喝一壶的》的文章里，我们分享了斯坦福大学普外科Jeff Choi教授撰写的一篇统计方法学文章。但由于篇幅有限，那篇文章未能完整呈现其内容，今天我们继续深入探讨。

在医学研究论文里，“研究人群基线特征表（Table 1）”和“多因素回归分析结果表（Table 2）”是读者理解研究设计与结论的关键要素。

不过，Jeff Choi教授指出，研究人员在这两个表格的呈现与解读方面，普遍存在一些长期以来的误区，这些误区很可能会导致对研究结果的错误判断。

一、关于Table 1的误区

Table 1属于统计描述内容，研究人员希望借助这个表格，向读者展示研究人群的基本特征，像年龄、性别、教育状况、基础疾病等信息。

在论文中展示“Table 1”主要有两个目的：
其一，通过“Table 1”，让读者了解研究人群的具体情况，并评估研究结果能否推广到其他人群。
其二，利用“Table 1”初步观察不同研究组别之间是否存在显著的基线差异。若存在基线差异，就意味着可能出现了混杂偏倚，这种偏倚会严重歪曲分组与结局之间的真实关系，甚至可能得出相反或错误的结论。

那么，“Table 1”的主要误区究竟是什么呢？
Jeff Choi教授认为，常见的误区是在“Table 1”中报告组间假设检验的p值，并依据p值来判断基线资料在组间是否均衡。

这看起来不太合理，不禁让人产生疑问：为什么会这样呢？
Jeff Choi教授给出了如下解释：

“Table 1”作为统计描述结果的表格，仅用于统计描述，无需进行假设检验。因为这里的假设检验既无法用于因果推断，也不能判断“混杂因素”，没有实际意义。
“Table 1”不能用于因果推断，这比较容易理解。但为什么不能用来判断“混杂因素”呢？
这是因为p值并不能说明是否均衡。p > 0.05只能表明：“根据现有样本，没有足够证据来拒绝原假设（例如H0：总体中两组糖尿病患病率相等）”。它只是不能拒绝原假设，并不意味着两组患者在糖尿病史上一定均衡。

例如，如果干预组糖尿病患病率为20%，对照组为15%，可能由于样本量较小，导致p > 0.05。若忽视这个差异，这5%的差异完全有可能在后续分析中造成混杂偏倚。

这与“不能在多因素回归分析前用p值筛选变量”的道理是一样的。

那我们该如何处理呢？
在Table 1中放弃假设检验，摒弃p值，让Table 1仅发挥统计描述的作用。依据专业或相关前期研究证据，审视这些基线数据差异的临床意义，结合临床知识判断其是否足以引入偏倚，并考虑在后续分析中对其进行统计调整（如倾向评分匹配PSM、多因素回归等）。

值得注意的是，这并非作者个人观点，该观点已被《加强流行病学观察性研究报告规范》（STROBE）指南推荐。不良帅认为，这个观点非常合理，很有可能成为临床研究中的普遍共识。

二、关于Table 2的误区

Table 2是展示多因素回归分析结果的表格，目的是探究结局变量与自变量之间的关系。

Jeff Choi教授认为，Table 2的主要误区在于：研究者常常把表格中所有变量对应的效应量估计值（如OR、HR等）都解释为“该变量对结局的独立影响”，这种做法不太合理，尤其是对“混杂变量”的结果解释。

大家都知道，在回归模型中，自变量一般包括“暴露变量”和“混杂变量”。
“暴露变量”是我们重点关注的变量，目的是探索它们与“结局变量”之间的真实关系。
而“混杂变量”是用于控制偏倚的变量，只有控制了混杂偏倚，才能发现“暴露变量”和“结局变量”之间的真实关系。

Jeff Choi教授认为，我们只能估计“暴露变量”对“结局变量”的影响，无法推断“混杂变量”对“结局变量”的作用。

具体原因有两点：

我们的“混杂变量”都是为“暴露变量”挑选的。控制了“暴露变量”的“混杂变量”，才能得到暴露变量的真实效应。然而，我们并未为这些混杂变量去选择并调整它们各自的混杂变量。
因此，混杂变量的系数估计可能仍受其残余混杂的影响，并非真实效应的可靠估计。
“混杂变量”是指“既对暴露变量有影响，又对结局变量有影响的因素”。所以，实际上“暴露变量”可能是“混杂变量”与“结局变量”之间的一个中介变量。
而调整“暴露变量”后，“混杂变量”通过“暴露变量”介导的效应会从模型中剥离出去，其效应估计值会被严重低估，并非真实效应。

我们应该怎么做呢？
在进行回归分析前，一定要严格区分“暴露变量”和“混杂变量”；
在解释结果时，要重点关注“暴露变量”的结果，说明在调整了哪些“混杂变量”的影响后其效应如何（包括估计值和置信区间）。
正确看待“混杂变量”，不过度解读其统计学意义。它们的主要价值在于“是否合理地调整了系统性偏倚”，不必过分苛求其本身的效应大小。

不良帅认为，Jeff Choi教授对“Table 2”常见误区的批评很有道理。
我感觉这个观点其实借鉴了计量经济学的传统，经济学领域的学者在其论文中对“因变量、解释变量和控制变量”的区分一直都非常清晰。
不仅如此，近年来医学统计中越来越提倡的“敏感性分析”“工具变量”“双重差分”“断点回归”以及“因果推断理论”等内容，一直都是实证经济学家的拿手好戏。
很高兴看到这种跨学科的借鉴与融合，它正不断推动着医学建模研究朝着更精细、更科学的方向发展。