Bonferroni检验适合什么时候用？

适合三组及以上的事后两两比较、非参数多组比较后分析，以及需要严格控制一类错误的验证性研究。

Bonferroni校正怎么判断显著性？

把总体α值除以比较次数，或用P值乘以比较次数；以校正后的P值判断是否显著。

Bonferroni检验的7个核心要点

Q: Bonferroni检验是什么？

Bonferroni检验是一种多重比较校正方法，用于降低多次检验带来的假阳性风险。

作者：Dr.Chuang

2026-05-18｜原创

Bonferroni检验的7个核心要点

引言Introduction

多组比较时，最容易犯的错是把“显著”看成“可靠”。Bonferroni 检验 的价值，就在于帮你控制多重比较带来的假阳性，避免把偶然差异误判为真实差异。对医学生、医生和科研人员来说，这一步很关键。
多组临床数据比较场景，叠加“多重比较校正”“假阳性控制”“P值调整”示意图

1.Bonferroni检验是什么

1.1 核心定义

Bonferroni 检验本质上是一种多重比较校正方法。 它不是单独的一种“新检验”，而是对原有检验水准进行调整。

在组间比较时，如果做了很多次检验，总体I型错误率会升高。Bonferroni 的思路很直接。把总体α分摊到每一次比较中。 例如总体α=0.05，如果进行了3次比较，则每次检验水准变为0.0167。

1.2 适用场景

Bonferroni 检验适用于几乎所有多重比较场景。包括组间例数相等或不等，成对两两比较，或更复杂的比较。

它特别适合这些情况：

三组及以上样本均数比较后的事后分析。
多组非参数检验后的两两比较。
需要严格控制假阳性的验证性研究。
有明确比较次数的研究设计。

当研究目标是“宁可保守，也不要误报”时，Bonferroni 检验很合适。

2.Bonferroni检验为什么重要

2.1 解决多重比较导致的假阳性

单次检验把α设为0.05，意味着有5%的概率出现假阳性。若比较次数增加，累计错误率会快速上升。

例如比较3组数据时，如果直接做两两 t 检验，共3次比较。若不校正，整体误报风险会高于0.05。Bonferroni 检验的核心任务，就是把总体错误率拉回可控范围。

2.2 与方差分析的关系

单因素方差分析只能告诉你“总体上至少有一组不同”，不能直接告诉你哪两组不同。此时需要事后多重比较。

常见流程是：

先做单因素方差分析。
若总体差异有统计学意义，再做 Bonferroni 检验。
判断具体差异来源。

这也是临床统计中最常见的使用路径之一。

3.Bonferroni检验的计算逻辑

3.1 两种常见表达

Bonferroni 校正有两种等价表达方式。

方法一，校正检验水准：α’=α/n。
方法二，校正P值：P’=P×n。

其中 n 为比较次数。校正后P值再与0.05比较。

3.2 临床例子

若进行3组均数的两两比较，共3次检验。按照 Bonferroni 校正：

α’=0.05/3=0.0167。

也就是说，只有当某一组间比较的P值小于0.0167时，才可认为差异有统计学意义。

这比直接用0.05更严格。

3.3 优点与代价

Bonferroni 检验的优点是简单、通用、稳妥。缺点也很明确。比较次数越多，阈值越小，越容易漏掉真实差异。

所以它的统计学特征是：

假阳性更少。
假阴性风险更高。
适合比较次数不太多的场景。

4.Bonferroni检验和其他方法怎么选

4.1 与LSD、SNK、Tukey、Scheffe的差别

在多重比较方法里，Bonferroni 通常比 LSD 更保守。LSD 灵敏度高，但更容易出现假阳性。Bonferroni 更适合需要稳健结论的研究。

和其他方法相比：

Tukey ：适合组间例数相同的成对比较。
Scheffe ：更保守，适合例数不等和复杂比较。
SNK ：控制错误的方式相对折中。
Bonferroni ：用途最广，适应性强。

4.2 什么时候优先用Bonferroni

建议优先考虑 Bonferroni 的情形包括：

比较次数较少。
研究设计偏验证性。
需要严格控制一类错误。
希望结果更容易被临床和审稿接受。

如果你面对的是“先有明确假设，再做比较”的研究，Bonferroni 检验往往更稳。

5.Bonferroni检验在参数与非参数分析中的位置

5.1 参数分析中的应用

在单因素方差分析之后，Bonferroni 检验常用于事后两两比较。前提是数据满足正态性和方差齐性，或者研究者采用相应的稳健策略。

这种情况下，它帮助研究者回答一个关键问题：到底是哪两组之间有差异。

5.2 非参数分析中的应用

对于多组非正态数据，常先做 Kruskal-Wallis H 检验。若总体差异有统计学意义，再进行两两比较。此时也可采用 Bonferroni 校正。

在秩和检验的多重比较中，Bonferroni 依然是常用方法。 它的作用不是改变检验类型，而是控制多次比较的总体错误率。

5.3 研究设计提示

如果你的结局变量呈严重偏态，或存在明显极端值，应先考虑非参数方法，再结合 Bonferroni 校正。这样结果更稳健，也更符合数据分布特征。

6.Bonferroni检验的局限性

6.1 过于保守

Bonferroni 检验最常见的批评，就是“太保守”。当比较次数很多时，校正后的阈值会非常小。

例如比较10次时，α’=0.005。此时即使总体F检验显著，很多两两比较也可能无法达到显著性。这不是数据一定没有差异，而是方法变严格了。

6.2 适合的不是“最多比较”，而是“合适比较”

Bonferroni 检验并不适合无限制地增加比较次数。比较越多，功效越低。对于大量假设同时检验的场景，往往需要更专门的多重校正策略。

因此，使用时要先问自己两个问题：

比较次数有多少？
研究目标是探索性还是验证性？

如果比较很多，还要强行用 Bonferroni，可能会把真实信号“校正掉”。

7.Bonferroni检验的实操要点

7.1 统计分析前先判断研究类型

先明确变量类型和数据分布。

定量资料，考虑t检验、方差分析或非参数检验。
多组比较时，先看是否需要多重校正。
若是成对比较，直接考虑 Bonferroni 调整。

7.2 报告结果时要写清楚

写论文时，不要只写“有差异”。建议报告以下信息：

原始检验方法。
比较次数。
校正方法。
校正后P值。
具体差异组别。

例如可以写成：采用 Bonferroni 校正后，A组与B组差异仍有统计学意义。

7.3 SPSS和论文写法

在统计软件中，Bonferroni 常作为事后比较选项出现。输出结果中，重点看校正后P值，而不是原始P值。

论文中建议统一写法：

“采用 Bonferroni 法进行多重比较校正。”
“校正后P<0.05，差异有统计学意义。”
“校正后P≥0.05，差异无统计学意义。”

判断标准必须用校正后的结果。

结尾Conclusion

Bonferroni 检验的核心，不是“让结果更显著”，而是让结果更可信 。它通过控制多重比较中的总体I型错误率，帮助你在多组比较中更稳健地识别真实差异。对于临床研究、论文写作和统计分析来说，这是一种非常实用的方法。

如果你希望在论文、课题和数据分析中少走弯路，可以借助解螺旋 的统计与科研支持工具，快速完成多重比较思路梳理、结果解读和规范表达。把复杂统计交给专业工具，把时间留给真正的科研问题。
科研人员查看统计结果报告，画面包含Bonferroni校正后P值、论文表格和临床研究数据分析界面

Bonferroni检验的7个核心要点

Bonferroni检验的7个核心要点

引言Introduction

1.Bonferroni检验是什么

1.1 核心定义

1.2 适用场景

2.Bonferroni检验为什么重要

2.1 解决多重比较导致的假阳性

2.2 与方差分析的关系

3.Bonferroni检验的计算逻辑

3.1 两种常见表达

3.2 临床例子

3.3 优点与代价

4.Bonferroni检验和其他方法怎么选

4.1 与LSD、SNK、Tukey、Scheffe的差别

4.2 什么时候优先用Bonferroni

5.Bonferroni检验在参数与非参数分析中的位置

5.1 参数分析中的应用

5.2 非参数分析中的应用

5.3 研究设计提示

6.Bonferroni检验的局限性

6.1 过于保守

6.2 适合的不是“最多比较”，而是“合适比较”

7.Bonferroni检验的实操要点

7.1 统计分析前先判断研究类型

7.2 报告结果时要写清楚

7.3 SPSS和论文写法

结尾Conclusion

推荐文章

方差分析结果解读：1张表读懂P值与F值？

方差分析适用条件全解析：7个关键检查点

SNK检验结果如何解读？6个专业技巧

LSD检验结果怎么看？4个常见误区