引言Introduction

D’Agostino-Pearson 检验 常被用于判断连续变量是否近似正态分布,但很多医学生和科研人员卡在两个点上:什么时候该用,和检验后该怎么选统计方法。选错检验,后面的t检验、秩和检验、卡方检验都可能失准。临床统计流程图,展示连续变量与分类变量在不同分布下对应的检验选择路径,强调正态性判断的重要性。

1. 什么是 D’Agostino-Pearson 检验

1.1 核心作用

D’Agostino-Pearson 检验本质上是正态性检验。 它通过同时考察偏度和峰度,判断一组连续数据是否符合正态分布。相比只看直方图或单独看偏度,它更适合做统计前的客观判断。

在临床研究中,很多连续变量都要先过这一关,比如年龄、血压、实验室指标、评分数据。若结果提示不服从正态分布,后续就不能默认使用参数检验。

1.2 适用场景

它主要用于连续型数据 。通常在样本量不太小、希望对分布形态做正式检验时使用。
如果数据明显偏态、存在极端值,或者样本量很小,单靠该检验不够,还应结合图形判断。

常见做法是同步查看:

  • 直方图
  • Q-Q图
  • 偏度和峰度
  • 正态性检验结果

结论要点是,D’Agostino-Pearson 检验不是替代图形判断,而是和图形一起用。

2. D’Agostino-Pearson检验怎么用

2.1 先明确你的数据类型

使用 D’Agostino-Pearson 检验 前,先确认数据是连续变量,而不是分类变量。
它不适用于二分类、无序多分类和有序多分类资料。

例如:

  • 适合:血糖、BMI、胆固醇、住院天数
  • 不适合:是否吸烟、病种类别、分级结局

这一步很关键。很多错误不是检验本身错,而是数据类型选错。

2.2 看P值,决定是否近似正态

D’Agostino-Pearson 检验的原假设通常是“数据服从正态分布”。
当 P > 0.05 时,通常认为没有证据拒绝正态性。
当 P ≤ 0.05 时,提示数据偏离正态分布。

但要注意,P值不是“绝对真理” 。样本量很大时,轻微偏离也可能显著;样本量很小时,真实偏离也可能检不出来。
所以临床研究里更稳妥的做法,是把统计检验和图形一起判断。

2.3 根据结果选择后续统计方法

如果 D’Agostino-Pearson 检验 提示正态分布,通常可以考虑:

  • 两组比较,用独立样本 t 检验
  • 配对资料,用配对 t 检验
  • 多组比较,用方差分析

如果提示非正态分布,则更适合:

  • 两组比较,用 Mann-Whitney U 检验
  • 配对资料,用 Wilcoxon 符号秩检验
  • 多组比较,用 Kruskal-Wallis 检验

真正的价值不在“检验正态”本身,而在于帮助你选对后续统计方法。

3. 4类数据对应什么检验

3.1 连续变量且服从正态分布

这是最常见的第一类。
如果连续变量通过 D’Agostino-Pearson 检验 ,且图形也支持正态,优先使用参数检验。

常用方法包括:

  • 两组独立样本 t 检验
  • 配对 t 检验
  • 单因素方差分析

这类方法效率高,前提是分布假设基本成立。

3.2 连续变量但不服从正态分布

如果 D’Agostino-Pearson 检验 提示非正态,就不要直接套 t 检验。
更稳妥的是用非参数检验,报告中位数和四分位数更合适。

常用方法包括:

  • 两独立样本的秩和检验
  • 配对样本的符号秩检验
  • 多组比较的秩和检验

这类数据在临床中很常见,比如住院天数、炎症指标、部分评分数据。

3.3 二分类资料

二分类资料只有两种结果,比如阳性和阴性、死亡和存活、有效和无效。
D’Agostino-Pearson 检验不用于这类数据。

这类数据通常使用:

  • 卡方检验
  • Fisher 精确检验
  • 必要时计算率差、相对危险度或比值比

也就是说,连续变量看正态,分类变量看频数结构,不能混用。

3.4 无序多分类和有序多分类资料

无序多分类资料,比如血型、病理类型、手术方式分类。
有序多分类资料,比如轻、中、重分级。
这两类都不适合用 D’Agostino-Pearson 检验

常见方法包括:

  • 无序多分类:卡方检验、Fisher 精确检验
  • 有序多分类:趋势卡方检验、秩和检验,或有序分类回归

记住一句话,D’Agostino-Pearson 检验只服务于连续变量的正态性判断。

4. 实际使用中的常见误区

4.1 只看P值,不看图形

很多人拿到 D’Agostino-Pearson 检验 结果后,只盯着 P 值。
这不够。因为数据分布是否合理,还要看直方图和Q-Q图。

尤其在以下情况更要谨慎:

  • 样本量很大
  • 存在明显离群值
  • 数据高度偏斜
  • 数据有上下限截断

4.2 把“非正态”直接等同于“不能分析”

这也是常见误区。
非正态并不意味着数据不能做统计分析。
它只是提示你要换方法,比如改用非参数检验,或在合适情况下做变量转换。

4.3 忽视数据分组后的分布变化

同一个变量,在总体上可能近似正态。
分组后却可能变得偏态。
因此在做组间比较时,最好检查每组的分布,而不是只看总样本。

这一步尤其适合临床论文写作。因为组内分布直接影响方法选择,也影响结果解释。

5. 论文里怎么写更规范

5.1 方法部分

方法部分可以简洁写明:

  • 使用 D’Agostino-Pearson 检验 进行正态性检验
  • 正态分布资料以均数和标准差表示
  • 非正态分布资料以中位数和四分位数表示
  • 根据分布选择t检验或非参数检验

这样写符合常见医学论文规范,也方便审稿人快速判断统计策略是否合理。

5.2 结果部分

结果部分建议把分布判断和描述统计对应起来。
例如,正态数据写“均数±标准差”,非正态数据写“中位数,四分位数间距”。
不要混用表达方式。

统计方法与数据分布要一一对应,这是提升论文可信度的基础。

5.3 图表部分

表格中最好明确标注:

  • 检验方法
  • P值
  • 数据表达方式
  • 组间比较结论

如果有必要,也可补充直方图或Q-Q图,让数据分布更直观。
这对科研汇报和论文答辩都很有帮助。

总结Conclusion

D’Agostino-Pearson 检验的核心用途,是判断连续变量是否近似正态分布。
它适合服务于统计决策,但不能脱离数据类型单独使用。面对4类数据,连续正态用参数检验,连续非正态用非参数检验,二分类和多分类资料则应回到卡方、Fisher或秩和等方法。

如果你想系统掌握临床统计方法,少走选错检验的弯路,可以关注解螺旋 。它能帮你把数据类型、分布判断和检验方法快速对应起来,提升论文写作和科研分析效率。医学科研统计决策总览图,展示连续变量正态与非正态、二分类、无序多分类、有序多分类对应的检验方法。