引言Introduction
D’Agostino-Pearson 检验 常被用于判断连续变量是否近似正态分布,但很多医学生和科研人员卡在两个点上:什么时候该用,和检验后该怎么选统计方法。选错检验,后面的t检验、秩和检验、卡方检验都可能失准。
1. 什么是 D’Agostino-Pearson 检验
1.1 核心作用
D’Agostino-Pearson 检验本质上是正态性检验。 它通过同时考察偏度和峰度,判断一组连续数据是否符合正态分布。相比只看直方图或单独看偏度,它更适合做统计前的客观判断。
在临床研究中,很多连续变量都要先过这一关,比如年龄、血压、实验室指标、评分数据。若结果提示不服从正态分布,后续就不能默认使用参数检验。
1.2 适用场景
它主要用于连续型数据 。通常在样本量不太小、希望对分布形态做正式检验时使用。
如果数据明显偏态、存在极端值,或者样本量很小,单靠该检验不够,还应结合图形判断。
常见做法是同步查看:
- 直方图
- Q-Q图
- 偏度和峰度
- 正态性检验结果
结论要点是,D’Agostino-Pearson 检验不是替代图形判断,而是和图形一起用。
2. D’Agostino-Pearson检验怎么用
2.1 先明确你的数据类型
使用 D’Agostino-Pearson 检验 前,先确认数据是连续变量,而不是分类变量。
它不适用于二分类、无序多分类和有序多分类资料。
例如:
- 适合:血糖、BMI、胆固醇、住院天数
- 不适合:是否吸烟、病种类别、分级结局
这一步很关键。很多错误不是检验本身错,而是数据类型选错。
2.2 看P值,决定是否近似正态
D’Agostino-Pearson 检验的原假设通常是“数据服从正态分布”。
当 P > 0.05 时,通常认为没有证据拒绝正态性。
当 P ≤ 0.05 时,提示数据偏离正态分布。
但要注意,P值不是“绝对真理” 。样本量很大时,轻微偏离也可能显著;样本量很小时,真实偏离也可能检不出来。
所以临床研究里更稳妥的做法,是把统计检验和图形一起判断。
2.3 根据结果选择后续统计方法
如果 D’Agostino-Pearson 检验 提示正态分布,通常可以考虑:
- 两组比较,用独立样本 t 检验
- 配对资料,用配对 t 检验
- 多组比较,用方差分析
如果提示非正态分布,则更适合:
- 两组比较,用 Mann-Whitney U 检验
- 配对资料,用 Wilcoxon 符号秩检验
- 多组比较,用 Kruskal-Wallis 检验
真正的价值不在“检验正态”本身,而在于帮助你选对后续统计方法。
3. 4类数据对应什么检验
3.1 连续变量且服从正态分布
这是最常见的第一类。
如果连续变量通过 D’Agostino-Pearson 检验 ,且图形也支持正态,优先使用参数检验。
常用方法包括:
- 两组独立样本 t 检验
- 配对 t 检验
- 单因素方差分析
这类方法效率高,前提是分布假设基本成立。
3.2 连续变量但不服从正态分布
如果 D’Agostino-Pearson 检验 提示非正态,就不要直接套 t 检验。
更稳妥的是用非参数检验,报告中位数和四分位数更合适。
常用方法包括:
- 两独立样本的秩和检验
- 配对样本的符号秩检验
- 多组比较的秩和检验
这类数据在临床中很常见,比如住院天数、炎症指标、部分评分数据。
3.3 二分类资料
二分类资料只有两种结果,比如阳性和阴性、死亡和存活、有效和无效。
D’Agostino-Pearson 检验不用于这类数据。
这类数据通常使用:
- 卡方检验
- Fisher 精确检验
- 必要时计算率差、相对危险度或比值比
也就是说,连续变量看正态,分类变量看频数结构,不能混用。
3.4 无序多分类和有序多分类资料
无序多分类资料,比如血型、病理类型、手术方式分类。
有序多分类资料,比如轻、中、重分级。
这两类都不适合用 D’Agostino-Pearson 检验 。
常见方法包括:
- 无序多分类:卡方检验、Fisher 精确检验
- 有序多分类:趋势卡方检验、秩和检验,或有序分类回归
记住一句话,D’Agostino-Pearson 检验只服务于连续变量的正态性判断。
4. 实际使用中的常见误区
4.1 只看P值,不看图形
很多人拿到 D’Agostino-Pearson 检验 结果后,只盯着 P 值。
这不够。因为数据分布是否合理,还要看直方图和Q-Q图。
尤其在以下情况更要谨慎:
- 样本量很大
- 存在明显离群值
- 数据高度偏斜
- 数据有上下限截断
4.2 把“非正态”直接等同于“不能分析”
这也是常见误区。
非正态并不意味着数据不能做统计分析。
它只是提示你要换方法,比如改用非参数检验,或在合适情况下做变量转换。
4.3 忽视数据分组后的分布变化
同一个变量,在总体上可能近似正态。
分组后却可能变得偏态。
因此在做组间比较时,最好检查每组的分布,而不是只看总样本。
这一步尤其适合临床论文写作。因为组内分布直接影响方法选择,也影响结果解释。
5. 论文里怎么写更规范
5.1 方法部分
方法部分可以简洁写明:
- 使用 D’Agostino-Pearson 检验 进行正态性检验
- 正态分布资料以均数和标准差表示
- 非正态分布资料以中位数和四分位数表示
- 根据分布选择t检验或非参数检验
这样写符合常见医学论文规范,也方便审稿人快速判断统计策略是否合理。
5.2 结果部分
结果部分建议把分布判断和描述统计对应起来。
例如,正态数据写“均数±标准差”,非正态数据写“中位数,四分位数间距”。
不要混用表达方式。
统计方法与数据分布要一一对应,这是提升论文可信度的基础。
5.3 图表部分
表格中最好明确标注:
- 检验方法
- P值
- 数据表达方式
- 组间比较结论
如果有必要,也可补充直方图或Q-Q图,让数据分布更直观。
这对科研汇报和论文答辩都很有帮助。
总结Conclusion
D’Agostino-Pearson 检验的核心用途,是判断连续变量是否近似正态分布。
它适合服务于统计决策,但不能脱离数据类型单独使用。面对4类数据,连续正态用参数检验,连续非正态用非参数检验,二分类和多分类资料则应回到卡方、Fisher或秩和等方法。
如果你想系统掌握临床统计方法,少走选错检验的弯路,可以关注解螺旋 。它能帮你把数据类型、分布判断和检验方法快速对应起来,提升论文写作和科研分析效率。
- 引言Introduction
- 1. 什么是 D'Agostino-Pearson 检验
- 2. D'Agostino-Pearson检验怎么用
- 3. 4类数据对应什么检验
- 4. 实际使用中的常见误区
- 5. 论文里怎么写更规范
- 总结Conclusion






