Shapiro-Wilk检验主要用来做什么？

用于判断连续变量是否近似服从正态分布，从而决定后续是否适合做参数检验。

Shapiro-Wilk检验的P值怎么解读？

P>0.05通常认为数据近似正态；P≤0.05则提示数据偏离正态分布。

样本量多大时适合用Shapiro-Wilk检验？

一般适用于样本量较小或中等的情况，SPSS中通常建议样本量≤5000时优先使用。

Shapiro-Wilk 检验如何判断正态性？3步解析

作者：Dr.Lin

2026-05-13｜原创

引言Introduction

很多医学生和科研人员都遇到过同一个问题。拿到一组连续变量后，先做什么检验，才能决定后续用t检验还是非参数检验？Shapiro-Wilk 检验 正是常用答案之一。它能帮助你判断样本是否近似服从正态分布，从而减少方法选错的风险。

SPSS统计分析界面与正态分布曲线示意图，旁边标注Shapiro-Wilk检验、Q-Q图、直方图等关键词

1. 为什么正态性判断是统计分析的第一步

1.1 先判断分布，再选方法

在临床研究中，很多常见分析都依赖正态性前提。比如单样本t检验、独立样本t检验、配对样本t检验和方差分析，都要求样本数据来自的总体服从或近似服从正态分布。如果不先做正态性判断，后续推断可能直接失真。

从研究流程看，这一步并不复杂。你只需要先确认变量类型，再判断分布形态。若数据近似正态，通常可以用均值和标准差描述，并进入参数检验。若明显偏离正态，则更适合使用中位数和四分位数，或转入非参数检验。

1.2 Shapiro-Wilk 检验的定位

正态性检验大体分为两类。
一类是图示法，包括直方图、Q-Q图、P-P图和茎叶图。
另一类是假设检验法，包括Shapiro-Wilk 检验 、KS检验、偏度峰度检验和Pearson卡方检验等。

其中，Shapiro-Wilk 检验 是临床研究中最常用的方法之一。知识库中明确指出，它属于非参数检验，原假设是“样本来自的总体与正态分布没有显著差异”。当P值大于0.05时，通常不拒绝原假设，可认为数据服从正态分布。SPSS中一般将样本量≤5000时优先使用它。

1.3 为什么它比“肉眼判断”更稳妥

图示法直观，但主观性较强。同一张图，有人会觉得正态，有人会觉得不够正态。Shapiro-Wilk 检验的价值，在于把这种主观判断转为可重复的统计判断。

不过也要注意，没有任何方法是绝对的。样本量很小时，检验力可能不足。样本量很大时，轻微偏离也可能出现显著结果。因此，最佳实践通常是“图示法+Shapiro-Wilk 检验”结合判断，而不是只看单一P值。

2. Shapiro-Wilk 检验如何判断正态性

2.1 第一步，明确原假设和判读规则

做任何正态性检验，第一步都是先理解假设。
原假设H0：样本来自的总体与正态分布没有显著差异。
备择假设则相反，认为总体分布偏离正态。

判断规则很清晰。

P > 0.05，不拒绝H0，可认为近似正态。
P ≤ 0.05，拒绝H0，提示数据偏离正态。

这套规则适合绝大多数基础统计场景。对临床论文写作也足够实用。你在结果部分可直接写成“Shapiro-Wilk检验显示，数据符合正态分布”或“数据不符合正态分布”，但最好同时报告具体P值。

2.2 第二步，结合样本量选择检验方法

知识库明确给出一个关键标准。

Shapiro-Wilk 检验，适用于样本量较小的情况，SPSS中通常指≤5000。
KS检验更适用于样本量较大的情况，SPSS中通常指>5000。

这意味着，Shapiro-Wilk 检验不是“所有场景都唯一正确”，而是“在中小样本中更常用、更敏感”。尤其是临床研究中常见的小样本、单中心数据，它通常是首选。

如果你的数据只有10例、20例，甚至100例，Shapiro-Wilk 检验都很适合。若样本量超过5000，再结合KS检验和图示法一起看，会更稳妥。

2.3 第三步，读懂P值和图形证据

只看P值不够，最好同时看图。知识库提到，正态分布时，直方图通常呈现中间高、两边低 的钟形形态；P-P图和Q-Q图上的点应接近45度直线。

因此，判断可以分三层：

Shapiro-Wilk 检验P值。
这是最直接的统计证据。
直方图形态。
看是否大致钟形。
Q-Q图或P-P图。
看散点是否贴近对角线。

如果三者一致，结论最稳。若结果不一致，优先结合样本量、研究背景和变量分布特征综合判断。

3. 3步完成 Shapiro-Wilk 检验实操与结果解读

3.1 第一步，进入SPSS探索分析

按照知识库中的SPSS流程，正态性检验可通过“分析”进入。具体路径是：
分析 -> 描述统计 -> 探索。

在探索对话框中，把需要检验的变量放入因变量列表。然后点击“图”，勾选直方图、茎叶图和“含检验的正态图”。这样输出后，你不仅能得到Shapiro-Wilk 检验 结果，还能得到直方图、茎叶图和Q-Q图。

这个步骤的意义很大。因为它不是只给你一个P值，而是给你完整的分布证据链。对科研写作来说，这比单独输出一个检验结果更有说服力。

3.2 第二步，先看图，再看检验表

知识库中的案例是某组10名牙周病患者治疗前后牙龈沟液ALP差值。结果显示，直方图在加入分布曲线后呈现中间高、两边低的形态，茎叶图也显示中间频数较高。P-P图和Q-Q图中，各点都分布在对角线附近。

这类结果说明什么？
说明Shapiro-Wilk 检验 的统计结果和图形结果相互支持，数据可认为服从正态分布。

在实际论文里，你可以这样理解：

图形支持正态；
检验P值大于0.05；
因此后续可以考虑参数检验。

这一步的核心，不是“图好看不好看”，而是“图和P值是否一致”。

3.3 第三步，按结果决定后续统计方法

一旦完成 Shapiro-Wilk 检验 ，下一步就是选方法。

如果数据近似正态，通常可以使用：

单样本t检验
独立样本t检验
配对样本t检验
方差分析

如果数据不服从正态，则要考虑：

中位数和四分位数描述
非参数检验
必要时进行数据转换后再分析

这里要强调一点。Shapiro-Wilk 检验不是研究终点，而是方法选择的入口。
它的真正价值，是避免你在分布不满足条件时仍然硬上参数检验。

4. 常见误区与论文写作建议

4.1 误区一，只看P值，不看图

有些人做完 Shapiro-Wilk 检验 后，只盯着一个P值。这样不够稳妥。因为样本量较大时，轻微偏离也可能导致P值显著；样本量较小时，检验力又可能偏弱。

所以更推荐的做法是：

先看直方图是否大致钟形；
再看Q-Q图是否贴线；
最后结合Shapiro-Wilk检验P值下结论。

4.2 误区二，把0.05当成绝对边界

0.05是常用阈值，但不是自然法则。临床研究里，统计显著不等于临床显著。尤其在边界值附近，最好不要机械化地“卡线判断”。

更合适的做法是：

报告准确P值；
说明样本量；
结合分布图综合解释；
必要时在方法学部分说明采用的判定标准。

4.3 写进论文时怎么表达

结果部分可参考这样的表述：

Shapiro-Wilk 检验显示该变量符合正态分布，P > 0.05。
Shapiro-Wilk 检验提示该变量偏离正态分布，P ≤ 0.05。
结合直方图和Q-Q图，该变量可近似视为正态分布。

方法部分可以写：

“采用Shapiro-Wilk检验评估连续变量的正态性，P>0.05视为符合正态分布。”

这种写法简洁、规范，也更符合医学论文的表达习惯。

4.4 研究者最该记住的一点

Shapiro-Wilk 检验的目标，不是证明数据“完美正态”，而是判断是否“近似正态”，从而支持后续统计分析。
临床数据很少是教科书式正态。你真正需要的是一个足够可靠、可解释、可发表的判断过程。

总结Conclusion

Shapiro-Wilk 检验是判断正态性的核心工具之一。 它的逻辑很简单：先设定原假设，再看P值是否大于0.05，并结合直方图、Q-Q图综合判断。对于样本量较小或中等的临床数据，它尤其实用。

如果你正在做课题、写论文，或为SPSS结果选择合适的统计方法，建议把“图示法+Shapiro-Wilk 检验”作为标准流程。这样更稳，也更符合科研规范。

医学科研人员在电脑前查看SPSS输出结果，画面包含Shapiro-Wilk检验表、直方图和Q-Q图，强调统计分析流程规范化

如果你希望把正态性检验、t检验、非参数检验等统计步骤做得更规范，可以进一步了解解螺旋 的临床研究与数据统计内容。它能帮助你更高效地完成从数据判断到方法选择的全流程，减少统计误用，提高论文质量。