引言Introduction

很多医学生和科研人员都遇到过同一个问题。拿到一组连续变量后,先做什么检验,才能决定后续用t检验还是非参数检验?Shapiro-Wilk 检验 正是常用答案之一。它能帮助你判断样本是否近似服从正态分布,从而减少方法选错的风险。

SPSS统计分析界面与正态分布曲线示意图,旁边标注Shapiro-Wilk检验、Q-Q图、直方图等关键词

1. 为什么正态性判断是统计分析的第一步

1.1 先判断分布,再选方法

在临床研究中,很多常见分析都依赖正态性前提。比如单样本t检验、独立样本t检验、配对样本t检验和方差分析,都要求样本数据来自的总体服从或近似服从正态分布。如果不先做正态性判断,后续推断可能直接失真。

从研究流程看,这一步并不复杂。你只需要先确认变量类型,再判断分布形态。若数据近似正态,通常可以用均值和标准差描述,并进入参数检验。若明显偏离正态,则更适合使用中位数和四分位数,或转入非参数检验。

1.2 Shapiro-Wilk 检验的定位

正态性检验大体分为两类。
一类是图示法,包括直方图、Q-Q图、P-P图和茎叶图。
另一类是假设检验法,包括Shapiro-Wilk 检验 、KS检验、偏度峰度检验和Pearson卡方检验等。

其中,Shapiro-Wilk 检验 是临床研究中最常用的方法之一。知识库中明确指出,它属于非参数检验,原假设是“样本来自的总体与正态分布没有显著差异”。当P值大于0.05时,通常不拒绝原假设,可认为数据服从正态分布。SPSS中一般将样本量≤5000时优先使用它。

1.3 为什么它比“肉眼判断”更稳妥

图示法直观,但主观性较强。同一张图,有人会觉得正态,有人会觉得不够正态。Shapiro-Wilk 检验的价值,在于把这种主观判断转为可重复的统计判断。

不过也要注意,没有任何方法是绝对的。样本量很小时,检验力可能不足。样本量很大时,轻微偏离也可能出现显著结果。因此,最佳实践通常是“图示法+Shapiro-Wilk 检验”结合判断,而不是只看单一P值。

2. Shapiro-Wilk 检验如何判断正态性

2.1 第一步,明确原假设和判读规则

做任何正态性检验,第一步都是先理解假设。
原假设H0:样本来自的总体与正态分布没有显著差异。
备择假设则相反,认为总体分布偏离正态。

判断规则很清晰。

  • P > 0.05,不拒绝H0,可认为近似正态。
  • P ≤ 0.05,拒绝H0,提示数据偏离正态。

这套规则适合绝大多数基础统计场景。对临床论文写作也足够实用。你在结果部分可直接写成“Shapiro-Wilk检验显示,数据符合正态分布”或“数据不符合正态分布”,但最好同时报告具体P值。

2.2 第二步,结合样本量选择检验方法

知识库明确给出一个关键标准。

  • Shapiro-Wilk 检验,适用于样本量较小的情况,SPSS中通常指≤5000。
  • KS检验更适用于样本量较大的情况,SPSS中通常指>5000。

这意味着,Shapiro-Wilk 检验不是“所有场景都唯一正确”,而是“在中小样本中更常用、更敏感”。尤其是临床研究中常见的小样本、单中心数据,它通常是首选。

如果你的数据只有10例、20例,甚至100例,Shapiro-Wilk 检验都很适合。若样本量超过5000,再结合KS检验和图示法一起看,会更稳妥。

2.3 第三步,读懂P值和图形证据

只看P值不够,最好同时看图。知识库提到,正态分布时,直方图通常呈现中间高、两边低 的钟形形态;P-P图和Q-Q图上的点应接近45度直线。

因此,判断可以分三层:

  1. Shapiro-Wilk 检验P值。
    这是最直接的统计证据。

  2. 直方图形态。
    看是否大致钟形。

  3. Q-Q图或P-P图。
    看散点是否贴近对角线。

如果三者一致,结论最稳。若结果不一致,优先结合样本量、研究背景和变量分布特征综合判断。

3. 3步完成 Shapiro-Wilk 检验实操与结果解读

3.1 第一步,进入SPSS探索分析

按照知识库中的SPSS流程,正态性检验可通过“分析”进入。具体路径是:
分析 -> 描述统计 -> 探索。

在探索对话框中,把需要检验的变量放入因变量列表。然后点击“图”,勾选直方图、茎叶图和“含检验的正态图”。这样输出后,你不仅能得到Shapiro-Wilk 检验 结果,还能得到直方图、茎叶图和Q-Q图。

这个步骤的意义很大。因为它不是只给你一个P值,而是给你完整的分布证据链。对科研写作来说,这比单独输出一个检验结果更有说服力。

3.2 第二步,先看图,再看检验表

知识库中的案例是某组10名牙周病患者治疗前后牙龈沟液ALP差值。结果显示,直方图在加入分布曲线后呈现中间高、两边低的形态,茎叶图也显示中间频数较高。P-P图和Q-Q图中,各点都分布在对角线附近。

这类结果说明什么?
说明Shapiro-Wilk 检验 的统计结果和图形结果相互支持,数据可认为服从正态分布。

在实际论文里,你可以这样理解:

  • 图形支持正态;
  • 检验P值大于0.05;
  • 因此后续可以考虑参数检验。

这一步的核心,不是“图好看不好看”,而是“图和P值是否一致”。

3.3 第三步,按结果决定后续统计方法

一旦完成 Shapiro-Wilk 检验 ,下一步就是选方法。

如果数据近似正态,通常可以使用:

  • 单样本t检验
  • 独立样本t检验
  • 配对样本t检验
  • 方差分析

如果数据不服从正态,则要考虑:

  • 中位数和四分位数描述
  • 非参数检验
  • 必要时进行数据转换后再分析

这里要强调一点。Shapiro-Wilk 检验不是研究终点,而是方法选择的入口。
它的真正价值,是避免你在分布不满足条件时仍然硬上参数检验。

4. 常见误区与论文写作建议

4.1 误区一,只看P值,不看图

有些人做完 Shapiro-Wilk 检验 后,只盯着一个P值。这样不够稳妥。因为样本量较大时,轻微偏离也可能导致P值显著;样本量较小时,检验力又可能偏弱。

所以更推荐的做法是:

  • 先看直方图是否大致钟形;
  • 再看Q-Q图是否贴线;
  • 最后结合Shapiro-Wilk检验P值下结论。

4.2 误区二,把0.05当成绝对边界

0.05是常用阈值,但不是自然法则。临床研究里,统计显著不等于临床显著。尤其在边界值附近,最好不要机械化地“卡线判断”。

更合适的做法是:

  • 报告准确P值;
  • 说明样本量;
  • 结合分布图综合解释;
  • 必要时在方法学部分说明采用的判定标准。

4.3 写进论文时怎么表达

结果部分可参考这样的表述:

  • Shapiro-Wilk 检验显示该变量符合正态分布,P > 0.05。
  • Shapiro-Wilk 检验提示该变量偏离正态分布,P ≤ 0.05。
  • 结合直方图和Q-Q图,该变量可近似视为正态分布。

方法部分可以写:

  • “采用Shapiro-Wilk检验评估连续变量的正态性,P>0.05视为符合正态分布。”

这种写法简洁、规范,也更符合医学论文的表达习惯。

4.4 研究者最该记住的一点

Shapiro-Wilk 检验的目标,不是证明数据“完美正态”,而是判断是否“近似正态”,从而支持后续统计分析。
临床数据很少是教科书式正态。你真正需要的是一个足够可靠、可解释、可发表的判断过程。

总结Conclusion

Shapiro-Wilk 检验是判断正态性的核心工具之一。 它的逻辑很简单:先设定原假设,再看P值是否大于0.05,并结合直方图、Q-Q图综合判断。对于样本量较小或中等的临床数据,它尤其实用。

如果你正在做课题、写论文,或为SPSS结果选择合适的统计方法,建议把“图示法+Shapiro-Wilk 检验”作为标准流程。这样更稳,也更符合科研规范。

医学科研人员在电脑前查看SPSS输出结果,画面包含Shapiro-Wilk检验表、直方图和Q-Q图,强调统计分析流程规范化

如果你希望把正态性检验、t检验、非参数检验等统计步骤做得更规范,可以进一步了解解螺旋 的临床研究与数据统计内容。它能帮助你更高效地完成从数据判断到方法选择的全流程,减少统计误用,提高论文质量。