Kolmogorov-Smirnov 检验主要用来做什么？

用于比较样本分布与理论分布是否一致，或比较两个样本分布是否有差异，常用于正态性检验。

Kolmogorov-Smirnov 检验的 p 值怎么判断？

通常当 p value > 0.1 时，可认为数据服从正态分布；若低于阈值，则提示可能不服从正态分布。

什么时候应该考虑用 Kolmogorov-Smirnov 检验？

当你需要判断连续变量是否符合某种分布，尤其是在决定使用参数检验还是非参数检验前。

Kolmogorov-Smirnov检验：4步精准应用指南

作者：Dr.Lin

2026-05-13｜原创

引言Introduction

在做统计分析前，很多人会先问：我的数据到底适不适合用参数检验？ 这一步常被忽略，却直接影响 t 检验、方差分析等后续结果的可靠性。** Kolmogorov-Smirnov 检验**就是常用的正态性判断工具之一，尤其适合需要快速筛查分布差异的场景。

医学统计分析场景，屏幕上显示Prism或统计软件中的正态性检验结果，旁边有数据分布曲线和p值标注。

1. 先理解 Kolmogorov-Smirnov 检验是什么

1.1 它解决的核心问题

Kolmogorov-Smirnov 检验 ，简称 K-S 检验，本质上是比较样本分布与理论分布，或者比较两个样本分布是否存在差异。它属于假设检验的一种，判断逻辑很直接。先设定原假设，再看样本数据是否支持这个假设。

在医学科研里，它最常见的用途是做正态性检验 。也就是说，先判断数据是否接近正态分布，再决定后续该用参数检验还是非参数检验。这个步骤非常关键，因为方法选错，p 值的解释就可能不稳妥。

1.2 它和其他检验的关系

在统计学中，假设检验的选择取决于数据分布和研究设计。若已知均值和方差，可构造标准正态分布。若均值已知但方差未知，可用 t 检验思路。若均值、方差都不知，则还可能涉及卡方检验或 F 检验。

Kolmogorov-Smirnov 检验 常用于分布比较。知识库中也指出，在 GraphPad Prism 的正态性检测里，常用方法包括 Shapiro-Wilk 检验和 K-S 检验。两者在多数情况下结论一致，但小样本更常优先参考 Shapiro-Wilk 检验，大样本常见 K-S 检验更有参考价值 。

1.3 读懂结果前先明确一个原则

判断逻辑不是“p 值小就一定错”，而是看是否能拒绝原假设。对正态性检验来说，常见判断是：当 p value > 0.1 时，可认为数据服从正态分布 。也有人用 0.05 作为阈值，但在医学科研中，更重要的是统一全文标准，避免前后不一致。

如果数据不能满足正态分布假设，就应考虑非参数检验。 这比盲目套用 t 检验更稳妥。

2. 什么时候该用 Kolmogorov-Smirnov 检验

2.1 适合用于分布判断的场景

Kolmogorov-Smirnov 检验 最适合用于你想判断“样本是否符合某种分布”时。比如，实验组和对照组的连续变量是否近似正态，或者两个样本分布是否一致。对于医学生、医生和科研人员来说，这通常发生在数据分析前期。

如果你的数据是连续变量，比如评分、表达量、浓度、测量值，就可以先做正态性检验。常见分析目标包括：

两组独立样本比较。
多组连续变量比较。
统计建模前的数据分布检查。
结果展示前的分布判断。

2.2 什么时候不能只靠它

Kolmogorov-Smirnov 检验不是万能的。 它只是帮助你判断分布是否偏离理论分布，并不能替代研究设计判断，也不能替代临床意义解释。比如，两组数据即使统计学上差异不显著，也不代表没有生物学差异。

另外，知识库提醒，若数据集无法作出必要的分布假设，就应使用非参数检验。也就是说，K-S 检验的意义在于帮助你决定方法，而不是替你直接得出结论。

2.3 和小样本、大样本的关系

在 Prism 的实践里，常见经验是：小样本时 Shapiro-Wilk 更常被优先采用，大样本时 K-S 检验更常用。 这里没有绝对统一的分界，但“先看样本量，再决定参考哪种检验”是更稳妥的做法。

对科研写作来说，最重要的是在方法学部分写清楚：

检验名称。
判定阈值。
后续采用的统计方法。

这样读者和审稿人才能判断你的流程是否规范。

3. 4步完成 Kolmogorov-Smirnov 检验

3.1 第一步：先确认数据类型

做 Kolmogorov-Smirnov 检验 之前，先确认数据是连续变量，而不是分类资料。知识库明确指出，卡方检验更适用于分类资料；而正态性判断通常针对连续型数据。

同时要先明确研究设计：

独立样本还是配对样本。
单组分布判断还是两组分布比较。
之后要做参数检验还是非参数检验。

这一步决定你后面的分析路线。路线不清，结果就容易混乱。

3.2 第二步：在 Prism 中进入正态性检验

知识库给出的 Prism 操作是：点击 Analyze 按钮，调出数据分析窗口，然后选择正态检验。接着再选择要检验的数据、要检验的分布和检验方法。

在实际操作中，Kolmogorov-Smirnov 检验 通常作为可选方法之一。你需要根据数据特点和样本量决定是否采用它。若你正在处理一维连续变量，且目的是判断是否符合正态分布，这一步就很典型。

3.3 第三步：查看 p 值并解释结果

结果出来后，重点看 p 值。知识库中给出的常用判断标准是：p value > 0.1 时，通常认为数据服从正态分布。 这代表样本没有显示出明显偏离理论分布的证据。

如果 p 值低于阈值，就提示数据可能不服从正态分布。此时，后续更适合考虑非参数检验，而不是强行用参数检验。

你可以这样理解：

p 值高，不能拒绝原假设。
p 值低，拒绝原假设。
正态性不成立时，先调整统计方法，再解释结果。

3.4 第四步：把检验结果接到后续分析上

Kolmogorov-Smirnov 检验的真正价值，不在于单独出一个 p 值，而在于指导后续方法选择。 如果数据近似正态，可进入 t 检验或方差分析流程。如果不满足正态分布，通常应转入非参数检验。

知识库中的示例也提到，非配对、非参数情形下，常见的是 Mann-Whitney U 检验。若是两组独立样本且不符合正态分布，就不应直接套用独立样本 t 检验。

这就是完整的分析闭环。先检验分布，再选方法，再解释结果。

4. 医学科研中如何正确用它

4.1 先判断是参数检验还是非参数检验

Kolmogorov-Smirnov 检验 常用于进入统计分析前的“分流”。如果数据近似正态，且方差条件也满足，可以考虑参数检验。如果数据明显偏离正态分布，则更适合非参数方法。

这也是为什么在医学论文中，方法学部分常写得很细。因为统计方法的选择，决定了结果的可信度。尤其是临床研究、基础实验和转化研究，数据分布往往并不理想，不能想当然处理。

4.2 结果报告要写清楚三件事

建议你在论文或汇报中明确写出：

使用了哪种正态性检验。
采用了什么阈值。
根据结果选择了什么后续检验。

例如，可写成：“连续变量先进行 Kolmogorov-Smirnov 检验，p value > 0.1 视为符合正态分布，随后根据数据分布选择参数或非参数检验。”

这种写法简洁、规范，也符合 E-E-A-T 对方法透明度的要求。

4.3 常见误区要避开

很多初学者会犯三个错误：

只看一个 p 值，不看样本量。
不做分布检验，直接上 t 检验。
正态性不满足，却仍按参数检验解释。

这些问题看似小，实际会影响整篇文章的统计可信度。对于医学生和科研人员来说，统计不是“做完就行”，而是要能经得起复核。

统计流程越清楚，论文越稳。

4.4 用对工具，能明显减少返工

如果你在做图、做统计、写论文时总反复修改分析方法，问题往往不在软件，而在前期判断。Kolmogorov-Smirnov 检验 的作用，就是帮你尽早发现分布问题，避免后面整套结果推倒重来。

像解螺旋这类面向科研写作与数据分析的工具和支持体系，价值就在于把这一步前置。它能帮助你更快完成统计判断、方法选择和结果整理，减少无效试错，把时间留给真正重要的研究解释和论文打磨。

总结Conclusion

Kolmogorov-Smirnov 检验 的核心价值，是帮助你在正式分析前判断数据分布是否合理。它不是终点，而是统计流程的起点。对医学科研而言，先做分布判断，再决定用参数检验还是非参数检验，才是更规范的路径。

如果你正在写论文、做实验结果分析，建议把正态性检验作为固定步骤纳入流程。需要更系统的统计方法支持时，也可以结合解螺旋的科研写作与数据分析服务，减少方法误用，提高结果表达的专业度。

科研人员在电脑前整理统计流程图，旁边展示“正态性检验-选择检验方法-结果报告”的三步流程示意图。