IQR四分位距法适合哪些数据？

IQR四分位距法更适合非正态分布、偏态分布或存在异常值的连续数据。

均值和IQR四分位距法有什么区别？

均值反映总体平均水平，适合近似正态数据；IQR用中位数和四分位距描述中间50%数据，更稳健，不易受极端值影响。

临床研究中什么时候应该用中位数[IQR]？

当数据明显偏态、正态性检验不通过，或存在较多异常值时，通常应使用中位数[IQR]进行描述。

IQR四分位距法真的优于均值法吗？

作者：Dr.Lin

2026-05-22｜原创

引言Introduction

IQR四分位距法真的优于均值法吗？ 这是医学生、医生和科研人员在处理连续型数据时最常遇到的问题。尤其当数据偏态、存在异常值时，均值很容易“被拉偏”，而IQR四分位距法更能反映真实分布。

医学统计场景配图，展示一组偏态分布数据、箱式图和均值被异常值拉高的对比示意图

1. 先回答核心问题：两者不是竞争关系，而是适用条件不同

1.1 均值法适合什么数据

均值是最常见的集中趋势指标。它的优点是直观，计算简单，适合近似正态分布 的连续资料。

在正态分布中，数据围绕中心对称，均值、中位数、众数大致重合。此时，均值能够较好代表“大多数人的水平”。例如BMI、血压、实验室指标在样本量足够、分布较平稳时，均值±标准差仍然是标准写法。

关键点是，均值对极端值非常敏感。 一旦少数高值或低值出现，均值就会被明显拉动，导致它不再代表多数人的真实位置。

1.2 IQR四分位距法适合什么数据

IQR四分位距法主要用于非正态分布、偏态分布 的数据描述。它用中位数表示集中趋势，用四分位距表示离散趋势。

IQR的计算很直接。

Q1：第25百分位数。
Q3：第75百分位数。
IQR = Q3 - Q1。

这套方法的优势是稳健。它不容易被极端值影响。 对于工资、住院天数、某些炎症指标、病毒载量等常见偏态数据，IQR四分位距法往往比均值更接近临床直觉。

1.3 所谓“优于”，本质上是“更匹配”

如果数据正态，均值法通常更合适。
如果数据偏态，IQR四分位距法通常更合适。

所以，IQR四分位距法并不是在所有场景都优于均值法。 它的优势来自“适配非正态数据”。这也是统计描述最基本的原则。

2. 为什么非正态数据更需要IQR四分位距法

2.1 均值会被极端值拉动

可以把偏态数据想成工资分布。少数高收入者会把均值明显抬高，但大多数人并没有那么高的收入。

同样的逻辑也适用于临床数据。比如一组住院时间数据里，少数超长住院病例会显著抬高均值，但这并不代表典型患者的住院天数。此时均值看起来“正确”，实际却不够代表性。

2.2 中位数和IQR更能反映“多数人”

中位数是排序后位于中间的值。它代表50%的样本在其上方，50%在其下方。
IQR则描述中间50%数据的离散程度。

这意味着，IQR四分位距法关注的是“主体数据段”，而不是少数极端值。 这对临床研究尤其重要，因为研究者通常更关心典型患者，而不是被少数异常点主导的平均水平。

2.3 箱式图与IQR四分位距法是一体的

IQR不仅用于描述，还常用于异常值识别。箱式图中，箱体对应Q1到Q3，中线是中位数。常用的异常值判定思路是：

下界 = Q1 - 1.5 × IQR
上界 = Q3 + 1.5 × IQR

落在界外的数据常被视为异常值候选。
这也是为什么在临床数据整理中，IQR四分位距法比单纯均值更实用 。它既能描述分布，又能辅助发现异常值。

3. 在临床研究中，什么时候该用IQR四分位距法

3.1 先判断分布，再决定写法

规范流程不是先想用均值还是IQR，而是先判断数据是否符合正态分布。

常见做法包括：

看直方图。
看正态性检验。
结合样本量与图形判断。

在SPSS中，常见参考是Shapiro-Wilk检验。一般来说，P > 0.05 可视为无显著偏离正态分布的证据。 若样本较小，图形判断尤其重要。

3.2 这些数据常常更适合IQR四分位距法

以下类型的连续资料，临床上更容易出现偏态：

住院天数。
费用数据。
病毒载量。
某些生化指标。
带上限或下限的实验数据。

这些变量常常不是“对称钟形”，而是长尾分布。此时如果仍写成均值±标准差，容易让读者误判数据中心。

3.3 分组比较时也要保持一致

如果一组数据用中位数和IQR表示，另一组却用均值和标准差表示，会让表格逻辑混乱。

原则是同类数据同一写法。
如果研究对象整体为非正态分布，表格、正文和图形都应统一采用中位数[IQR]格式。这样更符合论文规范，也更利于审稿人与读者理解。

4. IQR四分位距法并不是万能的，它也有局限

4.1 IQR不能直接替代所有分析

IQR四分位距法擅长描述分布，但它不是所有统计分析的替代品。
它告诉你“数据中间50%在哪里”，却不回答组间差异是否显著。

如果要比较两组非正态连续变量，通常还要结合非参数检验，如秩和检验。
如果要做多因素分析，也需要进一步选择合适模型。

4.2 IQR对分布形态的解释有限

IQR能反映离散程度，但不能像标准差那样体现整体波动特征。
两个数据集可能有相同的IQR，但尾部形态完全不同。

所以，IQR四分位距法更适合“稳健描述”，不适合替代完整的分布分析。 在科研写作中，最理想的做法是先看图，再看检验，再决定描述方式。

4.3 过度依赖单一指标会误导读者

只看均值，可能忽略偏态。
只看IQR，也可能忽略尾部信息。

真正专业的做法，是根据数据分布选择指标，并在必要时同时报告最小值、最大值、范围或百分位数。这样信息更完整，也更符合E-E-A-T中的专业性要求。

5. 临床研究中如何规范使用IQR四分位距法

5.1 推荐的判断步骤

可按以下顺序处理：

先看直方图。
再做正态性检验。
若明显非正态，采用中位数和IQR。
必要时补充最小值、最大值。
组间比较时选用对应的非参数方法。

这个流程简单，但非常实用。
它能减少统计描述错误，也能提升论文可读性。

5.2 写作中的标准表达方式

非正态连续资料常写为：

中位数（Q1，Q3）
或中位数[IQR]

例如，住院天数可写成“7（4，10）天”。
这比“8.2±3.6天”更能反映偏态数据的真实位置。

5.3 什么时候可以同时报告均值和IQR

如果数据分布边界不明显，或者编辑部、导师、审稿人希望更全面呈现，可以同时给出均值±标准差和中位数[IQR]。但前提是不要混淆统计推断逻辑。

描述可以多样，但分析必须有依据。
这是科研写作中最容易忽略的一点。

总结Conclusion

IQR四分位距法并不是绝对优于均值法，而是在非正态分布、偏态分布和存在异常值时更合适 。均值适合近似正态数据，IQR更适合反映中间50%样本的真实位置。对于医学生、医生和科研人员来说，关键不是选“更高级”的方法，而是选“更匹配”的方法。

如果你正在整理临床研究数据，建议先判断分布，再决定是用均值±标准差，还是用中位数[IQR]。想让数据描述更规范、表格更像高质量论文，可以借助解螺旋 的科研写作与数据处理支持，把复杂统计结果整理成更适合发表的标准表达。

临床论文表格与箱式图配图，展示均值±标准差与中位数[IQR]两种写法的对比