卡方检验适用于什么类型的数据？

主要适用于分类资料或计数资料，用于比较不同组别的率、构成比或分布是否有差异。

卡方检验的期望频数怎么计算？

期望频数 = 行合计 × 列合计 ÷ 总例数。

什么时候不能用卡方检验？

当理论频数过小（如超过20%的格子<5，或至少1个格子<1）时，应优先考虑Fisher精确概率法。

卡方检验计算公式是什么？3个核心要点

Q: 什么时候不能用卡方检验？

当理论频数过小（如超过20%的格子<5，或至少1个格子<1）时，应优先考虑Fisher精确概率法。

作者：Dr.Chuang

2026-05-18｜原创

引言Introduction

卡方检验计算公式是临床统计中最常见、也最容易混淆的公式之一。很多医学生和科研人员知道要做卡方检验，却不清楚什么时候用、怎么算、结果怎么判读。如果样本是分类资料，且你想比较组间率或构成比差异，就必须先搞懂卡方检验计算公式。
临床科研场景下的统计分析界面，旁边展示分类变量交叉表和卡方检验结果，突出“公式、P值、期望频数”三个关键词

1. 卡方检验计算公式的核心原理

1.1 先理解“实际频数”和“期望频数”

卡方检验计算公式的本质，不是单纯算一个数，而是比较实际频数 和期望频数 的偏离程度。实际频数，就是你在数据表里真正观察到的人数。期望频数，是在原假设成立时，理论上应该出现的人数。

卡方值越大，说明实际值和理论值偏离越明显。 偏离越大，P值通常越小。也就是说，差异越可能有统计学意义。

这也是卡方检验适用于分类资料的原因。它不看均值，不看正态分布，而是看“人数分布”是否符合原假设。

1.2 Pearson卡方检验公式

最常用的卡方检验计算公式是 Pearson χ² 公式：

χ² = Σ (O - E)² / E

其中：

O = 实际频数
E = 期望频数
Σ = 对所有单元格求和

这个公式适用于列联表资料。比如 2×2 表、R×C 表，都是在这个基础上计算。临床研究中最常见的是比较两组或多组分类结局的差异。

1.3 期望频数怎么求

期望频数不是凭空来的。它按列联表的边际分布计算：

E = 行合计 × 列合计 / 总例数

这是理解卡方检验计算公式的关键一步。很多人会算 χ²，但不会算 E，最后就无法判断方法是否适用。

比如总样本量是 102，A组35个有效，B组20个有效，C组7个有效。你先算每一格的理论人数，再把每格的差值代入公式，最终得到总 χ² 值。

2. 卡方检验计算公式在临床研究中的应用场景

2.1 适合什么类型的数据

卡方检验计算公式主要用于计数资料 。常见场景包括：

疗效是否有差异
吸烟与肺癌是否相关
不同药物有效率是否不同
某分类结局在不同组之间的分布是否一致

自变量通常是分组因素，因变量通常是二分类或多分类结局。
这类问题的核心，都是比较“率”或“构成比”是否有差异。

2.2 2×2表和R×C表的区别

当行列都为2时，就是2×2四格表。它是卡方检验最基础的形式。
当分组有3个或更多水平时，就变成R×C卡方检验。

例如，某研究比较A、B、C三种药物的有效率。
这时不是普通的2×2卡方检验，而是R×C卡方检验 。
卡方检验计算公式本身不变，变化的是表格维度和自由度。

2.3 真实案例的解读思路

以三种药物有效率比较为例，样本量共102例，A药40例有效35例，B药30例有效20例，C药32例有效7例。
软件输出的 Pearson χ² = 32.736，P < 0.001。

这个结果说明：

三组总体有效率存在差异
但不能直接说明哪两组之间有差异
如果要进一步比较，需要做两两比较，并进行多重校正

所以，卡方检验计算公式回答的是“总体是否有差异”，不是“差异来自哪一组”。

3. 卡方检验计算公式使用时最容易忽略的3个要点

3.1 先判断适用条件

很多人一上来就套公式，这是错误的。
在使用卡方检验计算公式前，先看样本是否满足条件：

总样本量通常要求 n ≥ 40
所有理论频数一般应 ≥ 5
如果超过20%的理论频数 < 5，或至少1个理论频数 < 1，应考虑 Fisher 精确概率法

这是临床统计中非常重要的底线。
不满足条件时，卡方检验结果可能不可靠。

3.2 自由度不能忽略

卡方值算出来后，还要结合自由度判断P值。
自由度的计算公式是：

df = (R - 1) × (C - 1)

例如 2×2 表，自由度为1。
如果是3×2表，自由度就是2。

卡方值本身没有临床意义，必须结合自由度和P值一起解释。
这也是很多初学者最容易漏掉的地方。

3.3 不要把P=0写进论文

SPSS有时显示 P = 0，这并不代表真实概率等于0。
只是因为数值太小，软件保留到小数点后三位后显示为0。

论文中更规范的写法是：

P < 0.001

这个细节虽然小，但很影响论文的规范性。
对医学生和科研人员来说，统计结果写法必须准确。

4. 卡方检验结果怎么快速判读

4.1 先看期望频数，再看卡方值

判读顺序建议固定为：

看样本量是否足够
看最小期望频数是否达标
看是否需要 Fisher 精确概率法
再看 Pearson χ² 和P值

不要只盯着P值。
因为方法选错了，P值再小也没有意义。

4.2 论文中常见表述方式

结果部分可以写成：

“Pearson卡方检验显示，三组有效率差异有统计学意义，χ²=32.736，P<0.001。”
“两组吸烟率差异有统计学意义，χ²=5.556，P=0.018。”

这种写法简洁、规范，也符合医学论文习惯。

4.3 为什么卡方检验特别适合临床科研

临床研究里，很多变量都是分类数据。
比如性别、是否吸烟、是否有效、是否死亡、是否复发。
这些数据都能直接用列联表分析。

卡方检验计算公式的价值，在于它把“人数差异”转化为可检验的统计证据。
这对回顾性研究、病例对照研究、疗效比较研究都非常实用。

总结Conclusion

卡方检验计算公式的核心，可以概括为3点。第一，公式本质是比较实际频数和期望频数的偏离。第二，它主要用于分类资料的组间比较。第三，使用前必须检查样本量和理论频数条件，不能机械套用。

如果你正在写论文、做SPSS分析，或者准备临床统计考试，先把卡方检验计算公式和适用条件掌握牢，比死记结果更重要。
在实际科研中，规范的数据整理、正确的表格选择和准确的结果解释，往往比单纯会算公式更关键。

如果你想系统提升临床统计分析能力，也可以关注解螺旋 的课程与科研工具支持。它能帮助你更高效地完成统计方法选择、结果解读和论文写作，减少常见低级错误。
医学论文写作与统计分析结合的桌面场景，包含SPSS输出、论文表格和临床科研书籍，突出“规范分析、结果解读、科研提效”