卡方检验适合什么类型的数据？

卡方检验主要用于分类资料的组间比较，如率、构成比或有效/无效等分类结局。

什么时候不能用Pearson卡方检验？

当期望频数过小、超过20%的单元格期望频数小于5，或有单元格期望频数小于1时，不宜用Pearson卡方检验，可考虑Fisher精确概率法。

卡方检验结果应该怎么看？

重点看Pearson卡方值、自由度和P值；若P<0.05，说明组间差异有统计学意义。

卡方检验怎么做？4步解析超实用流程

作者：Dr.Lin

2026-05-18｜原创

引言Introduction

卡方检验怎么做，是很多医学生、医生和科研人员在做分类资料分析时最常遇到的问题。样本有差异，结果却不知道该不该用卡方检验。最常见的难点，就是不会判断条件，也不会读结果。
一张临床科研数据分析场景图，包含SPSS交叉表、四格表或行列表、研究者在电脑前查看P值的画面

1. 先判断你的数据适不适合卡方检验

1.1 卡方检验处理的是什么数据

卡方检验主要用于分类资料的组间比较。 也就是把变量分成若干类，再看不同组的构成比或率有没有差异。

常见场景包括：

两组或多组有效率比较
不同治疗方案的结局比较
病例组与对照组的暴露因素比较

例如，三种药物的有效率是否不同，就是典型的卡方检验问题。自变量是组别，因变量是“有效/无效”这类分类结局。

1.2 先看三个应用条件

做卡方检验前，不要直接点软件。先看条件。
卡方检验至少要关注三个核心点。

总样本量一般应大于40。
单元格期望频数不能太小。
至少80%的单元格期望频数要大于5，且不能有期望频数小于1的单元格。

这些条件决定了你能否使用Pearson卡方检验。
如果期望频数太小，就要考虑Fisher精确概率法。

1.3 2×2和R×C的区别

很多人以为卡方检验只有一种，其实常见的有两类：

2×2四格表 ，适合两组两分类资料
R×C行列表 ，适合多组或多分类资料

本质上它们都是在比较“实际频数”和“理论频数”的差异。区别只在于行列数不同。
当R=C=2时，2×2卡方检验就是R×C卡方检验的特殊情况。

2. 搞懂卡方检验的基本原理

2.1 理论频数和实际频数

卡方检验的核心，是比较两种频数：

实际频数 ，就是你真实观察到的例数
理论频数 ，也叫期望频数，是在原假设成立时应当出现的例数

原假设通常认为，不同组别的分类变量分布是相同的。
例如，三组药物的有效率相同，那么每组“有效”的比例理论上应该接近一致。

2.2 卡方值和P值怎么理解

卡方值越大，说明实际频数与理论频数的差异越大。
差异越大，P值越小。

这和t检验的逻辑很像。t值越大，P值越小；卡方值越大，P值也越小。
如果P<0.05，通常认为组间差异有统计学意义。

但要注意，P值只是统计学结论，不代表临床意义一定足够大。科研写作时，最好同时报告率、构成比或效应量信息。

2.3 期望频数为什么重要

期望频数是判断卡方检验可靠性的关键。
如果某些格子的期望频数太低，Pearson卡方检验的近似前提会变差，结果可能不稳。

所以实际分析中，先看频数，再谈检验。
不要只看软件是否能跑出结果。

3. 按4步完成卡方检验

3.1 第一步，明确研究问题和变量类型

先把问题说清楚。你要比较的是什么？
通常要回答四个问题：

研究设计是什么
自变量是什么
因变量是什么
适合什么统计方法

例如，比较三种药物的疗效差异。
自变量是药物分组。因变量是疗效，属于二分类变量。
这类问题首选卡方检验。

3.2 第二步，列出交叉表并建立假设

把数据整理成交叉表。
如果是三组药物和“有效/无效”两类结局，就是3×2行列表资料。

接着建立假设：

H0：各组总体率相等
H1：各组总体率不全相等

设定检验水准，一般取α=0.05。
如果P<0.05，拒绝H0。
如果P≥0.05，则不拒绝H0。

这一点很重要。
卡方检验能告诉你“有没有差异”，但不能直接告诉你“哪两组有差异”。

3.3 第三步，检查条件并选择方法

这是很多人最容易出错的一步。
判断顺序建议如下：

看总样本量是否足够。
看最小期望频数是否小于1。
看期望频数小于5的单元格比例是否超过20%。

如果所有理论频数都≥5，优先用Pearson卡方检验。
如果超过20%的理论频数<5，或至少1个理论频数<1，优先用Fisher精确概率法。

记住一句话：条件合适用卡方，不合适换精确法。

3.4 第四步，读结果并完成报告

以3组药物疗效比较为例，SPSS交叉表中会输出实际频数、期望频数和行百分比。
行百分比可以帮助你计算每组有效率。

在结果表里，你重点看三项：

Pearson卡方值
自由度
P值

例如，若输出为χ²=32.736，P<0.001，就说明三组有效率差异有统计学意义。
实际写作时，一般报告为P<0.001，而不是写P=0。

如果想进一步比较具体哪两组有差异，需要做事后两两比较，并进行多重校正。
这一点不能从总体卡方检验直接得到。

4. 软件操作和结果解读要点

4.1 SPSS中怎么做

在SPSS里，常见路径是：

分析
描述统计
交叉表

然后把分组变量放到行，把结局变量放到列。
点击“统计”，勾选“卡方”。
点击“单元格”，勾选“实测”“期望”和“行百分比”。

如果你担心期望频数不足，还要注意精确检验选项。
在R×C卡方检验中，如果不勾选精确选项，默认可能不会输出精确概率法结果。

4.2 输出结果怎么看

输出里常见三张表：

个案处理摘要
交叉表
卡方检验

真正需要重点看的，是交叉表和卡方检验表。
交叉表能看每组的实际例数和率。
卡方检验表能判断差异是否显著。

如果期望频数满足条件，就看Pearson卡方检验结果。
如果不满足，就优先看Fisher精确概率法。
不要把不适合的检验结果当成最终结论。

4.3 结果报告怎么写更规范

论文或汇报中，建议这样表达：

“三组有效率差异有统计学意义，χ²=32.736，P<0.001。”
“各组间总体率不全相等。”
“进一步两两比较结果需结合校正方法分析。”

这种写法比只写一个P值更完整。
也更符合临床研究的表达习惯。

总结Conclusion

卡方检验怎么做，核心就是4步。先判断数据类型和条件，再建立交叉表和假设，接着选择合适的方法，最后规范解读P值和临床意义。真正决定结果是否可靠的，不是软件按钮，而是期望频数和研究设计。

如果你在临床统计、论文分析或科研汇报中经常卡在“能不能用卡方检验”“结果怎么读”这两个问题上，建议直接使用解螺旋品牌的统计与科研支持工具，帮助你更快完成数据整理、检验选择和结果表达。
一张科研人员完成统计分析后的简洁桌面场景图，显示交叉表、卡方结果和论文写作界面，整体专业、清晰、偏学术风格