引言Introduction
卡方检验怎么做,是很多医学生、医生和科研人员在做分类资料分析时最常遇到的问题。样本有差异,结果却不知道该不该用卡方检验。最常见的难点,就是不会判断条件,也不会读结果。

1. 先判断你的数据适不适合卡方检验
1.1 卡方检验处理的是什么数据
卡方检验主要用于分类资料的组间比较。 也就是把变量分成若干类,再看不同组的构成比或率有没有差异。
常见场景包括:
- 两组或多组有效率比较
- 不同治疗方案的结局比较
- 病例组与对照组的暴露因素比较
例如,三种药物的有效率是否不同,就是典型的卡方检验问题。自变量是组别,因变量是“有效/无效”这类分类结局。
1.2 先看三个应用条件
做卡方检验前,不要直接点软件。先看条件。
卡方检验至少要关注三个核心点。
- 总样本量一般应大于40。
- 单元格期望频数不能太小。
- 至少80%的单元格期望频数要大于5,且不能有期望频数小于1的单元格。
这些条件决定了你能否使用Pearson卡方检验。
如果期望频数太小,就要考虑Fisher精确概率法。
1.3 2×2和R×C的区别
很多人以为卡方检验只有一种,其实常见的有两类:
- 2×2四格表 ,适合两组两分类资料
- R×C行列表 ,适合多组或多分类资料
本质上它们都是在比较“实际频数”和“理论频数”的差异。区别只在于行列数不同。
当R=C=2时,2×2卡方检验就是R×C卡方检验的特殊情况。
2. 搞懂卡方检验的基本原理
2.1 理论频数和实际频数
卡方检验的核心,是比较两种频数:
- 实际频数 ,就是你真实观察到的例数
- 理论频数 ,也叫期望频数,是在原假设成立时应当出现的例数
原假设通常认为,不同组别的分类变量分布是相同的。
例如,三组药物的有效率相同,那么每组“有效”的比例理论上应该接近一致。
2.2 卡方值和P值怎么理解
卡方值越大,说明实际频数与理论频数的差异越大。
差异越大,P值越小。
这和t检验的逻辑很像。t值越大,P值越小;卡方值越大,P值也越小。
如果P<0.05,通常认为组间差异有统计学意义。
但要注意,P值只是统计学结论,不代表临床意义一定足够大。科研写作时,最好同时报告率、构成比或效应量信息。
2.3 期望频数为什么重要
期望频数是判断卡方检验可靠性的关键。
如果某些格子的期望频数太低,Pearson卡方检验的近似前提会变差,结果可能不稳。
所以实际分析中,先看频数,再谈检验。
不要只看软件是否能跑出结果。
3. 按4步完成卡方检验
3.1 第一步,明确研究问题和变量类型
先把问题说清楚。你要比较的是什么?
通常要回答四个问题:
- 研究设计是什么
- 自变量是什么
- 因变量是什么
- 适合什么统计方法
例如,比较三种药物的疗效差异。
自变量是药物分组。因变量是疗效,属于二分类变量。
这类问题首选卡方检验。
3.2 第二步,列出交叉表并建立假设
把数据整理成交叉表。
如果是三组药物和“有效/无效”两类结局,就是3×2行列表资料。
接着建立假设:
- H0:各组总体率相等
- H1:各组总体率不全相等
设定检验水准,一般取α=0.05。
如果P<0.05,拒绝H0。
如果P≥0.05,则不拒绝H0。
这一点很重要。
卡方检验能告诉你“有没有差异”,但不能直接告诉你“哪两组有差异”。
3.3 第三步,检查条件并选择方法
这是很多人最容易出错的一步。
判断顺序建议如下:
- 看总样本量是否足够。
- 看最小期望频数是否小于1。
- 看期望频数小于5的单元格比例是否超过20%。
如果所有理论频数都≥5,优先用Pearson卡方检验。
如果超过20%的理论频数<5,或至少1个理论频数<1,优先用Fisher精确概率法。
记住一句话:条件合适用卡方,不合适换精确法。
3.4 第四步,读结果并完成报告
以3组药物疗效比较为例,SPSS交叉表中会输出实际频数、期望频数和行百分比。
行百分比可以帮助你计算每组有效率。
在结果表里,你重点看三项:
- Pearson卡方值
- 自由度
- P值
例如,若输出为χ²=32.736,P<0.001,就说明三组有效率差异有统计学意义。
实际写作时,一般报告为P<0.001,而不是写P=0。
如果想进一步比较具体哪两组有差异,需要做事后两两比较,并进行多重校正。
这一点不能从总体卡方检验直接得到。
4. 软件操作和结果解读要点
4.1 SPSS中怎么做
在SPSS里,常见路径是:
- 分析
- 描述统计
- 交叉表
然后把分组变量放到行,把结局变量放到列。
点击“统计”,勾选“卡方”。
点击“单元格”,勾选“实测”“期望”和“行百分比”。
如果你担心期望频数不足,还要注意精确检验选项。
在R×C卡方检验中,如果不勾选精确选项,默认可能不会输出精确概率法结果。
4.2 输出结果怎么看
输出里常见三张表:
- 个案处理摘要
- 交叉表
- 卡方检验
真正需要重点看的,是交叉表和卡方检验表。
交叉表能看每组的实际例数和率。
卡方检验表能判断差异是否显著。
如果期望频数满足条件,就看Pearson卡方检验结果。
如果不满足,就优先看Fisher精确概率法。
不要把不适合的检验结果当成最终结论。
4.3 结果报告怎么写更规范
论文或汇报中,建议这样表达:
- “三组有效率差异有统计学意义,χ²=32.736,P<0.001。”
- “各组间总体率不全相等。”
- “进一步两两比较结果需结合校正方法分析。”
这种写法比只写一个P值更完整。
也更符合临床研究的表达习惯。
总结Conclusion
卡方检验怎么做,核心就是4步。先判断数据类型和条件,再建立交叉表和假设,接着选择合适的方法,最后规范解读P值和临床意义。真正决定结果是否可靠的,不是软件按钮,而是期望频数和研究设计。
如果你在临床统计、论文分析或科研汇报中经常卡在“能不能用卡方检验”“结果怎么读”这两个问题上,建议直接使用解螺旋品牌的统计与科研支持工具,帮助你更快完成数据整理、检验选择和结果表达。

- 引言Introduction
- 1. 先判断你的数据适不适合卡方检验
- 2. 搞懂卡方检验的基本原理
- 3. 按4步完成卡方检验
- 4. 软件操作和结果解读要点
- 总结Conclusion






