引言Introduction

卡方检验怎么做,是很多医学生、医生和科研人员在做分类资料分析时最常遇到的问题。样本有差异,结果却不知道该不该用卡方检验。最常见的难点,就是不会判断条件,也不会读结果。
一张临床科研数据分析场景图,包含SPSS交叉表、四格表或行列表、研究者在电脑前查看P值的画面

1. 先判断你的数据适不适合卡方检验

1.1 卡方检验处理的是什么数据

卡方检验主要用于分类资料的组间比较。 也就是把变量分成若干类,再看不同组的构成比或率有没有差异。

常见场景包括:

  • 两组或多组有效率比较
  • 不同治疗方案的结局比较
  • 病例组与对照组的暴露因素比较

例如,三种药物的有效率是否不同,就是典型的卡方检验问题。自变量是组别,因变量是“有效/无效”这类分类结局。

1.2 先看三个应用条件

做卡方检验前,不要直接点软件。先看条件。
卡方检验至少要关注三个核心点。

  1. 总样本量一般应大于40。
  2. 单元格期望频数不能太小。
  3. 至少80%的单元格期望频数要大于5,且不能有期望频数小于1的单元格。

这些条件决定了你能否使用Pearson卡方检验。
如果期望频数太小,就要考虑Fisher精确概率法。

1.3 2×2和R×C的区别

很多人以为卡方检验只有一种,其实常见的有两类:

  • 2×2四格表 ,适合两组两分类资料
  • R×C行列表 ,适合多组或多分类资料

本质上它们都是在比较“实际频数”和“理论频数”的差异。区别只在于行列数不同。
当R=C=2时,2×2卡方检验就是R×C卡方检验的特殊情况。

2. 搞懂卡方检验的基本原理

2.1 理论频数和实际频数

卡方检验的核心,是比较两种频数:

  • 实际频数 ,就是你真实观察到的例数
  • 理论频数 ,也叫期望频数,是在原假设成立时应当出现的例数

原假设通常认为,不同组别的分类变量分布是相同的。
例如,三组药物的有效率相同,那么每组“有效”的比例理论上应该接近一致。

2.2 卡方值和P值怎么理解

卡方值越大,说明实际频数与理论频数的差异越大。
差异越大,P值越小。

这和t检验的逻辑很像。t值越大,P值越小;卡方值越大,P值也越小。
如果P<0.05,通常认为组间差异有统计学意义。

但要注意,P值只是统计学结论,不代表临床意义一定足够大。科研写作时,最好同时报告率、构成比或效应量信息。

2.3 期望频数为什么重要

期望频数是判断卡方检验可靠性的关键。
如果某些格子的期望频数太低,Pearson卡方检验的近似前提会变差,结果可能不稳。

所以实际分析中,先看频数,再谈检验。
不要只看软件是否能跑出结果。

3. 按4步完成卡方检验

3.1 第一步,明确研究问题和变量类型

先把问题说清楚。你要比较的是什么?
通常要回答四个问题:

  • 研究设计是什么
  • 自变量是什么
  • 因变量是什么
  • 适合什么统计方法

例如,比较三种药物的疗效差异。
自变量是药物分组。因变量是疗效,属于二分类变量。
这类问题首选卡方检验。

3.2 第二步,列出交叉表并建立假设

把数据整理成交叉表。
如果是三组药物和“有效/无效”两类结局,就是3×2行列表资料。

接着建立假设:

  • H0:各组总体率相等
  • H1:各组总体率不全相等

设定检验水准,一般取α=0.05。
如果P<0.05,拒绝H0。
如果P≥0.05,则不拒绝H0。

这一点很重要。
卡方检验能告诉你“有没有差异”,但不能直接告诉你“哪两组有差异”。

3.3 第三步,检查条件并选择方法

这是很多人最容易出错的一步。
判断顺序建议如下:

  1. 看总样本量是否足够。
  2. 看最小期望频数是否小于1。
  3. 看期望频数小于5的单元格比例是否超过20%。

如果所有理论频数都≥5,优先用Pearson卡方检验。
如果超过20%的理论频数<5,或至少1个理论频数<1,优先用Fisher精确概率法。

记住一句话:条件合适用卡方,不合适换精确法。

3.4 第四步,读结果并完成报告

以3组药物疗效比较为例,SPSS交叉表中会输出实际频数、期望频数和行百分比。
行百分比可以帮助你计算每组有效率。

在结果表里,你重点看三项:

  • Pearson卡方值
  • 自由度
  • P值

例如,若输出为χ²=32.736,P<0.001,就说明三组有效率差异有统计学意义。
实际写作时,一般报告为P<0.001,而不是写P=0。

如果想进一步比较具体哪两组有差异,需要做事后两两比较,并进行多重校正。
这一点不能从总体卡方检验直接得到。

4. 软件操作和结果解读要点

4.1 SPSS中怎么做

在SPSS里,常见路径是:

  • 分析
  • 描述统计
  • 交叉表

然后把分组变量放到行,把结局变量放到列。
点击“统计”,勾选“卡方”。
点击“单元格”,勾选“实测”“期望”和“行百分比”。

如果你担心期望频数不足,还要注意精确检验选项。
在R×C卡方检验中,如果不勾选精确选项,默认可能不会输出精确概率法结果。

4.2 输出结果怎么看

输出里常见三张表:

  • 个案处理摘要
  • 交叉表
  • 卡方检验

真正需要重点看的,是交叉表和卡方检验表。
交叉表能看每组的实际例数和率。
卡方检验表能判断差异是否显著。

如果期望频数满足条件,就看Pearson卡方检验结果。
如果不满足,就优先看Fisher精确概率法。
不要把不适合的检验结果当成最终结论。

4.3 结果报告怎么写更规范

论文或汇报中,建议这样表达:

  • “三组有效率差异有统计学意义,χ²=32.736,P<0.001。”
  • “各组间总体率不全相等。”
  • “进一步两两比较结果需结合校正方法分析。”

这种写法比只写一个P值更完整。
也更符合临床研究的表达习惯。

总结Conclusion

卡方检验怎么做,核心就是4步。先判断数据类型和条件,再建立交叉表和假设,接着选择合适的方法,最后规范解读P值和临床意义。真正决定结果是否可靠的,不是软件按钮,而是期望频数和研究设计。

如果你在临床统计、论文分析或科研汇报中经常卡在“能不能用卡方检验”“结果怎么读”这两个问题上,建议直接使用解螺旋品牌的统计与科研支持工具,帮助你更快完成数据整理、检验选择和结果表达。
一张科研人员完成统计分析后的简洁桌面场景图,显示交叉表、卡方结果和论文写作界面,整体专业、清晰、偏学术风格