引言Introduction

Fisher确切概率法 是在小样本分类资料分析中最常用的方法之一。对医学生、医生和科研人员来说,最常见的痛点是,2×2四格表样本量不够,卡方检验不适用,但又必须给出可靠P值。当总样本量较小,或理论频数过低时,Fisher确切概率法是更稳妥的选择。

医学统计场景图,展示2×2四格表、样本量不足提示、SPSS交叉表分析界面与P值结果。

1. Fisher确切概率法是什么

1.1 核心定义

Fisher确切概率法 由 R.A. Fisher 于1934年提出,基于超几何分布理论,直接计算在零假设成立时,当前或更极端结果出现的概率。它不是依赖大样本近似,而是针对具体列联表做精确推断。

这也是它与卡方检验最关键的区别。卡方检验依赖近似分布,样本越大越稳定。Fisher确切概率法更适合小样本、稀疏格子的2×2列联表。

1.2 适用研究类型

在临床研究中,Fisher确切概率法 主要用于分类资料的组间差异分析。常见于以下2类研究:

  1. 病例对照研究。
  2. 两组比较的临床研究。

例如,吸烟与肺癌的病例对照研究中,暴露因素是吸烟与否,结局变量是是否患肺癌,均为二分类变量。这类数据首先考虑卡方检验,当条件不满足时,就应转用Fisher确切概率法。

1.3 单侧检验与双侧检验

Fisher检验可分为单侧和双侧两种。一般而言:

  • 单侧检验 ,适用于研究方向明确的情形,如“新法是否优于旧法”。
  • 双侧检验 ,适用于只关心“两组是否有差异”的情形。

在临床研究设计阶段,就应先明确研究目的。不要在统计分析阶段再临时决定单侧还是双侧。
一般来说,双侧检验更稳妥,也更常用。

2. Fisher确切概率法的适用条件

2.1 何时优先考虑

Fisher确切概率法 并不是任何2×2表都必须用。它主要在以下情况使用:

  • 总样本量较小,通常 n < 40
  • 任一单元格理论频数 < 1
  • 20%以上 的单元格理论频数 < 5

这些条件在SPSS交叉表输出中都能看到。对于医学生和初学者来说,最实用的判断原则是:先看卡方检验是否满足条件,不满足时再考虑Fisher确切概率法。

2.2 与卡方检验的关系

卡方检验和Fisher检验都用于分类资料。两者操作路径类似,差别主要在适用条件。
当样本量充足、理论频数合格时,优先用卡方检验。
当样本量不足或格子过稀疏时,Fisher确切概率法更可靠。

这意味着,Fisher确切概率法是卡方检验的重要补充,而不是替代所有分类资料分析的方法。

2.3 一个常见判断逻辑

可按以下顺序判断:

  1. 研究变量是否都是分类变量。
  2. 是否为2×2四格表。
  3. 总样本量是否 < 40。
  4. 最小理论频数是否 < 1。
  5. 理论频数 < 5 的单元格比例是否超过20%。

如果以上条件提示卡方检验不稳妥,就使用Fisher确切概率法

3. Fisher确切概率法在病例对照研究中的应用

3.1 典型场景

病例对照研究是Fisher确切概率法 最常见的应用场景之一。
比如研究“吸烟是否与肺癌相关”,病例组24例,对照组12例。病例组中20人吸烟,4人不吸烟;对照组中6人吸烟,6人不吸烟。

这个例子中,变量都是二分类。理论上先考虑卡方检验。
但总样本量为36,n < 40 ,已经不满足卡方检验的常规要求,因此应使用Fisher确切概率法

3.2 假设检验如何设定

在这类研究中,常规假设是:

  • 原假设 H0:两组吸烟比例相等。
  • 备择假设 H1:两组吸烟比例不等。

若P < 0.05,则拒绝H0,认为差异有统计学意义。
若P ≥ 0.05,则不能拒绝H0,认为差异无统计学意义。

在上述病例对照例子中,Fisher检验结果为 P = 0.053 ,大于0.05。
因此,不能认为两组吸烟比例存在统计学差异。

3.3 结果解读要点

解读时不要只看P值,还要看研究设计与数据结构。
对于病例对照研究,Fisher确切概率法告诉我们的是:在既定样本下,这种差异是否足够显著。

需要注意:

  • P值不等于效应大小。
  • P值大于0.05,不代表“没有任何差异”。
  • P值小于0.05,也不代表因果关系成立。

Fisher确切概率法解决的是统计推断问题,不是因果判定问题。

4. Fisher确切概率法在SPSS中的操作

4.1 数据准备

在SPSS中,先完成变量编码。常见设置如下:

  • 组别:1 = 对照组,2 = 病例组。
  • 暴露因素:0 = 不吸烟,1 = 吸烟。

确保数据视图和变量视图清晰,分类变量已正确赋值。
这一步很重要。编码错误会直接影响结果。

4.2 操作路径

在SPSS中,按以下步骤操作:

  1. 点击“分析”。
  2. 选择“描述统计”。
  3. 进入“交叉表”。
  4. 将“组别”放入行,将“暴露因素”放入列。
  5. 点击“统计”,勾选“卡方”。
  6. 点击“精确”,勾选“精确”。
  7. 点击“单元格”,勾选“实测值”,必要时勾选“期望值”。
  8. 点击“确定”输出结果。

SPSS会同时给出交叉表和检验结果。
当条件不满足时,最终应以Fisher确切概率法对应的P值为准。

4.3 输出结果怎么看

输出中通常会看到三部分:

  • 个案处理摘要。
  • 交叉表。
  • 卡方检验。

重点看两处:

  1. 交叉表中的实际频数和期望频数。
  2. 检验表中的Fisher精确检验P值。

如果最小理论频数 < 1,或20%以上单元格理论频数 < 5,应优先报告Fisher确切概率法结果。

5. Fisher确切概率法在临床科研写作中的表达

5.1 论文结果部分怎么写

在论文结果部分,建议直接写明方法和P值。
例如:

“由于样本量较小且部分单元格理论频数不满足卡方检验条件,采用Fisher确切概率法进行分析。结果显示,两组吸烟比例差异无统计学意义,P = 0.053。”

这类写法有三个优点:

  • 交代方法选择依据。
  • 保留统计透明性。
  • 便于审稿人判断分析是否规范。

5.2 表格展示建议

在三线表中,建议同时呈现:

  • 组别。
  • 频数。
  • 构成比。
  • P值。

如果是2×2表,Fisher确切概率法的结果应清楚标注。
不要只写“卡方检验P值”,否则容易造成方法与结果不一致。

5.3 常见误区

常见错误包括:

  • 样本量不足仍强行使用卡方检验。
  • 只看P值,不看理论频数。
  • 单侧和双侧检验混用。
  • 结果表述不清,未注明使用Fisher确切概率法。

规范的统计方法选择,是临床研究可信度的一部分。

6. 结语:如何在两类研究中用好 Fisher确切概率法

6.1 一句话总结

Fisher确切概率法最适合小样本、2×2列联表、卡方检验条件不满足的分类资料分析。
在病例对照研究和两组比较研究中,它能提供比近似方法更稳妥的P值。

6.2 对医学生和科研人员的实用建议

记住一个简单顺序:

  • 先判断变量类型。
  • 再判断列联表结构。
  • 再看卡方检验条件。
  • 条件不满足时使用Fisher确切概率法

这套流程适用于大多数临床分类资料分析场景。
掌握后,你可以更快判断统计方法,也能提高论文写作的规范性。

6.3 结合解螺旋产品解决痛点

如果你在论文设计、数据分析和结果写作中,经常卡在“该用卡方还是Fisher确切概率法”,可以借助解螺旋 的临床研究课程与方法指导,把统计判断、SPSS操作和论文表达串联起来。它能帮助你更快完成方法选择,减少分析失误,提高科研写作效率。

Fisher确切概率法不是复杂统计的替代品,而是小样本研究中更稳妥、更规范的工具。 掌握它,你在病例对照研究和2类临床研究中的统计表达会更准确,也更容易通过审稿和答辩。

临床科研写作与统计分析场景图,展示研究者在电脑前查看Fisher确切概率法结果、论文表格与SPSS输出。