病例对照研究样本量计算最关键的参数有哪些？

主要有3个：两组事件率/暴露率、α值和把握度（1-β）、以及预期组间差异大小。

病例对照研究为什么不能直接凭经验估算样本量？

因为样本量取决于预期差异、暴露率和统计学要求；如果不计算，可能出现样本不足导致“阴性但不可信”。

病例对照研究中1:1和1:n设计会影响样本量吗？

会。1:n设计会改变病例与对照的比例，公式和最终所需样本量都需要相应调整。

病例对照研究样本量计算：3个关键参数是什么？

作者：Dr.Chuang

2026-05-20｜原创

引言Introduction

病例对照研究样本量计算，是开题、标书和论文设计里最容易被忽视，却最影响结果可信度的环节。样本量太少，可能得出“阴性但不可信”的结论。样本量太大，又会增加资源浪费。真正要先想清楚的，是病例对照研究样本量计算依赖的3个关键参数。
科研人员在电脑前查看病例对照研究设计图与样本量公式，旁边有病例组和对照组示意图

1. 病例对照研究样本量计算，为什么不能凭经验估

1.1 研究目的决定样本量逻辑

病例对照研究的核心，是先按结局分组，再回看暴露史。和队列研究不同，它不是等事件自然发生，而是直接比较两组既往暴露比例是否不同。因此，病例对照研究样本量计算的本质，是估计“要观察到多大的组间差异，才需要多少样本”。

如果没有样本量依据，研究结果即使是阴性，也很难判断是“确实无差异”，还是“样本不足导致没检出”。这也是为什么在临床研究和论文写作中，样本量计算常被要求写进方案和方法学部分。

1.2 适用于什么场景

知识库中提到，病例对照研究常用的是比较两组率差的公式。比如吸烟与肺癌，带状疱疹与勃起功能障碍，关注的都是某个暴露在病例组和对照组中的发生率差异。

如果研究变量是二分类结局或二分类暴露，病例对照研究样本量计算最常用。
如果比较的是连续变量，比如血压均值差，则要换用其他公式，不能直接套用率差公式。

1.3 先把设计想清楚

在开始计算前，先明确三件事。

研究是按结局分组，还是按暴露分组。
主要比较的是暴露率，还是均值差。
是否是1:1匹配，还是1:n匹配。

这一步很重要。因为病例对照研究样本量计算的参数，会随研究设计变化。

2. 病例对照研究样本量计算的3个关键参数

2.1 参数一：两组事件率或暴露率

这是最核心的参数。知识库中用P0和P1表示两组中某个事件的发生率。对于病例对照研究，这个“事件”通常就是暴露史是否存在，或者结局是否出现，取决于你怎么定义分组。

P0，通常代表对照组中的发生率。
P1，通常代表病例组中的发生率。
Q0 = 1 - P0。
Q1 = 1 - P1。

如果你不知道P0和P1，病例对照研究样本量计算就无法启动。
这两个值一般来自文献、预调查，或临床经验。比如知识库中的例子，假设病例组吸烟率为50%，对照组为30%，那么P1和P0就分别是0.5和0.3。

需要注意的是，P0和P1的命名顺序并不改变计算本身。关键是你要清楚哪一组是病例组，哪一组是对照组，避免代入时混淆。

2.2 参数二：α值和把握度

第二个关键参数，是统计学显著性水平α和把握度，也就是1-β。

知识库中给出的常用取值是：

α通常取0.05，Uα/2对应1.96。
β常取0.1或0.2，对应把握度90%或80%。
当β=0.1时，Uβ约为1.28。

这两个参数决定你允许多大的第一类错误和第二类错误。简单说，α越小，要求越严格，样本量通常越大。把握度越高，也就是你越希望检出真实差异，所需样本量也越大。

在病例对照研究样本量计算中，α和把握度通常可以看作固定常数，但它们直接影响最终样本量。
科研中最常见的组合，就是α=0.05，把握度80%或90%。

2.3 参数三：组间差异的预期大小

第三个关键参数，是你预期要观察到的差异有多大。它本质上体现在P1和P0的差距上。

知识库明确指出，样本量计算的逻辑不是“先算出需要多少人，再去找结果”，而是先假设一个差异，再判断要用多少样本才能观察到这个差异。差异越小，所需样本量越大。

这点对初学者很重要。很多人只想问“我要做这个研究，需要多少例”。但真正该问的是：

你希望检出的差异是多少。
这个差异有无文献或预调查支持。
这个差异在临床上是否有意义。

如果你把预期差异设得过小，样本量会迅速增加。反过来，如果差异设得过大，样本量虽然变小，但研究可能不够现实。

3. 公式里还会出现哪些派生量

3.1 P、Q的平均值

知识库中提到，除了P0、P1，还会计算平均值P和Q。

P = （P0 + P1）/2
Q = （Q0 + Q1）/2

它们不是额外假设，而是由前面两个率推导出来的中间量。在病例对照研究样本量计算中，P和Q只是计算工具，不是你额外要估计的新参数。

3.2 1:1还是1:n

病例对照研究常见设计是1:1，但如果病例少，也可以增加对照数。知识库指出，1:n匹配时，对照组比例改变，公式也会相应调整。

这在实际研究中很常见。

病例难收集时，可适当增加对照。
但匹配比例增加并非越大越好。
有经验建议，不要无限制扩大到过高比例。

当病例资源有限时，1:2或1:4常用于提高效率，但样本量计算必须同步调整。

3.3 匹配研究和非匹配研究

如果是成组匹配或个体匹配，样本量计算会更复杂。知识库中提到，个体匹配时公式会引入更复杂的参数，分析上常用条件logistic回归。

对初学者来说，最重要的是先分清：

是非匹配病例对照。
还是成组匹配病例对照。
还是个体匹配病例对照。

不同设计决定不同的病例对照研究样本量计算路径。
不要把非匹配公式直接套到个体匹配研究中。

4. 一个临床例子，如何理解这3个参数

4.1 以吸烟与肺癌为例

知识库中给了一个经典例子。假设病例组是肺癌患者，对照组是无肺癌者，预计病例组吸烟率50%，对照组吸烟率30%。

此时，核心参数就很清楚了。

P1 = 0.5
P0 = 0.3
α = 0.05
β可取0.1
组比默认1:1

代入后，可得每组约需176例，实际可四舍五入为180例。也就是说，病例组180例，对照组180例，能较稳定地检出预设差异。

4.2 这个例子说明什么

这个例子说明，病例对照研究样本量计算不是机械代公式，而是先确定研究问题，再把问题转化为可计算参数。

如果你研究的是医院数据库中的新发病例，样本量可能已经足够大，那么计算的意义更多是验证设计是否合理。
如果你做的是原始数据收集，样本量计算就是必须步骤。它直接影响研究能否立项，能否通过伦理，能否解释阴性结果。

5. 实操时最容易出错的地方

5.1 把P0和P1搞反

P0和P1顺序写反，通常不会改变数学形式，但会让设计叙述混乱。尤其在写方案时，必须统一病例组、对照组定义。

5.2 只给出OR，不给发生率

知识库提到，如果文献只提供OR，也可以反推P0或P1，但前提是你还得知道另一组的基线发生率。只有OR，没有基线率，病例对照研究样本量计算仍然不完整。

5.3 盲目追求大样本

很多研究者会觉得样本越多越好。实际上，样本量应与研究目的匹配。对于关联研究，最关键的是能否检出预设差异，而不是无限扩大样本。

5.4 忽略数据来源偏倚

知识库提醒，基于医院数据库的研究可能存在入院率偏倚、存活病例偏倚、选择偏倚。即使样本量足够，这些偏倚也会影响结论。
所以，病例对照研究样本量计算解决的是“够不够”，但不能自动解决“偏不偏”。

6. 什么时候建议用工具而不是手算

6.1 手算适合基础理解

基础阶段，建议先理解P0、P1、α、β这几个参数，能看懂公式的结构。这样有助于你判断文献里的样本量是否合理。

6.2 软件适合正式设计

在正式研究设计中，可以使用PASS等软件。知识库中也提到，PASS不仅能基于公式计算，还能做模拟。对于复杂匹配设计、1:n设计，或连续变量设计，软件更稳妥。

对于医学生、医生和科研人员来说，掌握病例对照研究样本量计算的核心，不是背公式，而是会选参数。

总结Conclusion

病例对照研究样本量计算，真正决定结果的，主要就是3个关键参数：两组事件率或暴露率、α和把握度、以及预期组间差异大小。 其中，P0和P1决定研究问题能不能被量化，α和β决定统计标准，差异大小决定最终样本量是几十、几百，还是更多。
如果你正在做开题、标书或论文设计，建议先把研究类型、分组方式和主要结局定义清楚，再进入计算。对复杂设计，可以结合PASS软件或专业方法学支持。如果你希望把病例对照研究样本量计算做得更规范、更高效，可以结合解螺旋的科研内容与方法学工具，减少试错，提升方案质量。
科研团队讨论病例对照研究方案，屏幕上展示样本量计算结果、PASS软件界面和论文开题文档