医学研究样本量计算为什么要先确定研究设计？

因为不同研究设计对应的计算公式不同，先定设计再定公式和参数，样本量才准确。

样本量计算中最容易影响结果的参数有哪些？

预估率或效应量、容许误差、置信度/α值，以及无应答率或脱落率。

PASS软件可以直接算出准确样本量吗？

不能。PASS只是计算工具，前提仍是研究设计明确、参数设置合理。

医学研究样本量计算，2种方法详解

作者：Dr.Chuang

2026-05-20｜原创

引言Introduction

医学研究样本量计算，常卡在两件事上。第一，不知道该用哪种研究设计。第二，公式写对了，参数却选错了。样本量不是越大越好，也不是拍脑袋定数。 它必须和研究目的、结局类型、抽样误差匹配。临床研究者在电脑前查看统计软件界面，旁边放着论文设计表和计算器，突出样本量计算的专业场景

1. 为什么样本量计算必须先看研究设计

1.1 研究设计决定公式，而不是反过来

在医学研究里，样本量计算的前提是先明确研究设计。横断面调查、病例对照研究、队列研究，所用公式并不相同。如果只问“样本量怎么算”，却不说明研究类型，答案一定不准确。

知识库中反复强调，样本量计算是基于研究问题和研究设计类型来选择公式。比如横断面研究常用于估计患病率或均数。病例对照研究则要根据暴露率、比值比和把握度来推算。也就是说，先定设计，再定公式，再定参数。

1.2 小样本为什么容易出错

样本太小，最直接的问题是抽样误差大。比如只调查2个人，患病率可能是0%、50%或100%。这显然不能代表总体。即使扩大到10个人，结果仍可能波动很大。样本量不足，会让结论失去代表性。

临床研究中也常见另一种情况。研究者手上只有100例病例，就想直接写文章。审稿人通常会追问：为什么是100例，不是200例。此时不能只用“医院一年只有100例”来解释。更合理的做法是，先说明研究设计，再估算理论样本量，并比较现实可得样本与理论需求的差距。

1.3 样本量计算的核心逻辑

样本量计算本质上是在回答一个问题：为了让预估结果具有统计学意义，需要多少样本。
这个“预估结果”来自文献、预实验或专家经验。比如你预计某人群糖尿病患病率为5%或10%，再根据允许误差来倒推样本量。

这也解释了为什么医学研究样本量计算不能脱离文献。没有先验信息，参数无法设定。容许误差越小，所需样本量越大。 总体变异越大，样本量也越大。

2. 医学研究样本量计算的两种常用方法

2.1 方法一，横断面研究的估计公式

横断面研究最常见，目标通常是估计患病率或均数。对于分类资料，核心参数包括预估率、容许误差和检验水准。知识库给出的例子很典型。若预计某市区乙肝表面抗原携带率为10%，希望误差不超过1%，按公式计算样本量约为3458例。

这里要注意，容许误差是关键参数。 如果希望估计更精确，样本量会显著增加。文献中还提到，高尿酸血症患病率研究中，若患病率为6.4%，容许误差为3%，在95%置信度下，PASS软件计算的样本量为5619例。若再考虑10%无应答率和90%问卷合格率，总样本需求会继续上升。

横断面研究的连续变量也类似。比如调查平均血清硒水平时，要用标准差和容许误差来估计样本量。文献中的一个例子显示，若标准差约20 g/L，容许误差为10 g/L，在95%置信度下，有限总体和无限总体对应的样本量会明显不同。这说明总体大小、误差范围和变异度，都会改变最终样本数。

2.2 方法二，病例对照或队列研究的效能计算

当研究目标不是估计患病率，而是比较两组差异时，就进入分析性研究。常见的是病例对照研究和队列研究。此时样本量计算关注的是暴露率、效应量、α值和把握度。

知识库明确指出，病例对照研究有成组设计和配对设计两类，公式不同。队列研究则通常根据两组结局发生率的差异来估算。这类研究的样本量，不是看“有多少病例”，而是看“能不能检出差异”。

临床场景里很常见。比如你想研究某暴露因素与疾病的关联，如果样本太少，可能得出阴性结果，但并不代表没有关联，只是没有检出能力。样本量足够，才能提高把握度，降低假阴性风险。换句话说，样本量计算是在平衡统计学能力和现实成本。

3. 计算时最容易忽视的4个参数

3.1 预估率或效应量

对于横断面研究，通常需要预估患病率或均数。这个值可以来自文献，也可以来自预实验。对于病例对照或队列研究，则需要预估暴露率、结局发生率或效应量。参数不是凭空写出来的，必须有依据。

3.2 容许误差

容许误差决定研究精度。误差越小，样本量越大。知识库给出的经验范围中，分类资料可尝试取总体比例估计值的0.1倍或0.2倍。比如预估率30%，容许误差可先按3%试算。这是样本量计算中最敏感的参数之一。

3.3 置信度和α值

在多数医学研究中，α通常取0.05，对应95%置信度。这个设定在知识库的多个例子中都出现了。α值固定后，真正影响样本量变化的，往往是误差和效应量。

3.4 无应答率和脱落率

实际研究中，还要考虑无应答、失访和问卷不合格。比如知识库中的高尿酸血症研究，先算出基础样本量后，还要按无应答率和问卷合格率进行放大。理论样本量不等于实际招募量。

4. PASS软件计算样本量时的使用思路

4.1 软件只是工具，前提仍是设计明确

知识库提到PASS软件是常用工具。操作时，软件会先让你选择研究类型，再输入参数，最后给出结果。这个流程其实很重要。软件不会替你决定研究设计，也不会替你判断参数是否合理。

因此，写研究设计书时，不能只写“使用PASS软件计算样本量”。还要写清楚公式、参数、置信度、容许误差、软件版本等信息。这样做既方便复现，也更符合E-E-A-T要求。

4.2 横断面研究可以优先掌握

对医学生、医生和科研人员来说，最实用的是先掌握横断面研究的样本量计算。因为这类研究在流行病学调查和临床现况分析中最常见。知识库指出，对于简单的总体率和均数估计，公式其实并不复杂，很多情况下可以手算完成。软件适合验证结果，不是替代思考。

4.3 复杂抽样需要额外处理

如果是分层抽样、整群抽样或多阶段抽样，公式会更复杂。知识库明确提到，这类设计不适合简单套用基础公式。抽样设计越复杂，样本量越不能随意简化。

5. 写论文时，如何把样本量计算写得更专业

5.1 先写研究类型，再写参数来源

论文方法部分建议按以下顺序写：

研究设计类型。
主要结局指标。
参数来源，来自文献还是预实验。
公式或软件。
置信度、容许误差和最终样本量。

这种写法比单纯报一个数字更有说服力。

5.2 不要用结果倒推设计

知识库特别提醒，样本量估计应该在研究开始阶段完成，不建议研究结束后再反向补写。事后补样本量，容易被审稿人质疑。真正有价值的是，在设计阶段就证明你的样本量是合理的。

5.3 理论值和现实值要同时交代

如果理论样本量大于现有病例数，要说明数据来源有限、收集周期有限或纳入标准严格。若理论样本量较小，但实际纳入更多样本，也可以说明这是为了提高稳定性和分析能力。透明交代，比强行解释更可信。

总结Conclusion

医学研究样本量计算的关键，不是背公式，而是先选对研究设计，再选对参数。横断面研究更适合估计患病率和均数，病例对照或队列研究则更关注效应量和把握度。容许误差、预估率、脱落率，都会直接影响最终样本量。

对科研人员来说，真正实用的做法是把样本量计算前置到课题设计阶段，并在研究方案和论文方法部分写清楚依据。若你希望把样本量计算、研究设计和论文写作一次打通，可以结合解螺旋的课程与工具，提升设计效率和写作质量。医学科研团队围坐讨论研究方案，屏幕上显示样本量计算结果、论文框架和软件界面，体现专业协作与转化场景