样本量计算为什么必须先确定研究设计？

因为不同研究设计对应的样本量公式和参数不同，必须先明确是横断面、病例对照还是随机对照试验，才能正确计算。

横断面研究估计患病率时，样本量主要由哪些参数决定？

主要由预计患病率P、允许误差Δ和显著性水平α决定；误差越小，所需样本量越大。

病例对照研究和随机对照试验的样本量计算重点有什么不同？

病例对照研究主要看对照组暴露率和病例组暴露率；随机对照试验主要看主要结局、组间差异或效应量、标准差、α、把握度和脱落率。

样本量计算实例怎么做？4例解析

作者：Dr.Lin

2026-05-21｜原创

引言Introduction

样本量算少了，研究没把握度，结果不稳。算多了，费钱费力，还可能增加伦理负担。“样本量计算实例” 正是很多医学生、医生和科研人员最常卡住的一步。下面用4个常见场景，讲清楚研究设计、参数选择和计算思路。
医学研究场景图，包含论文、统计软件界面、病历数据表和样本量公式示意，突出“研究设计与样本量计算”的专业氛围

1. 为什么样本量计算必须先看研究设计

1.1 先定研究类型，再定公式

样本量计算实例 不能脱离研究设计单独讨论。横断面研究、病例对照研究、队列研究、随机对照试验，使用的公式和参数都不同。先说清楚研究类型，才知道该套用哪一种方法。

知识库强调，很多人直接问“我做病例研究，样本量怎么算”，这个问题不完整。更合理的做法是先明确研究设计，再查对应章节或使用软件计算。

1.2 样本量不是越大越好，也不是越小越省

样本太少，结论容易受抽样误差影响。比如只调查2个人，其中1人患病，算出来的患病率就是50%，显然不可靠。样本太大，又会增加工作量、成本和伦理压力。

样本量计算的核心，是让结果在统计学上可接受，并尽量贴近真实总体。 这也是审稿人最常追问的点之一。

2. 例1：横断面研究，估计患病率

2.1 适用场景

横断面研究常用于调查某一时间点的患病率或平均值，比如高血压患病率、糖尿病患病率、青少年平均身高。它不设对照组，适合描述现状，但不能直接推断因果关系。

在这类研究里，样本量计算实例 最常见的就是“估计总体率”。

2.2 计算思路

知识库给出的例子是：某市区乙肝表面抗原携带率预计为10%，希望误差不超过1%。按公式计算，样本量约为3458例。这里的关键不是记住数字，而是记住参数逻辑。

你需要明确三项内容：

预计患病率P。
允许误差Δ。
显著性水平α。

如果误差设得更小，样本量会明显增加。误差越严格，所需样本量越大。

2.3 写作时怎么表述

论文中应写清楚公式、参数来源和设定依据。比如预计患病率可来自文献或专家经验。知识库也提醒，文献数据不一定完全适用于你的目标人群，所以需要结合本地实际。

3. 例2：横断面研究，估计均数

3.1 适用场景

如果研究目标不是比例，而是连续变量，比如血糖、白细胞计数、身高均值，就要按均数估计来算。知识库指出，这类情况通常需要标准差，而不是均值本身。

3.2 计算思路

以某工厂白细胞总数平均水平为例，若文献提供标准差0.95×10^9/L，允许误差为0.1×10^9/L，就可据此计算样本量。这里的重点是：

估计均数时，最关键的参数是标准差和允许误差。

标准差越大，说明个体差异越明显，样本量通常也会增加。误差越小，样本量同样会上升。这个逻辑在所有均数型研究中都适用。

3.3 研究设计书里要写什么

建议写明：

预估标准差的来源。
允许误差的设定依据。
双侧还是单侧。
采用的公式或软件版本。

样本量计算实例 在方法学部分写得越具体，后面越不容易被审稿人质疑。

4. 例3：病例对照研究，先定义暴露比例

4.1 适用场景

病例对照研究常用于分析某种暴露与疾病之间的关联。比如吸烟与肺癌、某暴露因素与某疾病风险之间的关系。它和横断面研究不同，核心不是“有多少人患病”，而是“病例组和对照组的暴露差异有多大”。

4.2 计算思路

知识库提示，这类研究的样本量计算需要先明确设计类型，然后根据对应公式输入参数。常见参数包括：

对照组暴露率P0。
病例组暴露率P1。
α和把握度。

如果你只说“我有100个病例”，通常还不够。 审稿人更关心的是，这100例是否达到理论所需样本量。如果计算结果提示应有200例，你就需要补充病例，或者说明现实限制下为何100例仍可接受。

4.3 实务建议

病例对照研究最容易犯的错，是在研究开始后才补做样本量说明。更规范的做法是，在方案阶段就完成计算，并把参数依据写清楚。这样论文更符合E-E-A-T中的专业性和可信度要求。

5. 例4：随机对照试验，先看效应量和把握度

5.1 适用场景

随机对照试验中，样本量通常取决于主要终点、组间差异、标准差、α和把握度。知识库明确提到，样本量先按统计学原理得到初步结果，再结合法规要求、经费预算、依从性和伦理因素进行调整。

5.2 计算思路

这类 样本量计算实例 的关键不在于“人多一点”，而在于“是否足以检测到预期差异”。如果预期差异很小，就需要更大的样本；如果效应量较大，样本需求可能下降。

你在方案里至少要交代：

主要结局指标。
预期组间差异或效应量。
预估标准差。
α和把握度。
脱落率调整。

5.3 为什么要预留脱落

临床研究中，受试者退出、失访、依从性差都很常见。所以最终纳入数通常要在理论值基础上上调。初步样本量只是起点，不是终点。

6. 如何提高样本量计算的可信度

6.1 参数来源要可追溯

无论是哪种研究，参数都不应凭空写出。最好来自文献、预实验或专家经验，并在方案中注明来源。这样更符合科研规范，也更容易通过伦理和审稿。

6.2 工具只是工具，逻辑才是核心

知识库提到，PASS软件可以用于计算样本量，但软件结果依赖你输入的参数。也就是说，真正决定结果的不是软件，而是你对研究问题和设计的理解。

6.3 先做最小可行计算，再做现实调整

统计学上算出的例数，往往还要结合现实条件调整。对于临床研究，最重要的是在“可实施”和“足够有力”之间找到平衡。这个过程应在方案阶段完成，而不是研究结束后补写。

总结Conclusion

样本量计算实例的本质，是把研究问题、研究设计和统计参数一一对应起来。 横断面研究看患病率或均数，病例对照研究看暴露比例，随机对照试验看效应量和把握度。只有先定设计，再选公式，样本量才算得可靠。

如果你正在写方案、开题或论文方法学部分，却还不确定该用哪种计算方式，建议直接借助解螺旋的科研支持工具或课程体系，把研究设计、公式选择和参数记录一次性理顺。这样更省时间，也更容易让论文通过审核。
科研人员在电脑前查看样本量计算结果，旁边有研究方案、统计表格和论文方法学页面，突出“规范计算、落地执行”