临床研究的样本量是不是越大越好？

不是。样本量需要在研究目的、统计效能和可行性之间平衡，还要考虑经费、招募、失访和伦理因素。

两组比较研究做样本量计算时，最重要先确定什么？

先确定主要终点。只有明确主要终点，才能结合效应量和预期差异进行合理计算。

Cox回归做样本量计算时，要重点看什么？

要重点看终点事件数，而不只是总样本数。对生存分析来说，事件数通常比总人数更关键。

样本量计算最强攻略：4类场景怎么定？

作者：Dr.Chuang

2026-05-20｜原创

引言Introduction

样本量计算是临床研究最容易踩坑的一步。样本太少，效能不足，结果不稳。样本太多，又浪费经费和时间。对医学生、医生和科研人员来说，真正难的不是“算公式”，而是“在统计学、法规和现实条件之间做平衡”。
临床研究团队在会议桌前讨论样本量计算，旁边有统计图表、Excel表格和研究方案文件。

1. 为什么样本量计算不能只看公式

1.1 样本量不是越大越好

样本量计算的本质，是在研究目的、统计效能和可行性之间找平衡。理论上，样本越多，估计越稳定，检验效能越高。但临床研究不是纯数学题。经费、招募速度、依从性、伦理风险，都会限制最终例数。

因此，初步样本量只是起点，最后入组例数还要结合实际条件调整。
如果是新药临床试验，还要同时满足相应法规要求，不能只按统计结果机械执行。

1.2 先明确你在做哪一种研究

不同研究设计，样本量计算逻辑不同。常见场景至少有4类。

描述性研究。
两组比较研究。
相关性或回归分析。
生存结局或终点事件研究。

先分清场景，再谈样本量计算，才不会算错方向。

2. 描述性研究怎么做样本量计算

2.1 估计总体特征时，核心是精度

描述性研究常见目标是估计率、均值或构成比。此时样本量计算重点不是“检验差异”，而是“让估计足够精确”。
如果研究想报告某疾病患病率、某指标均值，样本越小，置信区间越宽，结果越不稳定。

2.2 经验上如何把握规模

在没有复杂设计时，描述性研究常先根据预期比例、允许误差和置信水平估算，再结合实际资源调整。
如果是临床观察或初步调查，至少要保证样本能支撑稳定估计，否则结论价值会明显下降。

对于很多科研新人来说，问题不在于不会输入公式，而在于没有先定义“主要指标”和“允许误差”。样本量计算之前，必须先把这两个问题说清楚。

3. 两组比较研究的样本量计算

3.1 先确定主要终点

两组比较是临床研究中最常见的样本量计算场景。比如比较两组均值、率或生存差异。
这里最关键的是预先定义主要终点，否则样本量计算会失去依据。

例如，比较两组治疗后HbA1c差异时，主要终点就是HbA1c变化值。
比较两种方案的有效率时，主要终点就是有效率。
主终点一旦明确，样本量计算才能进入可执行阶段。

3.2 样本量受效应量影响很大

样本量计算与效应量关系密切。效应量越小，通常需要的样本越多。
这也是很多临床研究难以启动的原因。研究者对真实差异预期过高，会导致低估样本量，最终出现统计效能不足。

在方案设计中，常见做法是结合既往文献、预实验或真实世界数据，给出一个合理差异值，再进行样本量计算。
不要凭感觉设定差异，也不要故意把差异写得过大。

4. 多因素分析的样本量计算怎么估

4.1 这类问题常用经验性估计

多因素分析包括 Logistic 回归、Cox 回归、多元线性回归等。
这类模型的样本量计算并不总能依赖单一可靠公式，实践中常采用经验性估计。

上游知识库提示，常见经验是按自变量个数的5倍、10倍或20倍来估计。
例如有10个自变量，按1:10，至少约100例。按1:20，至少约200例。
这是多因素分析里最常见、也最容易被忽视的样本量计算原则之一。

4.2 Cox回归要看终点事件数

Cox 回归不能只看总样本数，更要看事件发生数。
如果终点是死亡、复发或并发症，那么样本量计算的核心是“要观察到多少个事件”。

例如按1:10的经验规则，若有10个自变量，通常至少要观察到100个终点事件。
按1:20，则通常要观察到200个终点事件。
对生存分析来说，事件数比总人数更关键。

4.3 自变量不要贪多

多因素模型里，自变量越多，对样本量要求越高。
如果样本不足，模型容易不稳定，出现过拟合，结果在外部数据中难以复现。
因此，样本量计算不只是“算数”，还是变量筛选策略的一部分。

研究者应优先保留临床意义明确、文献支持充分的变量。
变量越精简，模型越稳，样本量压力也越小。

5. 临床研究里，样本量计算还要做哪些调整

5.1 统计学结果不是最终结果

根据知识库内容，初步样本量计算后，还要根据法规要求、预算、受试者依从性和伦理因素做调整。
这一步非常重要。因为一个“统计上足够”的方案，未必“现实中可执行”。

例如招募困难、失访率高、随访周期长，都会让最终有效样本下降。
所以在样本量计算时，通常要预留一定脱落空间。

5.2 脱落和失访必须提前考虑

临床研究不能只算理论值。
如果研究预计有失访、退出或方案违背，就要在样本量计算时上调入组数。
这样才能确保最后分析时仍有足够样本。

很多研究最后失败，不是因为设计思路错，而是因为没有给脱落留余量。

5.3 资源有限时怎么处理

现实中，经费、时间、人力往往有限。
这时的策略不是盲目扩大样本，而是优先保证研究问题聚焦、终点清晰、变量精简。
在可行前提下，再优化样本量计算方案。

如果研究是临床SCI发表导向，样本量大小也会影响论文竞争力。
知识库中提到，临床研究里样本量是常见门槛之一。一般而言，200例在统计上已较有竞争力，80例可视为基础水平。若瞄准更高分区，通常需要更强的数据支撑。
但这不意味着越大越好，仍要回到研究目的本身。

6. 样本量计算的实操步骤

6.1 先做四步准备

做样本量计算前，建议按下面顺序梳理。

明确研究类型。
明确主要终点。
估计效应量或事件率。
设定脱落率和可行边界。

这四步完成后，再进入公式或软件计算，会更稳妥。

6.2 常用工具要选对

知识库中提到，PASS 是常用的样本量计算工具，尤其适合临床研究场景。
它适合做比较、回归、生存分析等多类设计。
对于临床研究人员来说，PASS 是实用性很强的软件选择。

但要注意，软件只是工具。
输入参数是否合理，才决定结果是否可靠。
如果终点、效应量或脱落率设得不合理，再好的软件也算不出好方案。

6.3 最后要回到研究问题

样本量计算不是论文里的装饰项，而是研究质量的底层结构。
它决定了你的结果能不能被信任，结论能不能被复现，方案能不能顺利执行。

真正专业的样本量计算，不是追求一个漂亮数字，而是让数字服务于研究目的。

总结Conclusion

样本量计算看似是统计问题，实则是临床研究设计的核心环节。描述性研究看精度，两组比较看效应量，多因素分析看自变量和事件数，Cox回归更要看终点事件。再加上法规、预算、失访和伦理因素，才能得到真正可执行的研究例数。
科研人员在电脑前使用PASS软件进行样本量计算，屏幕显示回归分析和生存分析界面，桌面上有研究方案和发表指南。

如果你正在做临床研究，却卡在样本量计算、方案设计和统计路径上，可以借助解螺旋品牌的专业支持，把研究目标、终点选择和样本量方案一次梳理清楚。把复杂问题交给系统方法，才能更快做出可发表、可执行的研究设计。