样本量计算为什么不能先问公式？

因为样本量必须先确定研究设计和主要结局，不同研究类型对应的计算方法不同。

容许误差和把握度会怎样影响样本量？

容许误差越小、把握度越高，所需样本量通常越大。

为什么样本量计算时不能直接照搬文献患病率？

因为文献数据未必适用于你的研究人群，需结合自身对象和研究背景重新设定参数。

样本量计算常见问题为何总出错？7点严谨解答

作者：Dr.Lin

2026-05-21｜原创

引言Introduction

样本量计算常见问题，往往不是公式不会，而是研究设计、参数设定、软件选择 三者没有对齐。对医学生、医生和科研人员来说，这会直接影响课题立项、伦理审批和投稿结果。下面用7个高频误区，帮你把样本量计算常见问题一次讲清。

科研人员在电脑前核对研究设计、样本量公式和PASS软件界面，旁边放有论文和统计学书籍，体现“设计先行、公式匹配”

1. 为什么样本量计算常见问题总卡在“先问公式”？

1.1 先定研究设计，再选公式

样本量计算常见问题里，最典型的一类就是一上来就问“用哪个公式”。但样本量不是脱离研究设计单独存在的 。横断面调查、病例对照研究、队列研究、随机对照试验，计算思路都不同。

比如横断面调查常用于估计患病率或均数，不设对照组。病例对照研究则要先明确病例与对照的来源和比例。不先说研究类型，就无法判断该用哪类公式。 这也是审稿人最容易追问的地方。

1.2 设计不同，误差来源也不同

横断面研究更关注抽样误差。病例对照研究更关注暴露差异。队列研究常要考虑结局发生率。RCT则常围绕差异检验、优效或非劣效设定。

结论很简单：样本量计算常见问题的第一步，不是算，而是定义研究问题。
如果研究设计没定，后面所有数字都可能失真。

2. 为什么“有100例就够了”常被质疑？

2.1 现实样本不等于合理样本

很多临床研究者会说，手头只有100例病例。这个情况可以理解，但**“现有样本”不能自动等于“足够样本”** 。审稿人通常会问两个问题。第一，为什么是100例而不是200例。第二，这100例是否达到统计学要求。

如果公式估算结果低于100例，说明现有样本可能够用。若理论样本量高于100例，就需要补充病例，或在讨论中解释现实约束和研究局限。不能只用“医院一年只有100例”来替代样本量论证。

2.2 样本量是为研究目的服务的

样本量的核心不是“尽量多”，而是达到预设精度和把握度 。
这也是样本量计算常见问题中最容易被误解的一点。

研究前，你对结果只能做估计。比如你预计某病患病率约为10%。样本量就是为了让最终结果有足够把握接近这个估计，并把抽样误差控制在可接受范围内。

3. 为什么容许误差设得不对，结果会差很多？

3.1 容许误差越小，样本量越大

在比例或均数的估计中，容许误差直接影响样本量。误差越小，所需样本越大。 这是最基本的统计规律。

例如，课程中提到某地区乙肝表面抗原携带率预计为10%，希望误差不超过1%，计算得到样本量约3458例。这里的重点是，研究者想要的是9%到11%的区间，而不是更宽的范围。区间越窄，样本越大。

3.2 误差必须和研究目标一致

样本量计算常见问题里，常有人把容许误差理解成“随便取一个小数”。这不严谨。容许误差应结合专业意义、预试验结果和既往文献。

对计量资料，常见做法是依据标准差和允许误差设定。对计数资料，常根据预计率的0.1倍、0.2倍等经验值尝试。误差不是越小越好，而是要与研究价值匹配。

4. 为什么“文献里有现成患病率”也不能直接照抄？

4.1 文献数据未必适用于你的对象

很多人看到文献里写着患病率10%，就直接拿来算样本量。但外部文献的概率不一定适用于你的研究人群 。地区、年龄、民族、纳排标准都可能不同。

比如同样是糖尿病患病率，城市人群、农村人群、老年人群和住院人群差异都可能很大。文献只能作为参考，不能替代你自己的研究假设。

4.2 估计值本身允许有合理区间

研究开始前，预估本来就带有猜测成分。只要有文献或专家依据，5%、10%、15%都可能是可接受的起始估计。关键是你要说明为什么这样设定 。

这也是样本量计算常见问题中最需要写进研究设计书的部分。包括预计率、容许误差、α值、把握度和依据来源。不是算完就结束，而是要让别人看得懂你为什么这样算。

5. 为什么把握度和α设错，会让样本量失真？

5.1 把握度越高，样本量越大

把握度，也就是 power，通常取0.8或0.9。它反映的是“检验出真实差异”的能力。把握度越高，要求越严格，样本量就越大。

如果把握度设得过低，研究更容易出现假阴性。对临床研究来说，这会导致一个本来存在差异的方案，被误判为“没有差异”。

5.2 α越小，要求越严格

α是允许把真的当假的概率，通常取0.05。α越小，样本量越大。 双侧检验通常比单侧检验需要更多样本。

所以，样本量计算常见问题不只是“公式错了”，也可能是α、β、把握度这些基础参数没有讲清楚。先明确统计目标，再计算样本量，才是严谨路径。

6. 为什么软件算出来和手算不完全一样？

6.1 软件是工具，不是答案本身

PASS等软件可以快速计算样本量，但不同算法、不同近似方法，结果可能略有差异。比如比例估计中，精确法、Wilson法、渐近法，得到的数值不一定完全一致。

这不代表软件错了，也不代表公式错了。
而是因为计算方法本身存在不同近似路径。

6.2 写方案时要记录清楚方法

样本量计算常见问题里，最容易被忽略的是方法学记录。研究设计书中应写明：

使用的软件版本。
采用的公式或模块。
输入参数。
置信水平或α值。
容许误差。
预计率或标准差。

可重复，才算真正严谨。 这也是E-E-A-T要求下，研究可信度的重要组成部分。

7. 为什么横断面研究、病例对照研究、队列研究不能混用公式？

7.1 研究类型决定变量结构

横断面研究常用于估计患病率或均数。病例对照研究主要看暴露与疾病之间的关联。队列研究则常从暴露出发，观察结局发生。

不同设计的变量结构不同，样本量公式自然不同。
如果把病例对照研究的数据直接套成横断面公式，结果往往会偏。

7.2 多阶段抽样更不能照搬简单公式

在公共卫生场景中，分层抽样、整群抽样、多阶段抽样很常见。这些设计会引入设计效应，样本量要进一步调整。简单随机抽样的公式不能直接照搬。

因此，样本量计算常见问题中最危险的误区，不是“算不出来”，而是“算得很快但错得很隐蔽”。复杂抽样一定要先确认设计，再谈公式。

8. 为什么写了样本量，审稿人还是会追问？

8.1 只报数字，不报依据，等于没写

审稿人关心的不只是“你算出多少”，而是“你怎么得出这个数”。如果只写“样本量为200例”，但没有参数、公式和依据，可信度很低。

完整表达通常应包括：

研究设计类型。
主要结局指标。
预计率或标准差来源。
α值和把握度。
容许误差或效应差。
软件和版本。

这不是格式要求，而是研究可信度要求。

8.2 结果不足时，要提前预留解释空间

如果实际纳入样本少于理论值，也不是完全不能发表。但你需要说明原因，比如病例来源有限、纳入周期受限、现实可行性约束等。最好在方案阶段就预留应对策略。

这也是样本量计算常见问题的最后一道防线。先把逻辑做扎实，后面才有解释空间。

总结Conclusion

样本量计算常见问题，本质上都指向同一件事，研究设计没有先行，参数没有定义清楚，方法没有记录完整 。只要把研究类型、主要结局、α、把握度、容许误差和软件方法一一对齐，大多数错误都能避免。

对于医学生、医生和科研人员来说，样本量不是单独的统计操作，而是研究方案的核心部分。若你希望把样本量计算常见问题讲得更规范、更适合论文和标书写作，可以进一步结合解螺旋的研究设计与统计方法工具，帮助你快速梳理思路、减少返工。

研究者在会议桌前展示完整的样本量计算流程图，旁边有“研究设计、参数、软件、结果”四个模块，体现规范化写作与论文投稿场景