描述性横断面研究中的样本量估计

二分类变量结局:单组率(如患病率)
I类错误(双侧),Type I error,$\alpha$ *
估计比例,Population proportion,$p$ *
容许误差,Margin of error,$\delta$ *
样本量损耗比例,attrition rate,$AR$
总体大小,Population size,$N$
页面计算码 *
示例:
     本研究为横断面设计,结局指标为患病率。根据前期文献,预期目标人群某病的患病率p约为25.11%,α取0.05,容许误差$\delta$取0.1*p,总体大小未知,根据公式估计所需样本量大约为1146人。考虑到10%的数据不完整,最终纳入1274人。

需要输入的参数:

α=0.05,p=0.2511,$\delta$=0.02511,AR=0.1


参数说明:
  • $\alpha$,一类错误,检验水准,结果为假阳性的概率。α越小,即检验水准要求越高,正态分布对应的Z值越大,样本量要求越大。
  • $p$,预期现患率,可以通过查阅文献或者小规模的预调查得到。
  • $\delta$,容许误差,等于预测参数的置信区间宽度的一半,反映调查结果精确性的要求。容许误差越大,所需样本量就越小,一般采用d=0.1×p。
  • $AR$,预估失访、数据不完整等原因导致实际样本量减小的比例,常取0.1或0.2。
  • $N$,总体大小,一般未知,使用无限总体的计算公式。当明确总体个数时,输入对应值,可采用有限总体的计算公式。
  • 注意: 率的样本量计算公式仅适用于n×p>5的情况,如果n×p≤5则宜用Poisson分布的方法来估算样本量,可采用“Poisson分布期望值的可信限简表”进行样本量确定。

  • 页面计算码:样本量计算花费开发者(黄桥)大量时间进行整理和网页开发,请关注作者个人公众号,发送“计算码”获取最新码。
计算公式(需输入计算码):

未知总体: $$n=\frac{Z_{\alpha/2}^2*(p)*(1-p)}{\delta^2}$$ 最终样本量: $$样本量=\frac{n}{1-AR}$$

有限总体: $$n=\frac{Z_{\alpha/2}^2*(p)*(1-p)*N}{\delta^2*(N-1)+Z_{\alpha/2}^2*(p)*(1-p)} /(1-r)$$ 最终样本量: $$样本量=\frac{n}{1-AR}$$

参考文献:

[1] Kotrlik, J. W. K. J. W., & Higgins, C. C. H. C. C. (2001). Organizational research: Determining appropriate sample size in survey research appropriate sample size in survey research. Information technology, learning, and performance journal, 19(1), 43.