\ \

描述性横断面研究中的样本量估计

连续变量结局:单组均值
I类错误(双侧),Type I error,$\alpha$ *
估计总体标准差,Population standard deviation,$\sigma$ *
容许误差,Margin of error,$\delta$ *
样本量损耗比例,attrition rate,$AR$
页面计算码 *
示例:
     预调查肝硬化患者的血红蛋白含量,已知正常人群的人群血红蛋白标准差为3g/100ml,调查容许误差为0.2g./100ml,若检验水准$\alpha$=0.05(双侧),则需要抽取的样本量为865人,考虑到10%的数据不完整,最终纳入962人。

需要输入的参数:

α=0.05,$\sigma$=3,$\delta$=0.2,AR=0.1

参数说明:
  • $\alpha$,一类错误,检验水准,结果为假阳性的概率。α越小,即检验水准要求越高,正态分布对应的Z值越大,样本量要求越大。
  • $\sigma$,预期总体的变异程度(标准差),可以通过查阅文献或者小规模的预调查估计。
  • $\delta$,容许误差,等于预测参数的置信区间宽度的一半,反映调查结果精确性的要求。容许误差越大,所需样本量就越小。
  • $AR$,预估失访、数据不完整等原因导致实际样本量减小的比例,常取0.1或0.2。

  • 页面计算码:样本量计算花费开发者(黄桥)大量时间进行整理和网页开发,请关注作者个人公众号,发送“计算码”获取最新码。
计算公式(需输入计算码):

$$n=\frac{(Z_{\alpha/2}*\sigma)^2}{\delta^2} $$ 最终样本量: $$样本量=\frac{n}{1-AR}$$


参考文献:

[1] 彭晓霞 等,临床流行病学,北京大学出版社,2013.