\

诊断准确性试验设计

平行设计中两组ROC比较(两组样本量相等)的样本量估计
I类错误(默认双侧),Type I error,$\alpha$ *
检验效能,Power,$1-\beta$ *
组1ROC曲线下面积,AUC,$\theta_{1}$ *
组2ROC曲线下面积,AUC,$\theta_{2}$ *
未患病人数和患病人数之比,Ratio,$R$ *
计算方法,Method *
页面计算码 *
示例1:
    参考文献1中的示例: 在一项比较CTC(计算机断层扫码结肠成像)和CTC结合计算机辅助成像CAD两种方法诊断息肉的准确度比较研究,阅片者根据结果给出0~5的评分(检验结果),光学结肠镜检查视为金标准(是和否)。假设CTC诊断的AUC=0.8,CTC+计算机辅助的AUC=0.9,采用1:1平行设计并按照有息肉:无息肉=1:1纳入受试者,I类错误为5%(双侧),检验效能为80%,采用Obuchowski法估计样本量。则CTC组需要息肉患者和无息肉患者各175人,CTC+CAD组同样需要息肉患者和无息肉患者各175人,共计700人。
$\alpha$=0.05(双侧),$power$=0.9
$\theta_{1}$=0.8,$\theta_{1}$=0.9,$R$=1,方法选择Obuchowski法
示例1:
    参考文献1中的示例: 在一项比较CTC(计算机断层扫码结肠成像)和CTC结合计算机辅助成像CAD两种方法诊断息肉的准确度比较研究,不确定试验结果的潜在分布,光学结肠镜检查视为金标准(是和否)。假设CTC诊断的AUC=0.8,CTC+计算机辅助的AUC=0.9,采用1:1平行设计并按照有息肉:无息肉=1:1纳入受试者,I类错误为5%(双侧),检验效能为80%,采用Blume法估计样本量。则CTC组需要息肉患者和无息肉患者各234人,CTC+CAD组同样需要息肉患者和无息肉患者各234人,共计936人。
$\alpha$=0.05(双侧),$power$=0.9
$\theta_{1}$=0.8,$\theta_{1}$=0.9,$R$=1,方法选择Blumei法

参数说明:
  • $\alpha$,一类错误,检验水准,结果为假阳性的概率。α越小,即检验水准要求越高,正态分布对应的Z值越大,样本量要求越大。
  • $\alpha$,有单双侧之分,双侧检验只关注是否存在差异,单侧检验既考虑是否存在差异,还关注差异的方向。两者的计算公式不同,可在计算器页面选择“单侧”或“双侧”进行切换。双侧$\alpha$=0.05,等价于单侧$\alpha$=0.025,对应的Z值均为1.96。 $$双侧检验的备择假设:AUC_{1}\neq{AUC_{1}}$$ $$单侧检验的备择假设:AUC_{1}>{AUC_{2}}或者AUC_{1}<{AUC_{2}}$$
  • $1-\beta$,检验效应,等于1-II类错误($\beta$),表示当存在差异时,假设检验能得到阳性结果的概率。一般要求检验效能在0.8以上,否则会出现非真实的阴性结果。
  • $\theta_{1}和\theta_{2}$,预估的诊断方法的ROC曲线下面积,可以通过查文献或预实验获取。
  • $R$,表示组内“无病”与“有病”受试者例数的比例。
  • 计算方法(方法详情见计算公式部分):
    • Obuchowski 1994:基于双正态分布计算样本量的方差函数,适用于参数和非参数法估计的ROC,在有序和连续测量结果中的效果较好。
    • Blume 2009:提供另外一种比较两种诊断方法的方差函数,可使试验结果在任何潜在分布下所需的样本量达到最小。

  • $\theta$,预估计的ROC曲线下面积(AUC)的值,可通过文献和预实验估计。
  • $k$,最终纳入人群中患病人数和患病人数之比。

  • 页面计算码:样本量计算花费开发者(黄桥)大量时间进行整理和网页开发,请关注作者个人公众号,发送“计算码”获取最新码。

计算公式(需输入计算码):
1、估计所需患病人数(双侧检验)
$$n_{disease}=\frac{\{Z_{1-\alpha/2}*\sqrt{V_{O}(\hat{\theta_1}-\hat{\theta_2})}+Z_{1-\beta}*\sqrt{V_{A}(\hat{\theta_1}-\hat{\theta_2})}\}^2}{(\theta_1-\theta_2)^2}$$
1、估计所需患病人数(单侧检验)
$$n_{disease}=\frac{\{Z_{1-\alpha}*\sqrt{V_{O}(\hat{\theta_1}-\hat{\theta_2})}+Z_{1-\beta}*\sqrt{V_{A}(\hat{\theta_1}-\hat{\theta_2})}\}^2}{(\theta_1-\theta_2)^2}$$

其中, $V_{O}(\hat{\theta_1}-\hat{\theta_2})$是无效假设下ROC差值的方差函数,$V_{A}(\hat{\theta_1}-\hat{\theta_2})$是备择假设下ROC差值的方差函数,两者的一般形式为: $$V(\hat{\theta_1}-\hat{\theta_2})=V(\hat{\theta_1})+V(\hat{\theta_2})-2C(\hat{\theta_1}, \hat{\theta_2})$$

本场景为非配对设计,两种诊断方法使用在不同的受试者身上,则$C(\hat{\theta_1}, \hat{\theta_2})=0$。

(1)若基于双正态分布(Obuchowski 1994)估计$\theta_1$或$\theta_2$方差函数, $$\hat{V}(\hat{\theta})=(0.0099*e^{-a^{2}/2})*[(5*a^{2}+8)+(a^{2}+8)/R]$$ 其中,a为双正态分布中的参数,并假定非患病组和患病组的方差相同,则: $$a=\Phi^{-1}(\theta)*1.414$$

(2)试验结果满足任意分布时(Blume 2009),估计方差为(平行设计,非配对): $$V_{O}(\hat{\theta_1}-\hat{\theta_2})=\theta_1(1-\theta_1)+\theta_1(1-\theta_1)$$ $$V_{A}(\hat{\theta_1}-\hat{\theta_2})=\theta_1(1-\theta_1)+\theta_2(1-\theta_2)$$


2、依据患病人数计算总人数:
$$N=(1+R)*n_{disease}$$

参考文献:

[1] 侯艳,李康等(译者). 诊断医学中的统计学方法(第二版). 高等教育出版社. 第六章,P157-P159
[2] Obuchowski, N A. “Computing sample size for receiver operating characteristic studies.” Investigative radiology vol. 29,2 (1994): 238-43. doi:10.1097/00004424-199402000-00020
[2] Blume, Jeffrey D. “Bounding Sample Size Projections for the Area Under a ROC Curve.” Journal of statistical planning and inference vol. 139,1 (2009): 711-721. doi:10.1016/j.jspi.2007.09.015