队列研究/随机(非随机)对照试验
时间-事件结局:风险比(hazard ratio),基于Cox回归分析
示例1(来自文献2):
KrallUthoff and Harley (1975)研究了65例多发性骨髓瘤患者预后的影响因素一共9个变量(具体数据参见 sas phreg 过程中的数据集 Myeloma)。如研究者主要感兴趣的变量为 X1(logBUN)预估计其对数风险比 ln(HR)=1研究结束时死亡率 P=48/65=73.8%按照单侧0.05的检验水准和预期80%的检验效能估计所需的样本量的计算过程如下:① 估计 X1的标准差得σ=0.3126;② 对 X1和其他协变量作多重线性回归分析得 $R^2$=0.1839。根据计算,共需要纳入106例。
$\alpha$=0.05(单侧),Power=0.8,
$HR$=2.718282,$P$=0.738,$\sigma$=0.3126,$R^2$=0.1839。
$\alpha$=0.05(单侧),Power=0.8,
$HR$=2.718282,$P$=0.738,$\sigma$=0.3126,$R^2$=0.1839。
参数说明:
- $\alpha$,一类错误,检验水准,结果为假阳性的概率。α越小,即检验水准要求越高,正态分布对应的Z值越大,样本量要求越大。
- $\alpha$,有单双侧之分,双侧检验只关注是否存在差异,单侧检验既考虑是否存在差异,还关注差异的方向。两者的计算公式不同,可在计算器页面选择“单侧”或“双侧”进行切换。双侧$\alpha$=0.05,等价于单侧$\alpha$=0.025,对应的Z值均为1.96。 $$双侧检验的备择假设:HR\neq{1}$$ $$单侧检验的备择假设:HR>{1}或者HR<{1}$$
- $1-\beta$,检验效应,等于1-II类错误($\beta$),表示当存在差异时,假设检验能得到阳性结果的概率。一般要求检验效能在0.8以上,否则会出现非真实的阴性结果。
- $HR$,估计的风险比,可通过文献查阅。只输入HR时,仅能计算期望观察到的事件数,无法计算最终样本量。
- $P$,估计结局事件的发生率,可用于计算最终所需的样本量
- $\sigma$,若X为连续变量,假定 X服从正态分布计算标准差。 对于非正态分布的 X1如二项分布可通过$ \sqrt(p*(1- p))$进行估计这里p 表示 X取“0”或“1”的比例。
- $R^2$, R2 表示 X对其他协变量作回归分析时的确定系数(R方)取值范围0~1。当仅研究一个自变量X时,取0。
- 页面计算码:样本量计算花费开发者(黄桥)大量时间进行整理和网页开发,请关注作者个人公众号,发送“计算码”获取最新码。
计算公式(需输入计算码):
需纳入的人数(双侧检验)
$$N=\frac{(Z_{1-\alpha/2}+Z_{1-\beta})^2}{P*(1-R^2)*\sigma^{\:2}*ln(HR)^{\:2}}$$
需纳入的人数(单侧检验)
$$N=\frac{(Z_{1-\alpha}+Z_{1-\beta})^2}{P*(1-R^2)*\sigma^{\:2}*ln(HR)^{\:2}}$$