样本量估计的知识


1、理论基础

临床研究的重复原则(replication):在相同的实验条件下进行多次研究或多次观察,以提高实验的可靠性与科学性。

  • 研究本身的重复:确保试验的重现
  • 观测的重复:确保观察结果的精度
  • 研究对象的重复
    • 避免将个别情况当成普遍情况;
    • 避免将偶然或巧合的现象当成必然规律;
    • 使结果具有稳定性,确保假设检验达到预设的检验效能;

样本量估计(sample size estimation/determination):在满足统计的准确性和可靠性(控制I类错误,保证检验效能)计算出的所需的样本量。

  • 样本量过小:无论试验结果是否存在差异,均不能排除因机遇(随机误差)造成的假阳性或假阴性错误。同时,样本量过少:结果不稳定,检验效能过低,结论缺乏充分依据。
  • 样本量过大:增加临床研究难度,造成人力、无力、时间和经济上的浪费,伦理问题,一些临床意义不大的微弱疗效最终也可能会出现统计学上的显著差异。


2、需要考量的因素(包括但不限于)

  • 试验设计部分(基于研究目的)
    • 设计类型:单组、前后、平行、析因等
    • 比较类型:差异、优效等
    • 对照的选择:安慰剂、阳性对照等
    • 多组分配比例:1:1等
    • 结局指标类型:连续变量、分类变量、时间-事件变量等
  • 比较参数部分
    • 效应指标类型:均数差、相关系数、OR、RR和RR等
    • 效应量的大小:差异大小等
    • 变异程度:受试者之间的效应量的变异大小
  • 统计特征部分
    • 检验水准:0.05,单侧?双侧?
    • 检验效能:80%?90%?
  • 实施部分
    • 剔除率
    • 脱落率
    • 依从率

3、研究设计类型

诊断试验:可以设计为横断面设计,也可以设计为随机对照试验。
描述性研究:包括现况调查、个案调查、病例报告、暴发与流行调查、生态学研究和筛检等。


4、结局变量类型

计数资料(Categorical data):研究不同类别或属性中频数的多少或频率大小所获得的资料,特点是没有度量衡单位,表现为多个互不相容的属性或类别。又称定性资料(Qualitative data )或名义资料(Nominal variable)。如,是否治愈的二分类结局。

计量资料(measurement data):观测每个观测单位某项指标的大小而获得的资料,一般有度量单位。其中,连续性变量是指在一个连续区间可取无限个可能的值(如BMI),离散型变量则表示只能取整数(如病死数)。又称定量资料(quantitative data)或数值变量(numerical variable)。如,是否治愈的二分类结局。如,血压水平。

等级资料(ranked data):将观测单位按某种属性的不同程度分为等级后,在分类汇总各组观测单位数后得到的资料,表现为等级大小或属性程度。又称半定量资料(semi-quantitative data)或有序分类变量(ordinal categorical variable)。如呼吸系统疾病的结局指标:6=死亡、 5=住院,需要ECMO和/或IMV、 4=住院,需要NIV和/或HFBC治疗、 3=住院,需要补充氧气(但不需要NIV/HFBC)、 2=住院,不需要补充氧气、 1=出院或达到出院标准。

时间-事件结局变量:同时考虑是否发生结局事件(二分类变量)和多长事件发生该结局(时间变量)。如,总生存率OS


5、 效应指标类型(取决于结局变量类型)

点击此处在《循证医学》课程第四章了解效应指标的更多内容

计量资料结局的效应指标:

单组(配对)效应指标: 均数、中位数
差异性分析的效应指标: 均数差、标准化均数差
相关性分析的效应指标: 相关系数

二分类变量和时间-事件结局变量:

单组率的指标: 发病率、患病率等
RCT和队列研究:
        二分类事件结局: 相对危险度RR、危险度差RD
        时间-事件结局: 风险比HR、KM曲线、中位生存时间、特定时间生存率
病例对照研究的指标: 比值比OR
横断面研究的指标: 患病比PR、患病比值比POR

诊断试验的效应指标:

准确性评价指标: 灵敏度、特异度
诊断价值评价指标: 阳性预测值、阴性预测值
综合指标: 准确度、诊断比值比、阳性似然比、阴性似然比、ROC曲线及AUC