【学术成果】统计中心20级博士生卢鑫在Biometrika发表论文解决群组随机化下的重随机化方法的相关理论问题

近日,清华大学统计学研究中心刘汉中副教授课题组在国际知名统计学期刊Biometrika发表题为“Design-based theory for cluster rerandomization”的研究论文。清华大学统计学研究中心2020级博士研究生卢鑫是该文的第一作者,哈佛大学博士研究生刘天乐是第二作者,刘汉中副教授与加州大学伯克利分校的丁鹏副教授共同指导了相关研究与论文撰写。

群组随机化试验被广泛地应用在社会科学、公共卫生等领域。它可以避免群组内部试验个体之间的交互,是在个体水平的处理分配不可实施的情形下一种替代的试验设计方法。群组随机化试验在群组的水平分配处理,同一个群组内部的个体会分配到同一个处理。群组重随机化是在群组随机化试验中运用重随机化的试验设计方法,通过丢弃掉不平衡的分配方式来达到平衡协变量的目的。重随机化最常用的平衡性准则有马氏距离准则,加权欧氏距离准则和多层马氏距离准则。马氏距离准则把各个协变量看成是同等重要的。当存在协变量重要程度的先验信息时,加权欧氏距离准则和多层马氏距离准则是更常用的方法。

该论文首先研究了群组重随机化下平均因果效应估计的渐近理论,证明了重随机化可以提高平均因果效应的估计精度。其次该论文比较了不同群组重随机化平衡性准则的效率,即在相同接受概率下对估计量渐近方差的减小量,证明了当协变量进行正交化之后,最优的加权欧式距离准则优于多层马氏距离准测。论文最后讨论了群组重随机化下的协变量回归调整方法,证明了在重随机化下,Su & Ding (2021)提出的模型辅助的点估计和区间估计仍然适用。这一结果对于因果推断的实践具有重要指导意义。

论文链接:

https://doi.org/10.1093/biomet/asac045