【新闻动态】我中心16级博士研究生论文被计量经济学顶刊接收并在线发表

近日,我中心2016级博士生蒋斐宇以第一作者的身份撰写的论文“Time series analysis of COVID-19 infection curve: A change-point perspective”被计量经济学国际顶尖期刊Journal of Econometrics接收并在线发表。该论文是蒋斐宇在美国伊利诺伊大学厄巴纳香槟分校(UIUC)统计系访问期间,与其在UIUC的合作导师邵晓峰教授以及圣母大学的赵子锋助理教授合作完成的。新冠病毒(COVID-19)的累计确诊人数或累计死亡人数通常在病毒爆发初期快速增长,而后因为政府的各种干预政策增长率逐渐平缓直至为零。因此,在一段较短的时间内,可以假设累计确诊人数(死亡人数)的增长率是平稳不变的。利用此假设,该论文用分段线性趋势的半参数模型对全球30个国家感染新冠病毒的累计确诊人数和累计死亡人数进行建模。分段线性趋势模型首先使用自正则化(self-normalization)的方法将累计确诊人数(死亡人数)的对数曲线进行断点检测,依据这些增长率发生变化的断点再将曲线分割为多条平稳的线段,从而在每一条线段内,累计确诊人数(死亡人数)的增长率保持不变。下图为美国累计确诊人数的例子,该文将美国累计确诊人数的对数曲线近似地分割为六条线段,在每条线段内斜率(即增长率)保持不变。

在对全球30个国家的数据建模后,该论文发现第一次或第二次断点的出现往往与政府的隔离政策和加强检测力度相关,从而在一定程度上验证了政府强制措施的必要性和有效性。同时,截止5月底,该文发现东亚国家及澳大利亚对新冠病毒的疫情控制最为出色,其次为欧洲和北美的发达国家,而其它发展中国家尤其是拉丁美洲的国家的疫情最不容乐观。

利用断点检测,该论文还提出了三步预测的方法:第一步通过自正则化的方法找到累计确诊人数(死亡人数)曲线的断点;第二步利用最后一个断点对最后一段数据进行建模;第三步并通过最后一段数据拟合的模型参数进行外推预测。最后,该文对美国的死亡率数据进行了一周及两周的短期预测,并与美国CDC官方网站给出的其它基于传染病模型的预测结果进行了对比。该文的预测方法尽管只使用了累计死亡人数这一条数据,却与其他使用多个变量和数据的模型达到了相近甚至更好的预报结果,在一定程度上展现了纯统计模型对新冠病毒累计确诊人数和死亡人数在拟合和预报上的优势。

 

论文网页:https://www.sciencedirect.com/science/article/pii/S0304407620302633。