2017年11月24日,【统计学论坛·特邀报告】在清华大学伟清楼209成功举办。报告邀请到复旦大学统计系朱仲义教授。这次报告由清华大学统计学研究中心杨立坚教授主持。
本次报告的主题是“基于分位数回归的面板数据的聚类”。朱教授首先提出,在面板数据分析中,我们经常用固定效应(fixed effect)来刻画个体效应。根据假设个体斜率(slope)是齐次(homogeneous)的,来改善斜率的估计。然而,无论是在统计学中,还是在经济领域,将齐次的斜率(slope)分组,此限制条件较为苛刻。其次,朱教授介绍了在面板数据分析中有很多方法可以将斜率分组来解释,比如:混合模型(mixed model),加罚模型(penalized model),K-means方法等。与条件均值模型(mean model)比较而言,分位数回归缺少可加性,处理起来相对困难。他还补充介绍了面板数据和纵向数据的区别和联系。接着,朱教授详细介绍了利用面板数据模型对个体分组(类似于聚类),他指出,这种方法的难度在于处理内生的固定效应(fixed effect)项,如果忽略这个因素则估计有偏。他提出了一种类似K-means的方法来对个体分组。这是一种新的两步法迭代算法,利用复合分位数进行聚类,充分利用不同分位数的信息,找到一最佳分位数进行分组。该算法第一步:先估计每个个体,处理固定效应项;第二步:分组后对系数最小化目标函数。
最后,朱教授给出了参数估计量的渐进理论性质,并且展示了其在模拟数据和实际经济增长数据中的表现。