近日,清华大学统计学研究中心邓柯副教授课题组在信号处理领域的顶级期刊IEEE Transactions on Signal Processing发表了题为"Simultaneous Topology and Loss Tomography via a Modified Theme Dictionary Model"的论文。通过对网络透视过程建立统计学模型,实现对目标网络的拓扑结构和丢包率的同时估计,并取得更准确、稳健的估计结果。课题组博士后研究员李艺超为第一作者,邓柯副教授为通讯作者。
现代社会中,我们的生活与网络息息相关。一些网络特征,例如网络拓扑结构,网络丢包率对我们研究网络行为非常重要。然而,出于安全、商业等原因的考虑,我们无法直接测量这些网络特征。为了克服这些困难,Vardi, Y. (1996)提出了网络透视技术(network tomography)。网络透视技术是一种兼具网络测试与网络预警的技术,其旨在通过发送特定的数据包(探测包)到特定网络,利用端对端的方法将所得到的信息进行统计、综合分析从而进一步推断网络内部特征。
基于此,研究团队提出用统计学方法对网络透视过程建模,该项工作的主要贡献是:(1)本文将网络丢包行为与统计学中的经典问题“购物篮分析”建立了对应关系:网络中的丢包行为可以和购物篮分析中的模式识别形成一一对应;(2)进一步,根据上述对应关系,本文利用主题辞典模型对网络丢包行为进行建模,并给出了利用EM算法对模型参数进行估计的具体过程;(3)在计算上,本文利用序贯蒙特卡洛(sequential Monte Carlo)技术对EM算法中的E步进行了优化。
相对于传统的聚类方法,本文所提出的方法实现了对网络拓扑结构和各个节点上的丢包率进行同时估计;此外,在一些复杂网络中,本文所提出的方法展现出更准确、更稳健的估计结果。
该研究工作获得中国国家自然科学基金(Grant 11931001),国家留学基金委以及清华大学国强研究院的支持。
相关文献:
Vardi, Y. (1996). "Network Tomography: estimating source-destination traffic intensities from link data". Journal of the American Statistical Association. 91 (433): 365–377. doi:10.2307/2291416. JSTOR 2291416。