该项目首先通过因果关系捕获大规模分布式网络中的海量分布式事件,将分布式网络诊断转换为串行程序数据流诊断问题;其次,利用程序分析技术,基于形式化方法中的最小不可满足核与错误不变量技术,对大规模网络中的异常情况进行故障根因检测;最后,利用约束规划技术对故障根因进行修正,从而实现大规模网络的异常行为诊断与修复。
该项目所提出的网络异常行为诊断与修复系统为国际首创,具有良好的创新性。课题组基于开源社区Batfish实现的原型系统在多个真实网络拓扑上进行的大规模实验表明,该系统可以实现网络故障的分钟级根因诊断与修复,同时,修复代码变动率不超过10%。具有良好的产业化潜力。
全部评论