2020年8月15日,2020国际AIOps挑战赛决赛在杭州西溪谷君亭酒店顺利举行。由我院测量与态势感知研究团队的博士生张世泽、赵鋆峰组成的战队在杨家海、王之梁老师的指导下获得本次挑战赛季军。
现场主办方与参赛团队合照
随着分布式软件、虚拟化、云网络、容器技术的不断发展,目前的业务系统变得越来越复杂,包含有大量组件以及动态的通信模式,传统的基于人工值守的运维方式已经难以解决各种故障问题。因此,运维系统急需智能化、自动化的解决方案。目前,AIOps通常是指将人工智能技术引入网络与系统运维中,基于已有的海量运维数据(业务指标、日志、调用链指标、应用信息等),通过机器学习的方式来进一步解决传统运维中存在的难以解决的问题。
本届比赛面向的业务系统是一个来自某运营商的真实微服务的业务场景,业务场景中包含docker、中间件、数据库、物理主机等多种类型的组件共30余个,故障类型包括CPU、内存、网络、数据库连接等运维场景中常见的故障。比赛要求不仅能够准确识别系统中存在的故障,并需要通过对于各种指标的分析找出引发故障的根因组件以及相对应的指标。
本届比赛吸引了来自工业界和学术界的140多支团队、共计500多名选手参加。自2月底开赛以来,历时5个多月,经过初赛、复赛的激烈角逐,共有6支队伍被邀请前往杭州参加决赛现场答辩,来自清华大学网络科学与网络空间研究院的测量与态势感知研究团队的“一行bug”战队成为唯一个来自学术机构的决赛代表队,并荣获本次挑战赛季军。
主办方为“一行bug”团队颁奖