《电子技术应用》
您所在的位置:首页 > 模拟设计 > 设计应用 > 智能运维在中国移动IT云中的应用与实践
智能运维在中国移动IT云中的应用与实践
2021年电子技术应用第11期
刘 虹,滕 滨,张 琳,郭志斌
中国移动通信集团有限公司 信息技术中心,北京100032
摘要: 介绍了中国移动IT云针对IaaS层的智能运维场景体系规划,选择了数据基础较好的两个典型应用场景“智能化指标异常检测”和“智能化告警关联与溯源”进行了研究和论证,分别分析了两个场景适用的算法和实现过程,论述了两个场景实施后的效果评估方法,并经实际生产验证了场景实施的效果。
中图分类号: TN929.5;TP399
文献标识码: A
DOI:10.16157/j.issn.0258-7998.211543
中文引用格式: 刘虹,滕滨,张琳,等. 智能运维在中国移动IT云中的应用与实践[J].电子技术应用,2021,47(11):20-24.
英文引用格式: Liu Hong,Teng Bin,Zhang Lin,et al. Best practice of AIops in China Mobile private cloud[J]. Application of Electronic Technique,2021,47(11):20-24.
Best practice of AIops in China Mobile private cloud
Liu Hong,Teng Bin,Zhang Lin,Guo Zhibin
Information Technology Center,China Mobile Communications Group Co.,Ltd.,Beijing 100032,China
Abstract: The planning of infrastructure AIops scenario for China Mobile private cloud is described, and the two typical scenarios named "Intelligent Index Anomaly Detection" and "Intelligent Alarm Traceability" are researched. The algorithm and business processes of the two scenarios are introduced respectively.The effect evaluation method of the two scenarios is discussed,and the actual production verifies the implementation effect.
Key words : AIops;index anomaly detection;alarm traceability;machine learning

0 引言

    随着国内企业数智化转型的深入推进,企业私有云的设备规模呈现持续增加的趋势,作为中国移动内部支撑系统的云化基础设施,一级云资源池的规模持续增加,运营和运维工作面临着越来越大的压力。从业界经验来看,运维人员数量无法随着设备数量线性增加,每万台服务器运维人员的数量持续下降,因此亟需引入智能化运维手段,解决人力不足的矛盾。同时,也需要借助智能化工具提高资源的可用性,提升租户的使用体验。为此,中国移动结合IT云自身特点,梳理了一级IT云的智能运维场景体系,并选取典型场景进行了应用与实践。本文基于中国移动一级IT云运维团队的切实需求,综合评估业界关键技术成熟度和一级IT云的基础运维数据质量,选择以下两个场景进行分析和研究:




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003819




作者信息:

刘  虹,滕  滨,张  琳,郭志斌

(中国移动通信集团有限公司 信息技术中心,北京100032)




wd.jpg

此内容为AET网站原创,未经授权禁止转载。