"
为什么AIOps平台要成为通向5G新基础设施的“桥梁”?
"
正文|通信行业新闻(网络)党博文
云计算时代,随着企业数字化程度的不断提高,软件虚拟化和云化使得ICT基础设施网络越来越复杂和相互依赖。在过去的几年里,为了应对数字化转型带来的日益增加的系统复杂性,市场上出现了许多运维分析平台。
在当今的云计算时代,云计算和分布式应用给运维带来了巨大的挑战,使得人们的海上战术在运维之前就失败了。因此,基于算法和机器学习的智能运维(AIOps)必将成为企业运维场景的大势所趋。AIOps平台利用大数据、现代机器学习等先进的分析技术,以主动、个性化、动态的洞察,直接或间接地增强IT运营功能。
根据Gartner的相关数据,全球AIOps平台市场每年在3亿美元到5亿美元之间,its的快速发展使得企业引入AIOps工具来增强IT功能和业务增长成为必然趋势。
华为不断突破云管理的边界,满足成千上万业务的复杂需求,加速各行业的数字化转型。华为AIOps是最具代表性的解决方案之一。
然而,随着5G等网络和服务的发展,带来了高复杂性和高质量的运维挑战。运维能力的演进成为电信网络持续有效性的关键影响因素,运维智能化转型成为大势所趋,云计算之争最终将是无数厂商基于运维的全面竞争。
给运营商“主动权”
目前,电信网络运维面临着被动发现问题、难以定位故障根源等一系列问题。各专业运维支撑系统的功能也面临着开发周期长、闭环过程自动化程度低等技术瓶颈。运营商都期望引入AI能力,实现智能运维,实现主动维护和故障自愈。
基于10多年的服务行业经验,华为不断突破云管理的边界,以满足数千条线路和行业的复杂需求,加快各行业的数字化转型。华为AIOps是最具代表性的解决方案之一。
事实上,传统运维和AIOps是密切相关的,AIOps也依赖于传统运维的数据库和计算处理。但是随着云的大量采用,IT环境越来越复杂,运维管理的任务也越来越艰巨。运维自动化可以解决一些问题,但一直困扰着运维的告警融合。一些更灵活的配置需求,依靠运维自动化并不能完全解决,但这些问题可以通过AIOps方法在更深层次上解决。
具体来说,华为向行业发布了AIOps系列云服务,包括故障识别根本原因定位服务、日志异常检测服务、KPI异常检测服务、硬盘异常检测服务等。,最大限度地支持“开箱即用”和“主动出击”,使运营商和企业专网的智能运维得到改善。
在实际场景中,发现异常或故障后的定位是运维过程中的一个难点。目前,这些任务主要依靠专家经验或人工分析,但受分析计算能力和知识信息的限制,效果不理想。
通过人工智能算法和业务的集成,NAIE人工智能操作系统准确地聚合多维事件,如异常和警报,并聚合事件和定位拓扑和故障传播图等维度的根本原因。目前,Naie AI OPS已应用于无线接入网等业务领域,无效接入站减少60%,根本原因识别准确率85%+,整体运维效率提升15%。
在KPI异常检测中,电信网络最常见的场景是通过KPI对网络进行预测和监控。NAIE AIOps结合电信领域运维服务的特点,提供单指标/多指标检测、异常原因关联分析、模型自学习调整等关键能力。,快速识别海量KPI异常,在电信网络场景中也得到了广泛应用。
在日志异常检测服务和硬盘异常预测中,NAIE AIOps实现了日志自动分类和统计规则挖掘,并实时监控系统的异常行为和相关日志。当硬盘将被写入极限或面临故障时,NAIE AIOps可以在14天内智能预测硬盘故障,从而采取规避预防措施,避免影响业务。
工业知识与人工智能技术的化学反应
运维工作已经从早期的人工操作和自动化运维转变为智能化运维。在运维支撑系统的演进方向上,全自动运维系统已经成为电信行业运维智能化转型的趋势和共识。未来五年,电信行业市场运维系统和平台将加速AI能力升级,成为电信领域AI应用的核心场景,投资比例也将达到60%。
按照华为对自主驾驶网络的等级定义,运维的智能化目标是实现全区域、全过程的预见性运维,具有自动监控、定位和自愈功能。
网络运维系统AIOps能力建设的趋势本质上是业务与能力的解耦,从而重用、拉通、支持AIOps能力,适应运维场景应用的需求盛开和快速在线迭代。
4G改变生活,5G改变社会。毫无疑问,5G的出现带动了行业的商业应用规模,带动了成千上万行业的数字化转型。但5G要想在优质经济发展中发挥支撑作用,离不开智能运维的“助力”。
但企业要想实现真正的智能化运维,还是需要算法、行业经验和高超的工程水平。企业级智能运维产品需要方便客户根据使用场景调整算法和模型,以匹配业务需求;此外,它必须具备支持算法高效运行的平台能力,包括大数据处理能力、机器学习平台能力和流数据处理能力。
所以AIOps的落地,需要相关人才不仅要懂大数据和AI技术,还要熟悉运维场景和业务。企业需要结合行业经验、平台工程和合适的算法来突破不同的场景。
洞察这个痛点,华为AIOps使能服务作为自主驾驶网络AI引擎iMaster NAIE的核心能力,在NAIE平台的基础上,提供电信领域一系列AIOps原子能力和组合调度能力,应用各种专业运维系统。与AI能力脱钩,使用分层服务架构连接和共享数据中心,集中提供AIOps能力,即使没有足够的数据和相关技术能力和人才,也可以通过华为AIOps收入提高智能运维效率。这也是华为AI
基于华为在电信领域的经验,原子能力将人工智能算法与电信领域的行业知识相结合,预设默认的电信领域模型参数,支持当前网络运行状态的优化,解决了当前通用算法模型在特定行业落地效果不佳的问题。目前华为AIOps的原子能力库支持流量预测、故障预测、KPI异常检测、日志异常检测、CHR异常检测、异常关联评分、根本原因定位等20多种原子能力。
关于组合编排和DevOps能力,用户可以选择业务场景所需的AIOps的原子能力,以可视化的方式完成流程拼接,配置业务泛化参数,包括数据访问模式、模型参数、内置电信域泛化参数、事件通知模式等。
此外,NAIE的生态服务还提供专业人员培训和赋权。基于NAIE平台培训服务,AIOps原子能力库支持用户根据实际业务需求创新开发算法模型,不断扩展AIOps能力。
值得一提的是,在场景组合服务中,华为AIOps可以围绕整个运维流程提供预制的典型场景组合应用,快速访问运维流程。
毫无疑问,华为AIOps使能服务作为智能运维的AI能力引擎,融合了AI的技术优势和华为在电信领域的专业优势,为运维系统的智能演进提供AIOps平台能力支持,帮助各种专业运维系统的应用快速上线,让运维专家专注于场景应用设计和业务目标。
迈向5G新基础设施
随着“5G新基础设施”的加速实施,数字经济的发展迎来了新的动能。
从智能城市到无人工厂,从智能农业到远程医疗,从金融技术到汽车联网,新基础设施和各种技术的场景将无处不在,这不仅会促进投资和消费的快速增长,还会带动各行业的数字化转型升级。然而,随着复杂的网络问题和高服务质量的挑战,运营和维护能力的演变已经成为电信网络持续有效性的关键因素。
“要想做好新基础设施,首先要从运维中受益。”在信通技术平台的复杂性和集成度将继续呈指数级增长的背景下,在人的能力保持相对不变的情况下,运维能力的演变已经成为影响电信网络可持续发展效率的关键因素。
虽然AIOPS在野外或者单点技术上有了一定的进步,但是AIOps和空还有很大的差距,AIOps和NoOps还有很大的差距。
毫无疑问,未来的智能运维一定是自洽的。在云原生环境中,基础设施和系统的组件将基于标准化,运维工作可以完全基于具有独立、自动化和智能决策的业务系统来完成,从而形成一个闭环。
总体来说,运维在国内还处于起步阶段。但是,随着新基础设施的不断加速,中国的数字“版图”将继续扩大。届时,智能操作系统将像一座“桥梁”一样运行和维护数字系统,加速我们迈向智能社会的步伐。
1.《智能化运维 5G新基建如何智能化运维?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《智能化运维 5G新基建如何智能化运维?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/634032.html