商汤科技也进场:上线“每日新SenseNova”大模型系统
06-18
近年来,企业业务规模急剧增长,导致运维场景复杂度呈指数级增长。
原本依赖人工经验的运维工作难度变得更大,基于机器学习的智能操作变得更具挑战性。
AIOps开始引起企业IT人员的关注。
AIOps(Algorithmic IT Operations Platform),基于算法的IT运维平台,也是DevOps未来发展的一个趋势。
简而言之,AIOps将机器学习算法引入运维中的监控和故障分析领域,比如通过算法、建模、推理等方法,辅助DevOps提高效率,降低业务和系统的风险和故障系数。
雷锋网发现,时序异常检测、故障根因分析、业务调度等常见任务都是当前运维人员面临的挑战。
那么,智能运维(AIOps)在实际业务场景中是如何落地的呢? Gartner为用户指出了三点建议:第一,通过增量方式确保各项AIOps功能的成功部署。
其次是选择能够支持广泛的历史数据和流数据类型的AIOps平台。
第三是选择能够在面向IT运维的分析和机器学习的四个阶段系统推进的工具。
为此,雷锋网整理了Gartner最新发布的《AIOps平台市场指南》,帮助用户快速了解当前新兴的AIOps市场情况。
主要发现是,AIOps在企业IT运营中的应用正在逐渐升温,一些较为成熟的组织正在利用该技术为业务领导者提供见解。
AIOps 技能和 IT 运营成熟度是确保快速实现价值的常见因素。
此外,在部署更成熟的架构时,数据质量成为新的挑战。
企业采用AIOps平台来增强应用程序性能监控工具(APM)和网络性能检测和诊断工具(NPMD)。
供应商正在制定策略,利用机器学习来分析 IT 运营遇到的数据挑战的数量、种类和速度。
同时,他们还在构建数据存储和人工智能实践定制的能力。
定义一个 AIOps 平台,利用大数据和机器学习,通过可扩展性和对不断增长的数据的分析来支持所有主流 IT 运营功能。
该平台支持同时使用多个数据源、数据收集方法以及分析和呈现技术。
AIOps 可以增强广泛的 IT 运营流程和任务,包括性能分析、异常检测、事件关联和分析、IT 服务管理和自动化。
其核心功能包括:1.从多个数据源获取数据2.数据分析:获取数据时实时分析;存储数据时的历史分析 3. 提供对数据的访问 4. 使用机器学习 5. 基于分析结果 转到下一步。
(注:分析的目的是预测可能发生的事件,并及时进行审查,以确定当前系统行为的根本原因。
) 市场分析 迄今为止,很少有供应商能够提供全面、集成的 AIOps 平台。
然而,许多供应商通过内置集成提供广泛的 AIOps 功能。
为了更清楚地描述市场发展和供应商水平,Gartner将目前可用的AIOps功能分为两部分:数据管理和分析结果:数据采集和处理历史记录和流数据管理——软件或设备允许数据采集和索引,以及存储日志数据、互联网数据、指标和文档数据。
由此产生的数据库大多是非结构化或多结构化的,并且存储的数据集大量积累并以高速变化的格式构建。
这种历史数据管理功能可以称为“大数据管理”。
为了帮助 IT 运营人员,此类工具必须在时间尺度上呈现人类感知的数据,并且无需访问存储数据库即可直接提供数据。
此外,它必须提供跨多个实时和历史数据流的一致分析。
分析结果的基本和高级统计分析 - 单变量和多变量分析的组合,包括相关性、聚类、分类和推理的使用。
模式发现和预测自动化——使用上述一种或多种类型的历史或流数据来得出数学或结构模式,这些模式可以从数据集本身推断出来,但并不立即相关。
这些模式可用于执行随时间变化的概率的事件预测。
异常检测——首先确定正常的系统行为,然后识别与正常系统行为的偏差。
确定根本原因——对模式发现和预测自动化组件建立的相关网络进行进一步修改,以隔离代表真实因果关系的依赖连接,从而提供有效的干预。
规范性建议——将问题分为已知类别。
然后,挖掘以前的解决方案,分析其适用性并确定修改的优先级。
最终,这些将使用闭环方法,并在使用后对其有效性进行投票。
拓扑 – 为了让 AIOps 检测相关且可操作的模式,必须围绕所获取的数据形成拓扑。
使用拓扑作为因果关系确定的一部分可以大大提高其准确性和有效性。
发展方向 过去二十年来,人工智能技术间歇性地影响着ITOM的发展,AIOps平台只是这种影响的最新例子。
IT 运营面临着降低成本同时增加运营复杂性的压力。
对于后者,可以从数量、类型、速度三个维度来定义:数量,IT基础设施和应用产生的数据量快速增长(每年增长2~3倍);类型,机器和人生成的数据类型正在增加。
数据越来越多,比如指标、日志、网络真实数据(有线数据)、知识管理文档等;由于云原生或其他架构的采用,数据生成的速度不断提高,IT架构也在不断变化。
考虑到现代企业所需的洞察力,这些不同维度的运营复杂性的成本非常高。
现有的监控工具在处理大量、多样化且快速增长的数据时面临着压力。
更重要的是,监控工具不会跨平台挖掘各种其他数据,特别是用户情绪数据、业务交易数据、传感器遥测和来自各个系统的日志来获得更多见解。
为此,业务领导、IT运营团队等非IT团队对AIOps技术越来越感兴趣。
当他们探索正在探索的通用平台时,部署时最大的问题是当 IT 运营实施不同用例时 AIOps 平台的性能和成熟度。
迄今为止,AIOps 主要用于支持 IT 运营流程,以监控或观察 IT 基础设施、应用程序性能或数字体验。
此外,无论是使用机器学习在事件管理环境中删除重复数据,还是结合 APM 中基于字节码检测的分布式跟踪数据来分析应用程序日志数据,都是有意义的。
AIOps 平台正在扩大它们可以捕获的数据类型的范围。
过去,提供商仅支持提供日志数据,但现在数据类型已扩展到包括真实的互联网数据。
因此,考虑到供需趋势和技术差异,Gartner预测,未来五年,AIOps平台将成为AIOps功能交付最广泛的形式,而不仅仅是将AIOps功能嵌入到APM、NPMD、和 ITIM。
与此同时,IT 组织开始在 DevOps 环境中探索这种方法,以在部署之前预测潜在问题并监控潜在的安全问题。
Gartner认为,AIOps将演变成一种双向解决方案,不仅可以获取数据进行分析,还可以根据分析发起操作。
通过与其他 ITOM/ITSM 工具集成,这些操作很可能会采取多种形式,包括: 警报 问题分类 配置管理数据库 (CMDB) 日志 运行自动化 应用程序发布 编排 AIOps 工具的四个监控阶段:数据收集、聚合、分析、行动,以数据聚合和分析为核心功能。
目前,一些企业用户利用开源技术进行数据采集,从而绕过APM,以AIOps作为监控功能的主要方式。
可见,关于监控工具和AIOps的争论才刚刚开始。
长远来看,APM将主要应用于专业领域,而AIOps将适用于更广泛的IT运营场景。
随着未来市场的发展,Gartner也观察到了AIOps功能的一些重大变化:首先,提供独立于数据源的AIOps平台的厂商已经进入市场。
这些产品往往用途广泛,可满足最广泛的使用案例。
第二类是拥有关键组件但数据源通常有限的供应商,通常专注于一个领域(例如网络、端点系统、APM)。
这些工具的用例往往有限,并且针对某些 IT 运营部门。
第三,一些供应商现有的监控解决方案将数据源限制在自己的监控产品中,或者扩展到有限的合作伙伴。

第四,一些用户可以通过开源项目,通过提供数据采集工具、大数据平台、机器学习和可视化技术来组装自己的AIOps平台,最终可以混合或匹配来自多个供应商的组件。
目前,市场上有一种声音:AIOps会取代APM、NPMD、ITIM、DEM等以领域为中心的监控工具吗?其实,这是一种混乱。
AIOps 不会取代监控工具;相反,它增强了分析能力和更多可操作的数据。
以领域为中心的监控工具将继续存在,为专家提供其领域的数据采集、分析和可视化。
然而,数据将流向AIOps平台,该平台充当集中式数据中心,用于一致的跨域分析。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-17
06-17
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态