AIOps的真相

如果你在IT Ops或DevOps中,几乎每天都会有人提到AIOps。现在有一些人认为AIOps可以取代IT Ops工具。其他人对此进行了争论,认为AIOps仍然是一个新兴的领域,在我们看到一个成熟的用于it运营管理的AIOps平台之前,还需要几年的时间。但是关于AIOps是如何工作的,总是有很多困惑。

解构AIOps和其功能的不同层

AIOps代表IT操作的人工智能。在高层次上,AIOps工具做两件事:收集数据和分析数据。他们这样做是为了加速IT操作中的问题解决。

但减少AIOps于这两大领域完全忽略了许多真实AIOps解决方案的基本要素 - 特别是那些真正寻求成功利用AI以简化IT运营。我们已经确定了九个不同的功能 - 用自下而上的方法 - 从数据采集,然后通过层层向上移动到自主学习的能力。

数据收集-这是驱动复杂的机器学习算法分析和查看模式的关键基础组件,一般来说,它的操作团队不会发现这些模式。如果你是一个大的组织管理成千上万的设备和全球数以百万计的节点,这是极不可能的,你可以手动筛选所有可用的在您的环境中复杂的机器的数据,包括指标、事件、流数据,跟踪和日志数据,预测即将到来的应用程序或系统故障在任何给定的时间。一种灵活的、全面的数据收集机制是任何AIOps工具所需要的。但是IT运营团队意识到他们现有的工具能力有限,他们需要大量的数据来创建有意义的机器学习模型。

与许多独立AIOps供应商所宣称的相反,仅在日志或事件上添加智能并不足以创建可靠的自动化。为了实现健壮的自修复,这些工具必须能够从不同的数据源传输所有数据类型,以提供足够的上下文以使其值得信任。例如,Zenoss的提供一种深度数据收集机制,使IT Ops能够实时收集流数据,并获得关于如何优化和改进IT性能的见解。

重复数据删除,自动重复数据删除是当你在大规模处理数百万来自不同数据源迎面而来的事件的一个关键步骤。对于许多管理员管理混合它通过将本地和公共/私有云基础设施相结合,减少事件噪声可以自动节省大量时间并提高平均解析时间(MTTR)。

事件关联和充实- 多数通过减少和使用统计分析在不同数据源的事件相关监测解决方案,处理事件的风暴。一些独立的AIOps解决办法与模式识别机器学习事件关联(ML)算法,但没有训练中使用大量的上下文数据的ML算法,他们功亏一篑增加多少价值,谁往往寻找异常或见解用户从IT环境。对于个人或团队负责事件源,对业务进行分流的初始步骤的影响,一般是从警报缺少的关键信息位。您可以利用基于模型的数据和从上下文感知的关系IT基础设施并用它来抑制和丰富的活动,通过AIOps。

噪声抑制- IT运作团队总是寻找可操作的提醒,使他们变得更高效。但一个共同的障碍是,过度警觉噪声和疲劳,这可能是一个障碍为IT管理员谁通常寻求更快的解决时间。一些AIOps解决方案提供智能事件抑制,从而使管理员能够有选择地丢弃和噪声降低事件 - 使它更容易为他们的规模设备监测和重大难题为零。它的工作原理,如果你是在你有很多的嘈杂事件源大的应用环境。

异常检测-这一层的AIOps是技术复杂性上升了一个档次。例如,如果您正在跨环境部署代码,您可能希望了解潜在的服务影响。通过使用高级的机器学习算法,您可以通过自动化筛选日志和指标的手动过程来发现是否存在任何异常或回归,从而节省开发成本。

可观察性- 一个单机AIOps解决方案的主要挑战是缺乏原始机器数据的大量训练他们的机器学习算法更好的可观察性。举例来说,一个或两个类型的数据(如度量,事件,日志,跟踪等)的分析将不能为你提供必要的见解,调试混合云应用。你需要从所有来源/类型的机器数据,以全面实现服务环境,和机器学习可以帮助你做出的混合感高基数数据。当你开始从不同来源的基石稳健和上下文数据收集机制,它使观测性,并帮助您在关键的见解,让您分析根源,加快故障排除和解决过程行事。

预测分析-考虑到IT的动态性,服务和IT基础设施之间的关系不断变化,前瞻性地防止对关键业务服务的影响从来都不是一件容易的事情。最有用的机器学习见解来自实时基础设施建模数据以及来自所有其他来源的大型数据集。通过揭示有助于您优化IT资源和更有效地计划容量的基于模型的趋势和模式,您可以走在曲线的前面。

自学-许多AIOps供应商正在通过端到端IT服务和应用程序的实时、动态模型来提高机器学习的效率。通过ML算法的监督或非监督训练,包括深度学习,AIOps解决方案可以有效地预测系统或性能故障,甚至在故障发生之前。

随着AIOps,我们可能只是现在划伤表面。扩大超出这些九层AI能力,AI / ML算法变得更先进的一个潜在的好处是,它甚至可能推AIOps工具的限制自愈每当有IT问题的基础设施。但是,就目前而言,我们只是在采纳和使用AIOps能力的IT运营管理的早期阶段。

作为智能应用和服务监控的领导者,Zenoss的可以提供机器学习的见解实时模型数据获悉,以及所有其他数据类型。这将创建可视化的事件,预测发展趋势和业务受到影响之前发现问题了前所未有的能力。有关可以如何利用更多信息Zenoss的云统一跨越传统和现代IT环境的可观测性的做法,接触到Zenoss的建立一个演示

此外,Forrester公司最近发布的两个路径上一份报告,在您的环境中部署AIOps。了解更多,请按此下载报告