博客

想要更好的事件相关性?AIOps或更好的监控——从哪里开始

在facebook上分享
分享到Twitter
分享在linkedin
分享Reddit.
在口袋里

我们都讨厌那些电话。“嘿,你知道Salesforce的铅流量下降了吗?”不管IT技术发展到什么程度,我们仍然会接到客户先找到东西的电话。必威亚洲体育 官网登陆然后开始相互指责。在过去的10年里,我们一直试图通过连接我们的应用程序来使业务运行更加顺畅。但当某样东西坏了,我们只能通过看一个工具,然后另一个,然后另一个来弄清楚——然后我们被困在一个房间里争论谁的工具是正确的。您有太多的工具、太多的事件和警报,以及更多不连贯的信息,您不知道该如何处理。

输入事件关联 - 在干草堆中找到针的洞察力或找不到任何问题的针。维基百科将事件相关性定义为“a通过寻找和分析事件之间的关系,找出大量事件的意义,并在大量信息中找出少数真正重要的事件。”

这就是AIOps供应商说他们可以做到的,他们说他们可以用尖端的机器学习技术做到这一点(但实际上,今天主要是统计分析)。随着Gartner和AIA等分析公司发布AIOps买家指南,他们解决所有问题的承诺似乎很诱人!许多人认为他们只能在现有混音的顶部添加AIOPS工具,而无需触摸他们的套件套件的脱节监控工具。

但这真的能解决你的问题吗?我们认为实际上有两种方法来做事件关联。让我们将其分解并比较两者。

1.统计事件相关方法(AIOps方法)

AIOps工具使用统计分析和用户定义的规则来生成事件并对其进行优先排序。这些统计方法依赖于一些指标,如时间(多个事件是否同时发生?)、网络邻近性(两个中断是否位于同一子网?)和相似质量的数量(一个特定的词是否在多个事件中出现?)。

这些工具可以在发现模式时真的很棒。给定一组白名单和黑名单的事件,他们可以执行蛮力模式匹配,以将新的传入事件分类为好坏。它们还可以自己检测这些模式,但是对于此,他们需要长期训练时间和大量数据。

但这种方法面临两个挑战。首先,这些AIOps工具不是领域感知的,也不能内在地理解IT元素本身,这可能导致它们出现误报。你默认知道的事情没有任何意义。例如,你知道打印机和网站并不相关,即使它们同时产生事件。但你的统计方法可能不知道这一点。

另一个挑战是:根据EMA分析公司的数据,大约70%的IT事故是全新的,并且在过去没有发生过。因此,依赖过去的行为意味着你可能会错过第一次遇到的重要问题。难道您不想确保您将抓住超过30%的IT问题吗?

还有一件事——因为AIOps工具倾向于依赖其他事件监视工具,它们回溯地查看旧的数据,而这些数据只与监视工具配置为发送的数据一样好。垃圾输入,垃圾输出。通常,输入的事件已经被处理和扣除,这进一步打乱了统计分析。带有更复杂机器学习和人工智能的工具也需要数据科学技能,而这些技能往往很难获得。

AIOPS工具可以非常伟大地分析非结构化数据(例如,在服务台票证中的事件中以及自然语言处理中的文本),以确定基础设施监测工具肯定错过的更高级别相关性。有些甚至延伸超越它的签署领域,并从社交媒体等其他流中摄取数据,允许公司在他们的用户或品牌受到影响时真正了解。

2.基于领域的智能关联方法

这种方法涉及到对基础设施监控解决方案本身进行现代化。这里的秘诀是选择一个平台,它能够基于对IT基础设施组件和依赖关系的本机深入理解来执行事件关联。它既能感知域,又能感知服务。它知道基础设施如何工作,以便确定逻辑关系。了解这些被监视的元素如何在任何给定的时间点支持关键服务,有助于确定最重要的问题的优先级,首先进行调查和解决。

像Zenoss这样的基础设施监控解决方案可以帮助您实时了解IT服务风险,并通过冒出服务影响事件来筛选噪音(通过优先级的根本原因分析来简化解决)。泽诺斯对这些设备本身以及它们如何工作有着内在的领域理解。它知道融合基础架构服务器的风扇故障将影响其性能,而打印机错误不会使电子商务网站的基础架构宕机,即使它位于同一子网。它知道备份服务器上的一个问题会影响它支持的移动应用程序,即使它不是在高峰使用,客户还没有受到影响。必威亚洲体育 官网登陆

使用这种方法的好处更大。通过整合监视工具集,还可以降低许可证和人工成本。通过在您的监控工具中处理大量的事件相关性,您可以防止事件风暴转移到服务台,在那里它们的管理成本更高。

两全其美的

在您在监控解决方案之上拍摄另一个工具之前,请停止并思考您正在解决的内容。我们知道已经追求了AIOPS解决方案的公司,而不是解决他们的监控,最终意识到这种方法缩短了。

那么,我们的药方呢?首先调整您的监视方法。您的监视是您的第一道防线,确保您有一个统一的、具有质量洞察力的视图是关键。然后,您可以对更广泛的数据集释放AIOps工具,以捕获遗漏的内容,从而补充和补充您的监视。

这里有一些关于如何利用每种类型的工具来获得最佳效果的提示。

使用Zenoss软件:

  • 跨混合IT环境统一监控基础设施性能和可用性
  • 来自您的其他监控工具的合并事件数据(换句话说,您的基础架构监控显示器监控“)
  • 生成与基础设施相关的及时、可操作的见解,并使用上下文相关的数据进行解决
  • 自动化与基础设施相关的、影响服务的事件的警报和票据

使用AIOps平台:

  • 融合跨更广泛IT领域的数据,从而获得更高层次的业务洞察力
  • 跨职能协作和跨内部团队的重要数据可视化
  • 寻找更高级别的季节性趋势,超出您通常的监测指标和指标

要了解更多关于AIOps工具如何补充Zenoss等解决方案的信息,请考虑参加即将举行的会议GalaxZ18会议在奥斯汀,德克萨斯州。

类别

订阅

在下面的框中输入您的电子邮件地址以订阅我们的博客。

加载
特色内容
分析报告
Forrester Wave™:智能应用和服务监控,2019年第2季度
分析报告
Gartner AIOps平台市场指南

使IT能够以业务的速度移动

Zenoss是为现代IT基础设施而建造的。让我们讨论一下如何合作。

安排一次演示

想看看我们的行动吗?
今天安排演示。

价格要求

要求价格估计您独特的IT环境。

联系我们

想了解更多吗?
今天联系我们。