据我所知,对几乎所有数据中心问题的第一个修复是重启一些东西。它是Linux操作系统还是远程分支机构网络节点并不重要。重新启动,希望问题消失。
它的工作时很棒。但是什么时候?
然后我们必须确定根本原因实际的位置。可能是存储阵列磁盘驱动器,或者一组失败的风扇,导致处理器放缓,或者以漫长的网络电缆的容量运行的端口通道,或其他千类问题。在一个大型数据中心,可能存在十几个并发问题,实际失败下游数千个同情失败。
我们知道什么?通常有人抱怨的设备。我们不知道什么?在一个大数据中心,我们之前常常从未在这个问题上工作过。如果失败在Linux操作系统中,我们甚至可能甚至都不知道它是否在我们的一个机架中的AWS或服务器上运行,或者是否涉及虚拟机管理程序,或者是交换流量运行的。
我们需要与其他人交谈,这需要时间。
如果我们更聪明,那不是很好吗?
如果我们可以看看我们的基础设施的任何一部分,并且知道它所依赖的所有东西,以及所有依赖于它的东西,会怎么样?如果我们能立即发现依赖列表中存在问题的地方。我们将拥有数据中心的无所不知!
然后我们不必等待这么久。并且不会有一件事,我们无法做到。然后我们很开心!
秘密功能修复所有问题
Zenoss大约一年前提供了“依赖视图”功能。我很惊讶多少人不了解它。它自动启用并随处可用,它的设计完全是为了帮助您向上和向下枢轴。
这是一个非常简单的例子。有人抱怨网络服务器具有不一致的响应时间。怎么了?
看一下web服务器操作系统,我们什么也看不到——所有的东西都是绿色的。让我们使用Dependency视图来查看堆栈中是否有任何警告信号。
这就是我所看到的 - 它正在运行的虚拟机管理程序有一个问题。谁知道这个操作系统甚至虚拟化?这个聪明的家伙,感谢依赖性视图。现在我将研究管理程序,并希望解决问题。看看我不必看的所有地方 - 没有端口组网络问题,没有失败的风扇,没有填充文件系统,没有热电源,所有的VNICS工作。
Win的自动依赖
使用依赖性视图功能快速了解工作的内容,而不是通过任何受监视元素的基础结构。顺便说一句,它也适用于云技术。
想了解更多关于自动依赖如何帮助您的信息吗?让我们知道!