博客

家>devops＆sre：同一个硬币的两面？

devops＆sre：同一个硬币的两面？

Sandeep Subbaiyan.
2019年4月3日

希望以侵略性步伐规模的大型组织需要IT部门，可以敏捷和敏捷。通过Devops和网站可靠性工程（SRE）方法，IT团队可以提高其基础架构中的应用和服务的敏捷性，可用性和性能。对于那些对两个概念新的人来说，这里是一个疯狂的疯狂，关于Devops和SRE如何共同努力，以发展IT操作。

什么是devops？

德沃斯是一组促进开发人员和运营之间合作的实践。Devops的术语被Patrick Debois于2009年被创作。今天，Devops团队使用新的工具集来快速构建，测试和部署，目标是将服务更快地交付给市场。

什么是sre？

SRE负责可用性，性能，延迟，监控，故障排除和容量规划。自2003年以来，SRE（Ben Treynor创建的）（由Ben Treynor创造）一直存在于2003年之后 - 甚至比Devops更早。但是，Devops和Sre都必须利用自动化，为多个团队提供基础设施管理的广泛编排。

用devops切穿筒仓

大型企业通常具有复杂的组织结构，其中很多在孤岛上工作的团队。每个都将产品沿不同的方向拉动而不与其他方向汇流。这可能会使IT团队盲目，无法看到整体大局，这导致部署问题和高成本。Devops的主要目标是减少筒仓并改善团队之间的对齐。

应用SRE原则进行监控

监测是一个重要的工程努力。SRES强烈支持在小型相关，轻松理解的服务级别指标上建立服务级别目标和服务级别协议。（在我们以前的博客文章中了解有关SRE基础知识的更多信息。例如，Google SRES喜欢对应用程序分组的目标系统进行深度的难题监视。从支持应用程序的所有系统查看相关指标，允许它们识别具有较少歧义的根原因。SRE实践更多地了解如何使每个人能够在组织中使用相同的工具和技术，这反过来为每个人创造了共同所有权的感觉。

大多数SRE尝试尽可能简单地保持警报规则，而无需复杂的依赖层次结构。当SRES构建对异常模式作出反应的警报时，存在异常，因为这会影响可用性。应用SRE原则的一些最佳实践包括：

通过部署，操作和改进改善服务的整个生命周期
通过测量和监控可用性，延迟和整体系统健康维护服务
通过自动化来缩放系统，从而提高可靠性和速度
练习可持续事件响应

SRE如何发展？

尽管SRE在几十年前进入了现场，但它现在的IT世界急剧上。基于云的基础设施带来了微服务在主流中，通过精益组织的原则，Devops团队通常很小，专注和担任集体SRES。这导致了这一点开发和运营之间的更多合作和更少的冲突。虽然供应商和基于云的工具提供有关其各自域的基本信息，但将此信息收集到单个源中，以不同的基础结构创建上下文，并为故障排除复杂问题提供了一个常见的工具。这种强大的组合允许在实现SRE实践的同时管理遗留和多罩应用程序。

有关如何使用的更多信息Zenoss云统一围栏遗产和现代IT环境的可观察性实践，请联系Zenoss建立演示。