希望以侵略性步伐规模的大型组织需要IT部门,可以敏捷和敏捷。通过Devops和网站可靠性工程(SRE)方法,IT团队可以提高其基础架构中的应用和服务的敏捷性,可用性和性能。对于那些对两个概念新的人来说,这里是一个疯狂的疯狂,关于Devops和SRE如何共同努力,以发展IT操作。
什么是devops?
德沃斯是一组促进开发人员和运营之间合作的实践。Devops的术语被Patrick Debois于2009年被创作。今天,Devops团队使用新的工具集来快速构建,测试和部署,目标是将服务更快地交付给市场。
什么是sre?
SRE负责可用性,性能,延迟,监控,故障排除和容量规划。自2003年以来,SRE(Ben Treynor创建的)(由Ben Treynor创造)一直存在于2003年之后 - 甚至比Devops更早。但是,Devops和Sre都必须利用自动化,为多个团队提供基础设施管理的广泛编排。
用devops切穿筒仓
大型企业通常具有复杂的组织结构,其中很多在孤岛上工作的团队。每个都将产品沿不同的方向拉动而不与其他方向汇流。这可能会使IT团队盲目,无法看到整体大局,这导致部署问题和高成本。Devops的主要目标是减少筒仓并改善团队之间的对齐。
应用SRE原则进行监控
监测是一个重要的工程努力。SRES强烈支持在小型相关,轻松理解的服务级别指标上建立服务级别目标和服务级别协议。(在我们以前的博客文章中了解有关SRE基础知识的更多信息。例如,Google SRES喜欢对应用程序分组的目标系统进行深度的难题监视。从支持应用程序的所有系统查看相关指标,允许它们识别具有较少歧义的根原因。SRE实践更多地了解如何使每个人能够在组织中使用相同的工具和技术,这反过来为每个人创造了共同所有权的感觉。
大多数SRE尝试尽可能简单地保持警报规则,而无需复杂的依赖层次结构。当SRES构建对异常模式作出反应的警报时,存在异常,因为这会影响可用性。应用SRE原则的一些最佳实践包括:
- 通过部署,操作和改进改善服务的整个生命周期
- 通过测量和监控可用性,延迟和整体系统健康维护服务
- 通过自动化来缩放系统,从而提高可靠性和速度
- 练习可持续事件响应
SRE如何发展?
尽管SRE在几十年前进入了现场,但它现在的IT世界急剧上。基于云的基础设施带来了微服务在主流中,通过精益组织的原则,Devops团队通常很小,专注和担任集体SRES。这导致了这一点开发和运营之间的更多合作和更少的冲突。虽然供应商和基于云的工具提供有关其各自域的基本信息,但将此信息收集到单个源中,以不同的基础结构创建上下文,并为故障排除复杂问题提供了一个常见的工具。这种强大的组合允许在实现SRE实践的同时管理遗留和多罩应用程序。