TL012
实施实用的站点可靠性工程(SRE)的过渡方案技术概述
概述
课程概述
了解为什么 SRE 已成为一种可提高性能并缩短上市时间的 IT 策略。
站点可靠性工程(SRE)是一种责任共担模型,如果执行得当,可以提高效率、弹性和安全性。但在企业中实施 SRE 需要文化转变、团队塑造和培训以及流程变革。为实现这一转变,企业需要制定过渡路线图。本技术概述涵盖了实施 SRE 的实用方法,并介绍了帮助逐步过渡到 SRE 的责任共担核心工具。
课程概要
通过按需提供的视频,您将学习到以下内容:
- 什么是 SRE?实用的 SRE 方法
- 责任共担工具
- 如何扩展服务可靠性
- 建设“允许失败”的文化
- 评估不一致及其相关后果
- ITSM 和 DevOps/SRE 协调一致的重要性
- 团队塑造 - 建立/管理团队
- 定义和协调事件管理和 DevOps 的目标
- 协作技巧 - 帮助您开始过渡的方法
- 将指标制度化
- 总结 - 实用的方法
课程培训对象
正在考虑或正在实施或改进 SRE 实践的 IT 决策者和领导者。
课程前提条件
本课程不设任何前提条件。
成果
下一阶段考试或课程推荐
构建您的技能路径
如果想参加这门课程,可购买红帽培训订阅。购买订阅后,您可在一整年内无限次按需访问在线学习资源。
检验您的知识水平
免费参与技能评估,测试您的专业知识,发现技能差距,获取关于红帽培训的个性化培训建议。