TL012

实施实用的站点可靠性工程(SRE)的过渡方案技术概述

概述

课程概述

了解为什么 SRE 已成为一种可提高性能并缩短上市时间的 IT 策略。

站点可靠性工程(SRE)是一种责任共担模型,如果执行得当,可以提高效率、弹性和安全性。但在企业中实施 SRE 需要文化转变、团队塑造和培训以及流程变革。为实现这一转变,企业需要制定过渡路线图。本技术概述涵盖了实施 SRE 的实用方法,并介绍了帮助逐步过渡到 SRE 的责任共担核心工具。

课程概要

通过按需提供的视频,您将学习到以下内容:

  • 什么是 SRE?实用的 SRE 方法
  • 责任共担工具
  • 如何扩展服务可靠性
  • 建设“允许失败”的文化
  • 评估不一致及其相关后果
  • ITSM 和 DevOps/SRE 协调一致的重要性
  • 团队塑造 - 建立/管理团队
  • 定义和协调事件管理和 DevOps 的目标
  • 协作技巧 - 帮助您开始过渡的方法
  • 将指标制度化
  • 总结 - 实用的方法

课程培训对象

正在考虑或正在实施或改进 SRE 实践的 IT 决策者和领导者。

课程前提条件

本课程不设任何前提条件。

成果

构建您的技能路径

如果想参加这门课程,可购买红帽培训订阅。购买订阅后,您可在一整年内无限次按需访问在线学习资源。

检验您的知识水平

免费参与技能评估,测试您的专业知识,发现技能差距,获取关于红帽培训的个性化培训建议。