TL012

Transitional approach to implementing pragmatic Site Reliability Engineering (SRE) Technical Overview

概要

コースの説明

パフォーマンスの向上と市場投入時間の短縮を実現する IT 戦略として SRE が登場した理由を学ぶ

サイト信頼性エンジニアリング (SRE) は責任共有モデルであり、適切に実行すれば効率、レジリエンシー (回復力)、セキュリティを向上させることができます。しかし、組織に SRE を実装するためには、文化的変革、チームの形成とトレーニング、プロセスの変更が必要です。この変化を実現するには、組織は移行のロードマップを作成する必要があります。この技術概要では、SRE への実用的なアプローチを取り上げ、SRE への段階的な移行を可能にする責任共有のためのコアツールについて説明します。

学習内容サマリー

オンラインのオンデマンドビデオを通じて、次の内容を学習できます。

  • SRE とは何か、SRE への実用的なアプローチ
  • 責任共有のためのツール
  • サービスの信頼性を拡張する方法
  • 「失敗しても安全な」文化の構築
  • 不整合とそれによって生じる困難の評価
  • ITSM と DevOps/SRE の連携の重要性
  • チーム形成 - チームの構築/実行
  • インシデント管理と DevOps の目標の定義および連携
  • コラボレーションのコツ - 移行の開始に今すぐ使えるもの
  • メトリクスの規定
  • まとめ - 実用的なアプローチ

コース対象者

SRE プラクティスの実装または改善を検討中、あるいはその過程にある IT 意思決定者および IT リーダー

受講の前提条件

このコースの受講に必要な前提条件はありません。

成果

Red Hat ラーニングサブスクリプションをご利用いただくと、このコースを受講できるほか、オンラインの学習リソースをオンデマンドで無制限に通年利用できます。