可観測性とは

掲載 2024 年 9 月 17 日•10 分 (読了時間の目安)

可観測性とは、システムやアプリケーションの出力、ログ、パフォーマンス指標を調べることにより、その状態を監視、測定、理解する能力を指します。先進的なソフトウェアシステムやクラウドコンピューティングでは、アプリケーションやインフラストラクチャの信頼性、パフォーマンス、セキュリティを確保するために、可観測性がますます重要な役割を担うようになっています。

ソフトウェアシステムの複雑化、マイクロサービスの普及、1 つの分野としてのプラットフォーム・エンジニアリングの台頭、分散アーキテクチャへの依存度の高まりにより、可観測性の重要性が高まっています。

可観測性は、従来の監視システムを統合および拡張し、チームが問題の根本原因を特定できるようにします。可観測性によりステークホルダーは、アプリケーションやビジネスに関する質問に答えられるようになり、潜在的な問題についての予測や予想も可能になります。多様なツールやテクノロジーが使われているため、デプロイメントの可能性は膨大なマトリックスになりかねません。このことはアーキテクチャに影響を与えるので、チームは自分たちに合った方法で可観測性システムを設定する方法を理解しなければなりません。

Red Hat OpenShift Observability の詳細はこちら

人工知能と機械学習

人工知能 (AI) や機械学習 (ML) は、異常の自動検出、根本原因の分析、予測的知見を提供するために、可観測性プラットフォームでますます使用されるようになりました。これらのテクノロジーは、複雑なシステムの問題を特定し、対処するために必要な時間と労力を削減するのに役立ちます。

プラットフォーム・エンジニアリング

可観測性により、プラットフォームエンジニアは個々のメトリクスにフラグを設定するだけでなく、すべてのサービスにわたって包括的にデータをクエリおよび探索できるようになります。この拡張された可視性により、従来の監視では見逃してしまう可能性のある重要な関係や依存関係が明らかになります。これにより、チームは複雑な問題のトラブルシューティングを大幅に効率化し、すべてのシステムコンポーネントがスムーズかつ安定して動作するようにできます。可観測性により、プラットフォーム・エンジニアリング・チームは応答性だけでなく回復力もあるプラットフォームを構築し、問題の特定、対処、予防に必要な、より詳細な情報を得ることができます。このプロアクティブなアプローチにより、システム全体の信頼性が大幅に向上し、重要なアプリケーションのスムーズで一貫した運用がサポートされます。

ハイブリッドクラウドとマルチクラウド環境

ハイブリッドクラウドやマルチクラウド戦略を採用する企業が増える中、アプリケーションやサービスのデプロイ場所に関わらず、インフラストラクチャ全体を見渡すことができる可観測性ツールが求められています。

エッジデバイス

今後、エッジデバイスや IoT (モノのインターネット) デバイス、その他のローカル・コンピューティング・デバイスが増加することで、これらの環境を監視および管理する上で新たな課題が発生するでしょう。そのような環境はリアルタイムの知見と迅速な対応が求められます。方法として、データ収集のための軽量エージェントの作成、エッジに適したデータフォーマットやプロトコルの使用、分散型のデータ処理および分析技術の導入などが考えられますが、依然としてセキュリティやプライバシーの面では堅牢な対策が不可欠です。

DevOps における可観測性

クラウドネイティブ・アプリケーションの信頼性とパフォーマンスを確保するために可観測性の重要性が高まる中、DevOps プロセスにおける可観測性に重点が置かれるようになっています。DevOps ツールチェーンへの可観測性ツールの統合や、アプリケーションのパフォーマンスと信頼性を継続的に改善するための可観測性データの利用もその一部です。

オープンソースの可観測性ツールの利用が増加

近年、Grafana、Jaeger、Kafka、OpenTelemetry、Prometheus といったオープンソースの可観測性ツールの普及が進んでおり、この傾向は今後も続くと言われています。この背景には、組織がプロプライエタリーな可観測性ツールに関連するコストの削減を望んでいることや、オープンソースツールが提供する柔軟性やカスタマイズのオプションが魅力ということがあります。

クラウドネイティブ・インフラストラクチャの導入が増加

クラウドネイティブ・インフラストラクチャを導入する企業が増えるにつれ、こうした環境に特化した可観測性ツールのニーズが高まることが予想されます。クラウドネイティブ・アプリケーションやインフラストラクチャから生成されるデータ量の増加に伴い、ML や AI は、クラウドネイティブの可観測性の領域でますます重要性を増していくでしょう。これらのテクノロジーでは、エンドユーザーに影響が及ぶ前に異常やパフォーマンスの問題を特定することができるため、組織は重大な問題が発生する前に問題にプロアクティブに対処することができます。

信頼性の向上

問題が拡大する前に検出し、解決することで、ダウンタイムを最小限に抑えてユーザーが利用できるシステムを維持できます。

トラブルシューティングの効率化

システムの動作に関する深い知見を得ることで、問題の根本原因を素早く特定し、効率的に解決できます。

最適化されたパフォーマンス

システム内のボトルネックや十分に活用されていないリソースなど、最適化すべき領域を特定し、より効率的なリソース配分とパフォーマンスの向上を可能にします。

データ駆動型の意思決定

最新のシステムパフォーマンスと動作情報を入手し、データ駆動型の意思決定と継続的な改善を可能にします。

可観測性と監視は関連する概念ですが、重要な相違点がいくつかあります。可観測性とは、外部からシステムの動作を調べることで、システムに関する疑問を投げかけることができる能力のことです。

クラウドネイティブ・インフラストラクチャを導入する企業が増えるにつれ、こうした環境に特化した可観測性ツールのニーズが高まることが予想されます。クラウドネイティブの可観測性ツールは、マイクロサービスやコンテナなどのクラウドネイティブ・テクノロジーのデータを収集および分析し、これらの環境におけるシステムパフォーマンスに関する知見を提供できるよう設計されています。

つまり、クラウドネイティブの可観測性とは、マイクロサービス・アーキテクチャを使用して構築され、コンテナやサーバーレス環境にデプロイされた先進的なクラウドネイティブ・アプリケーションを監視、分析、トラブルシューティングするための手法と言えます。クラウドネイティブの可観測性の柱として、以下のものが挙げられます。

メトリクス：Kubernetes 環境とアプリケーションに関する定量的なデータの収集に重点を置いています。メトリクスには、CPU やメモリの使用量、ネットワークトラフィック、リクエストの待機時間などのデータを含めることができます。Kubernetes には多くの組み込み型メトリクスが用意されていますが、より詳細なメトリクスを収集するために、追加のツールやライブラリを使用することが必要な場合もあります。

ログ：Kubernetes 環境とアプリケーションからのログデータの収集と分析に重点を置いています。ログは、アプリケーションの動作に関する価値ある知見を提供し、問題のトラブルシューティング、パフォーマンスのボトルネックの特定、セキュリティ脅威の検出に使用することができます。

トレース：Kubernetes 環境とアプリケーション全体におけるリクエストやトランザクションの実行に関するデータを収集することに重点を置いています。トレースは、アプリケーションでリクエストやトランザクションがどのように処理されるかを理解し、パフォーマンスの問題を特定し、アプリケーションのパフォーマンスを最適化するのに役立ちます。

イベント：アプリケーションのデプロイ、スケーリングイベント、エラーなど、Kubernetes 環境内で発生する重要なイベントに関するデータを収集することに重点を置いています。イベントは、Kubernetes 環境の健全性を監視し、問題が発生したときに迅速に対応するのに役立ちます。

OpenShift の可観測性機能についての詳細はこちら

可観測性によってシステムの信頼性と効率的な運用が保証されるため、可観測性はプラットフォーム・エンジニアリング、SRE (サイト信頼性エンジニアリング)や DevOps に不可欠です。可観測性の重要性は、システムのパフォーマンスや動作に関する深い知見を提供し、プロアクティブな監視、トラブルシューティング、最適化を可能にする能力にあります。

プラットフォームエンジニア、開発者、運用チーム、サイト信頼性エンジニアが可観測性データを使ってソフトウェアシステムの問題を特定、分析、解決するためには、一定の手順を踏む必要があります。これは「デバッグジャーニー」と呼ばれています。

監視、アラート、またはユーザーから報告されたインシデントから発生する場合、問題を検出することから可観測性の道のりが始まります。

検出されたら、チームは重大性を判断して優先順位をつける必要があります。このトリアージプロセスでは、ユーザー、システム、全体的なパフォーマンスへの影響を評価します。

優先順位の高いものから収集した可観測性データを調査し、パターンや相関関係を特定します。

潜在的な相関関係やパターンを特定した後、チームはデータを深く掘り下げて問題の根本原因を探ります。

原因を特定した上で、コード変更、Hotfix、インフラストラクチャ調整などで修正を実施し、解決状況が良好であるかどうかチームで監視を続けます。

プラットフォーム・エンジニアリング、DevOps および SRE のための可観測性には、システムを効果的に監視、トラブルシューティング、最適化するためのツール、プロセス、専門知識の組み合わせが必要です。そして可観測性は企業が顧客に高品質のデジタルサービスを提供できるようにする上で重要な役割を担っています。Red Hat OpenShift Observability は、システムのベースラインを開発するために必要な情報を提供し、そのベースラインからの逸脱について監視および警告して、平均検出時間 (MTTD) と平均復旧時間 (MTTR) を短縮する機能を提供します。

Red Hat® OpenShift® Observability は、可観測性のツールとテクノロジーを繋ぎ、統一された可観測性エクスペリエンスを実現することで、先進的なアーキテクチャの複雑性を解決します。このプラットフォームは、システムのさまざまなメトリクス、ログ、トレース、イベントをリアルタイムで可視化、監視、分析し、アプリケーションやエンドユーザーに影響が及ぶ前に問題を迅速に診断およびトラブルシューティングできるよう設計されています。

テスト済みサービスの統合セットを備えたエンタープライズ・アプリケーション・プラットフォームであり、これによって、任意のインフラストラクチャでアプリケーションを市場投入できます。

詳細はこちら

Red Hat Advanced Cluster Management for Kubernetes には、マルチクラスタ管理の統一、ポリシーベースのガバナンス、アプリケーション・ライフサイクル管理の拡張を実現する各種機能と、クラスタの健全性とパフォーマンスをプロアクティブに監視する機能が含まれています。

詳細はこちら

Red Hat Lightspeed

Red Hat Lightspeed はプラットフォームとアプリケーションを継続的に分析して、リスクの予測、アクションの推奨、コストの追跡を行い、ハイブリッドクラウド環境の適正な管理を支援します。

詳細はこちら

可観測性とは

人工知能と機械学習

プラットフォーム・エンジニアリング

ハイブリッドクラウドとマルチクラウド環境

エッジデバイス

DevOps における可観測性

オープンソースの可観測性ツールの利用が増加

クラウドネイティブ・インフラストラクチャの導入が増加

Red Hat のリソース

信頼性の向上

トラブルシューティングの効率化

最適化されたパフォーマンス

データ駆動型の意思決定

Red Hat Lightspeed

Red Hat 公式ブログ

すべての Red Hat 製品のトライアル

関連情報

アプリケーションライフサイクル管理 (ALM) とは

CI/CD とは - 継続的インテグレーション/継続的デリバリー

ブルーグリーン・デプロイメントとは？をわかりやすく解説

DevOpsリソース

プラットフォーム

ツール

試用、購入、販売

コミュニケーション

Red Hat について

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links