クラスタ管理には固有の課題が生じますが、それが特に顕著なのは、ツリー外 (OOT) クラスタモジュールの実行環境を管理する場合です。たとえば、デバイスのプラグインや異なるカーネルバージョンを 1 つずつアップグレードすると、エラーが発生しやすくなります。そこで役に立つのが Kernel Module Management Operator (KMM) です。これにより、管理者はどのカーネルモジュールでも、複数のカーネルバージョンを構築、署名、デプロイできます。
KMM は、任意のカーネルモジュールで一度に複数のカーネルバージョンに対応できるよう設計されています。この Operator により Intel Center GPU Flex のハードウェア・アクセラレーション機能も活用できるため、シームレスなノードのアップグレード、アプリケーション処理の高速化、短時間でのモジュールデプロイが可能になります。
KMM のセットアップ
KMM には、すでに稼働している OpenShift 環境と、イメージのプッシュ先となるレジストリが必要です。KMM は、OpenShift コンソールで OperatorHub を使用するか、次の kmm.yaml でインストールできます。
---
apiVersion: v1
kind: Namespace
metadata:
name: openshift-kmm
---
apiVersion: operators.coreos.com/v1
kind: OperatorGroup
metadata:
name: kernel-module-management
namespace: openshift-kmm
---
apiVersion: operators.coreos.com/v1alpha1
kind: Subscription
metadata:
name: kernel-module-management
namespace: openshift-kmm
spec:
channel: "stable"
installPlanApproval: Automatic
name: kernel-module-management
source: redhat-operators
sourceNamespace: openshift-marketplace続いて次のコマンドを実行します。
oc apply -f kmm.yamlハードウェア・アクセラレーションの有効化
インストールが完了すると、KMM は対象のハードウェア向けにカーネル・モジュール・ドライバーのコンパイルとインストールを行えるようになります。その後、管理者が Node Feature Discovery Operator (NFD) と統合することが可能になります。NFD により、ノード上のハードウェア機能を検出し、セレクターで使用できるようそれらにラベルを付けることができます。その際には、GPU の有無や種類といった特性を示すラベルが自動的にノードに追加されます。
NFD ラベルを使用すると、特定のカスタム・カーネル・バージョンをモジュールのデプロイや有効化の対象にできるため、必要なカーネルとハードウェアを備えたホストのみに限定してドライバーをアクティブ化することが可能です。これによって、互換性のあるドライバーのみを、サポート対象のカーネルを持つノードにインストールできます。これが KMM の大きな強みです。
KMM を NFD と連携させて使用すると、インテル GPU カーネルを目的のノードに簡単にデプロイできるうえ、他のノードへの影響も生じません。このプロセスの詳細は、以下の Developers.redhat.com サイトでご覧いただけます。
終わりに
複数ノードでの更新管理に必要な労力を軽減できる KMM およびカーネルモジュールについて説明してきましたが、これは、機能の一例に過ぎません。KMM を使用すると、ツリー外のカーネルモジュールをシームレスに処理し、その間にアップストリームでドライバーを組み込んでディストリビューションに追加することができます。
KMM はコミュニティ・プロジェクトで開発されているため、アップストリーム Kubernetes でのテストが可能です。コミュニティの Slack チャンネルもあり、KMM を使用している環境に適用する他の方法について、他の開発者やエキスパートとチャットで会話することができます。
執筆者紹介
類似検索
How llm-d brings critical resource optimization with SoftBank’s AI-RAN orchestrator
Building the foundation for an AI-driven, sovereign future with Red Hat partners
Scaling For Complexity With Container Adoption | Code Comments
Transforming Your Timelines | Code Comments
さらに調べる
- e ブック: クラウド規模でのインフラストラクチャ管理
- e ブック: 先進的なビジネスを成功させるための効率的な IT 基盤を構築する
- トライアルを開始する:Red Hat Enterprise Linux
チャンネル別に見る
自動化
テクノロジー、チームおよび環境に関する IT 自動化の最新情報
AI (人工知能)
お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート
オープン・ハイブリッドクラウド
ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。
セキュリティ
環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報
エッジコンピューティング
エッジでの運用を単純化するプラットフォームのアップデート
インフラストラクチャ
世界有数のエンタープライズ向け Linux プラットフォームの最新情報
アプリケーション
アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細
仮想化
オンプレミスまたは複数クラウドでのワークロードに対応するエンタープライズ仮想化の将来についてご覧ください