フィードを購読する

クラスタ管理には固有の課題が生じますが、それが特に顕著なのは、ツリー外 (OOT) クラスタモジュールの実行環境を管理する場合です。たとえば、デバイスのプラグインや異なるカーネルバージョンを 1 つずつアップグレードすると、エラーが発生しやすくなります。そこで役に立つのが Kernel Module Management Operator (KMM) です。これにより、管理者はどのカーネルモジュールでも、複数のカーネルバージョンを構築、署名、デプロイできます。

KMM は、任意のカーネルモジュールで一度に複数のカーネルバージョンに対応できるよう設計されています。この Operator により Intel Center GPU Flex のハードウェア・アクセラレーション機能も活用できるため、シームレスなノードのアップグレード、アプリケーション処理の高速化、短時間でのモジュールデプロイが可能になります。

KMM のセットアップ

KMM には、すでに稼働している OpenShift 環境と、イメージのプッシュ先となるレジストリが必要です。KMM は、OpenShift コンソールで OperatorHub を使用するか、次の kmm.yaml でインストールできます。

---
apiVersion: v1
kind: Namespace
metadata:
  name: openshift-kmm
---
apiVersion: operators.coreos.com/v1
kind: OperatorGroup
metadata:
  name: kernel-module-management
  namespace: openshift-kmm
---
apiVersion: operators.coreos.com/v1alpha1
kind: Subscription
metadata:
  name: kernel-module-management
  namespace: openshift-kmm
spec:
  channel: "stable"
  installPlanApproval: Automatic
  name: kernel-module-management
  source: redhat-operators
  sourceNamespace: openshift-marketplace

続いて次のコマンドを実行します。

oc apply -f kmm.yaml

ハードウェア・アクセラレーションの有効化

インストールが完了すると、KMM は対象のハードウェア向けにカーネル・モジュール・ドライバーのコンパイルとインストールを行えるようになります。その後、管理者が Node Feature Discovery Operator (NFD) と統合することが可能になります。NFD により、ノード上のハードウェア機能を検出し、セレクターで使用できるようそれらにラベルを付けることができます。その際には、GPU の有無や種類といった特性を示すラベルが自動的にノードに追加されます。

NFD ラベルを使用すると、特定のカスタム・カーネル・バージョンをモジュールのデプロイや有効化の対象にできるため、必要なカーネルとハードウェアを備えたホストのみに限定してドライバーをアクティブ化することが可能です。これによって、互換性のあるドライバーのみを、サポート対象のカーネルを持つノードにインストールできます。これが KMM の大きな強みです。

KMM を NFD と連携させて使用すると、インテル GPU カーネルを目的のノードに簡単にデプロイできるうえ、他のノードへの影響も生じません。このプロセスの詳細は、以下の Developers.redhat.com サイトでご覧いただけます。

終わりに

複数ノードでの更新管理に必要な労力を軽減できる KMM およびカーネルモジュールについて説明してきましたが、これは、機能の一例に過ぎません。KMM を使用すると、ツリー外のカーネルモジュールをシームレスに処理し、その間にアップストリームでドライバーを組み込んでディストリビューションに追加することができます。

KMM はコミュニティ・プロジェクトで開発されているため、アップストリーム Kubernetes でのテストが可能です。コミュニティの Slack チャンネルもあり、KMM を使用している環境に適用する他の方法について、他の開発者やエキスパートとチャットで会話することができます。


執筆者紹介

UI_Icon-Red_Hat-Close-A-Black-RGB

チャンネル別に見る

automation icon

自動化

テクノロジー、チームおよび環境に関する IT 自動化の最新情報

AI icon

AI (人工知能)

お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート

open hybrid cloud icon

オープン・ハイブリッドクラウド

ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。

security icon

セキュリティ

環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報

edge icon

エッジコンピューティング

エッジでの運用を単純化するプラットフォームのアップデート

Infrastructure icon

インフラストラクチャ

世界有数のエンタープライズ向け Linux プラットフォームの最新情報

application development icon

アプリケーション

アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細

Original series icon

オリジナル番組

エンタープライズ向けテクノロジーのメーカーやリーダーによるストーリー