既存の一般的なワークロードの多くが AI を取り入れて強化されており、将来的には AI アプリケーションの新たな波が生まれる可能性があります。これにより、グラフィックス・プロセッシング・ユニット (GPU) やカスタムトレーニングおよび推論エンジンを含む、AI アクセラレーターの重要性が高まっています。個別の GPU から従来の CPU とオンダイ統合された AI アクセラレーションに至るまで、将来のワークロードの開発とデプロイに必要なパフォーマンスを提供するには、専用の高速化されたハードウェアが必要であることは明らかです。

そこで Red Hat Enterprise Linux (RHEL) 上で提供される、単純化された新 AI アクセラレーターのエクスペリエンスについてお知らせします。今後の画期的な AI アプリケーションを構築する開発者にも、AI ワークロードをデプロイするためにサーバーをプロビジョニングする IT システム管理者にも、RHEL はシームレスなエクスペリエンスを提供し、加速化されたシステムを稼働させます。セキュアなソフトウェア・サプライチェーン・プラクティスとセキュアブート・テクノロジーを使用して Red Hat が構築および署名した Red Hat リポジトリから、NVIDIA および AMD の AI アクセラレータードライバーを取得できるようになりました。1 つのコマンドを実行するだけで、利用可能な最新のアクセラレータードライバーをインストールできます。

GPU ドライバー管理の課題と Red Hat のソリューション

これまで、エンタープライズグレードの Linux ディストリビューションで GPU アクセラレーター・ドライバーをインストールして保守するには、一連の独自の課題が生じていました。ユーザーは多くの場合、次のような課題に直面していました。

  • ドライバーの互換性:特定のカーネルやハードウェアに適したドライバーのバージョンを確保する必要がある。
  • セキュリティと信頼:セキュアブートをサポートして、サードパーティ・ドライバーの信頼性と整合性を確認する必要がある。
  • メンテナンス・オーバーヘッド:ドライバーの手動アップデートおよびシステムアップデートとの潜在的な競合を管理する必要がある。

Red Hat のこの新しいサービスは、これらの課題に直接的に対応します。AMD、Intel、NVIDIA ドライバーを Red Hat リポジトリを通じて提供することで、Red Hat は、RHEL 上の AI ワークロードのデプロイと管理を単純化し、お客様に信頼性と制御性を提供します。

この新しいエクスペリエンスには以下が含まれます。

  • NVIDIA および AMD AI アクセラレーターのカーネルおよびユーザーモード・ドライバー。Red Hat によって構築および署名され (該当する場合) 、Red Hat リポジトリにパッケージ化されています。
  • 最新の NVIDIA および AMD データセンター AI アクセラレーター・ドライバーをシームレスにインストールするスクリプト。
  • アップストリームの Linux カーネルと統合された AMD および Intel のカーネルモード・ドライバー
 

カーネルモード・ドライバー

ユーザーモード・ドライバー

NVIDIA

RHEL Extensions Repository

CUDA Toolkit: Supplementary Repository

AMD

BaseOS, RHEL Extensions Repository

ROCm: RHEL Extensions Repository

Intel

BaseOS

なし

AI の取り組みにおける重要性

この新機能は、AI アクセラレーターを活用する RHEL ユーザーに複数の重要なメリットをもたらします。

  • 価値実現までの時間の短縮: ドライバーのインストールと管理の手間を減らすことで、チームはビジネスにとって重要なミッションクリティカルな AI ワークロードの構築とデプロイにより多くの時間を費やし、実際の運用までの時間を短縮できます。
  • セキュリティと信頼性の強化:すべてのドライバーは Red Hat によって構築および署名されており、サプライチェーンのセキュリティを強化し、機密コンピューティングと統合します。ドライバーは本物で改ざんされていないので、安心してデプロイできます。
  • 最適なアクセス: Red Hat エコシステム (Extensions および Supplementary リポジトリ) を通じて提供される、AI アクセラレーター・ハードウェアの操作に必要なすべてのドライバーを取得し、dnf コマンドを使用して既存の RHEL 更新ワークフローとシームレスに統合します。
  • パートナー検証による互換性の確保: ドライバーはパートナーによってテストおよび検証されており、安定性と RHEL カーネルとの互換性が確保されています。これにより、システムが不安定になるリスクが軽減され、AI インフラストラクチャの総合的な信頼性が向上します。

rhel-drivers による簡単なインストール

新しい rhel-drivers コマンドは、システムにあるデータセンタークラスの AI アクセラレーター・ハードウェアを自動的に検出し、使用している Linux カーネルのバージョンに基づいて利用可能な最新のカーネルモード・ドライバーを自動的にインストールします。この強力なツールを使用することにより、ドキュメントや製品の互換性についてのページを探し回る必要がなくなり、使用する AI ツールに必要な最新のアクセラレーターによるイノベーションの利点を得ることができます。

パートナーの検証:RHEL 上で AI アクセラレーターを確実に実行

Red Hat は長年にわたり、AMD、Intel、NVIDIA と協力し、共通のお客様に対してエンタープライズ・ソリューションを提供してきました。当社のパートナーは互換性、パフォーマンス、安定性を確保するために、RHEL で有意義なテストを実施してきました。

RHEL Extensions リポジトリおよび Supplementary リポジトリ

現在のソフトウェアのエコシステムには、さまざまな開発モデルとライセンスが混在しています。Red Hat は、現代の IT 環境で求められるビジネス価値を提供していく上で、多様なソフトウェアとツールを使用する必要があることを理解しています。この多様なエコシステムに対応できるように、お客様が複数のリポジトリにアクセスを提供しています。

AI アクセラレーターのエコシステムも同様に、オープンソースとプロプライエタリーなコンテンツを組み合わせて利用しています。RHEL Extensions および Supplementary レポジトリを使用すると、AI アクセラレーターの実行に必要なものをすべて Red Hat エコシステムから入手できます。

RHEL Extensions リポジトリ

RHEL Extensions リポジトリは、Red Hat が構築および署名したサードパーティのオープンソースコンテンツを配布するために作成され、安全なサプライチェーンの信頼性を提供します。

Red Hat Supplementary リポジトリ

Red Hat Supplementary リポジトリは、Red Hat が構築および署名したサードパーティのプロプライエタリー・コンテンツの場所です。

機密コンピューティング

Red Hat が構築および署名したドライバーにより、機密コンピューティングが可能になります。これは、セキュアなマルチテナント・クラウドのデプロイに極めて重要な要素です。

使い始める

RHEL でこれらの新しいドライバーを使い始めるのに役立つ手順を次に示します。

前提条件

  • Red Hat Enterprise Linux 10.1: システムで RHEL 10.1 以降が実行されていることを確認します。
  • アクティブな Red Hat サブスクリプション:Red Hat Extensions および Supplementary リポジトリにアクセスできる有効なサブスクリプションが必要です。
  • 互換性のある NVIDIA または AMD AI アクセラレーター:システムに対応する GPU がインストールされていることを確認します。AMD の場合は System requirements (Linux) — ROCm installation (Linux) を参照してください。Instinct GPU の場合は、BIOS 設定とカーネル引数については、システムの最適化についてのアドバイスを確認してください。

rhel-drivers を使用した単一コマンドによるインストール

rhel-drivers は、NVIDIA および AMD AI アクセラレーター・ドライバーの最適化されたスムーズなインストール・エクスペリエンスを提供する新しいコマンドラインツールです。パッケージは、RHEL 10.1 の Application Streams (AppStreams) リポジトリで入手可能です。AppStreams はデフォルトで有効にされています。rhel-drivers パッケージをインストールするだけで準備は完了です。 

rhel-drivers は、手動で行う必要のあるいくつかのステップを自動化できます。

  1. ローカルシステムに存在する AI アクセラレーターを自動的に検出します。
  2. RHEL Extensions および Supplementary リポジトリを有効化します。
  3. Red Hat リポジトリから利用可能な最新のドライバーをインストールします。
    • NVIDIA データセンター AI アクセラレーターの場合は、最新の OpenRM と cuda-toolkit ドライバーがインストールされます。
    • AMD データセンター AI アクセラレーターの場合は、RHEL Extensions リポジトリから最新の AMDGPU ドライバーがインストールされます。ユーザーは、Extensions リポジトリから AMD ROCm パッケージを別途インストールする必要があります。

rhel-drivers を使用した NVIDIA カーネルおよびユーザーモード・ドライバーのインストール

# Install the rhel-drivers package (not installed by default)
sudo dnf install rhel-drivers
# Install the NVIDIA kernel and user mode drivers
sudo rhel-drivers install nvidia
sudo reboot

正常にインストールされたことをテストするには、次のコマンドを実行します。

nvidia-smi

rhel-drivers を使用した AMD カーネルおよびユーザーモード・ドライバーのインストール

# Install the rhel-drivers package (not installed by default)
sudo dnf install rhel-drivers
# Install the AMD kernel mode drivers
sudo rhel-drivers install amdgpu
# Install the AMD ROCm (user mode drivers) from the Extensions Repository
sudo dnf install rocm rocm-devel
sudo reboot

想定どおりにインストールされていることをテストします。

$ rocm-smi --showid --showtemp --showpower --showmeminfo vram

手動ドライバーのインストール

すべての IT 環境が同じわけではないことが多く、必要なドライバーが必ずしも最新バージョンではない場合があります。他の既存バージョンの AI アクセラレーター・ドライバーが必要な環境の場合は、RHEL Extensions および Supplementary リポジトリから直接インストールできます。

1.Extensions および Supplementary リポジトリを有効にする

まず、RHEL バージョンに適したリポジトリを有効にします。RHEL 10 の場合

sudo subscription-manager repos 
--enable=rhel-10-for-x86_64-supplementary-rpms
sudo subscription-manager repos 
--enable=rhel-10-for-x86_64-extensions-rpms

RHEL システムが最新パッケージで最新の状態にされていることを確認します。

sudo dnf update
sudo reboot

Extensions と EPEL リポジトリの並行使用

推奨されるものではありませんが、Extensions と Extra Packages for Enterprise Linux (EPEL) リポジトリを並行して有効にする場合は、リポジトリの優先度を調整して、両方のリポジトリから利用可能なパッケージがデフォルトで Extensions からインストールされるようにする必要があります。

sudo subscription-manager repo-override 
--repo=rhel-10-for-x86_64-extensions-rpms --add=priority:98

リポジトリの優先度の定義については、DNF Configuration Reference を参照してください。

2.ドライバーパッケージを特定してインストールする

具体的なパッケージ名は、NVIDIA と AMD で若干異なります。

NVIDIA ドライバー

$ sudo dnf install nvidia-driver cuda-toolkit

利用可能なメタパッケージのリストについては、NVIDIA's list of meta packages を参照してください。

NVIDIA AI アクセラレーター ドライバー

通常は、kmod-nvidia パッケージと nvidia-driver のユーザー空間コンポーネントをインストールします。

$ sudo dnf install kmod-nvidia nvidia-driver

このコマンドは、システムに適したカーネルモジュールとユーザー空間ドライバーを自動的にプルします。

AMD AI アクセラレーター・ドライバー (ROCm)

AMD の場合は、最新の amdgpu カーネルドライバーと ROCm ユーザー空間スタックをインストールします。

$ sudo dnf install kmod-amdgpu rocm rocm-devel

3.システムをリブートする

インストール後は、システムをリブートして、新しいカーネルモジュールが正しくロードされるようにすることが極めて重要です。

$ sudo reboot

4.インストールを検証する

システムがリブートしたら、ドライバーがベンダー固有のコマンドでロードされたことを確認できます。たとえば、NVIDIA ドライバーがロードされ、GPU が認識されていることを検証するには、以下を実行します。

$ nvidia-smi

このような出力が表示され、NVIDIA GPU とドライバーのバージョンに関する詳細が表示されます。

Intel NPU カーネルモード・ドライバー:BaseOS での検証

Intel ドライバーは Linux カーネルにあるため、BaseOS リポジトリに含まれています。Intel NPU 互換 CPU は、Core Ultra Meteor Lake、Arrow Lake、Lunar Lake SoCs で検証されています。カーネルドライバーのサポートを確認するには、次のコマンドを実行します。

sudo modprobe -v intel_vpu
lsmod | grep intel_vpu

RHEL:将来の AI アプリケーションを構築するための基盤

Red Hat では、最も高度な AI アプリケーションとワークロードの開発とデプロイを可能にするエンタープライズ Linux プラットフォームとしての RHEL の開発に取り組んでいます。RHEL でのアクセラレーター・ドライバーのエクスペリエンスを継続的に向上させていくよう取り組んでいます。皆様のご意見をぜひお聞かせください。これらのドライバーと新しいインストール・エクスペリエンスを RHEL で今すぐお試しください。 

製品トライアル

Red Hat Enterprise Linux | 製品トライアル

Red Hat Enterprise Linux のバージョンの 1 つで、ハードウェアリソースをオーケストレーションします。物理システムやクラウド上、またはハイパーバイザーのゲストとして実行できます。

執筆者紹介

James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.

UI_Icon-Red_Hat-Close-A-Black-RGB

チャンネル別に見る

automation icon

自動化

テクノロジー、チームおよび環境に関する IT 自動化の最新情報

AI icon

AI (人工知能)

お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート

open hybrid cloud icon

オープン・ハイブリッドクラウド

ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。

security icon

セキュリティ

環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報

edge icon

エッジコンピューティング

エッジでの運用を単純化するプラットフォームのアップデート

Infrastructure icon

インフラストラクチャ

世界有数のエンタープライズ向け Linux プラットフォームの最新情報

application development icon

アプリケーション

アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細

Virtualization icon

仮想化

オンプレミスまたは複数クラウドでのワークロードに対応するエンタープライズ仮想化の将来についてご覧ください