HPC (高性能計算) の世界は、世界中の主要な科学的進歩の多くを推進しています。最も信頼されている企業用 Linux プラットフォームの 1 つである Red Hat Enterprise Linux (RHEL) は、これらの HPC ワークロードの多くの基盤として機能し、自動車、金融サービス、バイオ医療、エネルギーなどの業界で活用されています。
また、パブリッククラウドは、広範なコンピューティング市場で引き続き勢いを増していて、非常に高い柔軟性と動的なインフラストラクチャを提供しています。この傾向は HPC でも進んでおり、組織はその柔軟性と追加のコンピューティング能力を活用して、HPC クラスタをオンデマンドでスケーリングし、製品開発や研究サイクルを短縮することを目指しています。
そこで今回、新オファリングの RHEL for HPC on Azure の提供が開始されました。Red Hat はマイクロソフトと密接に連携し、共通のお客様のデプロイ時間を短縮するための技術要件を特定しました。RHEL for HPC on Azure を使用すると、Azure インフラストラクチャ上の HPC コンピューティング環境の高速化に必要なツールとライブラリをインストールする自動化を利用できます。
RHEL HPC システムロールの紹介
Azure 用の RHEL HPC 9.6 クラウドサービスは、RHEL システムロール をベースとしています。
RHEL HPC システムロールは、HPC 環境のデプロイと設定を単純化するために特別に設計された Red Hat Ansible Automation Platform のロールです。このシステムロールは、NVIDIA CUDA Driver、CUDA Toolkit、NVIDIA Collective Communications Library (NCCL)、NVIDIA Fabric Manager、NVIDIA RDMA パッケージ、Open MPI など、本来は手動で統合する必要があるサードパーティーのコンポーネントをインストールします。これはモジュール式であり、ユーザーは特定のパッケージを選択してインストールするか、またはスキップすることができます。また、Azure での大規模なインストールに十分なディスク容量が割り当てられるようにストレージボリュームを構成するなどの機能を提供します。
Azure Marketplace で RHEL HPC イメージのリストを選択できるようになりました。仮想マシン (VM) インスタンスが起動されたら、いくつかの基本コマンドに従って RHEL HPC システムロール (すでにイメージにインストールされています) を実行するだけです。システムロールによって関連するすべての HPC パッケージがダウンロードされたら、このイメージをゴールデンイメージとして保存し、これをベースとして複数の HPC インスタンスを作成できます。
RHEL HPC システムロールにより、Red Hat は今後 12 カ月間 (高速パス) にわたり継続的に HPC パッケージをリリースしていきます。この際、6 カ月 (低速パス) という RHEL リリースの頻度に完全に対応する必要はありません。 Red Hat の製品が拡大するにつれて、RHEL リリース (RHEL9.8、RHEL9.9、RHEL10.2 など) または最新バージョンの RHEL HPC システムロールを使用する選択肢が増えます。
提供内容
RHEL HPC MVP の目標は、Azure CycleCloud によってデプロイ可能な Azure 用に最適化されたイメージインスタンスを生成することです。これは、エンドツーエンドの HPC クラスタの作成と管理のための Microsoft のプラットフォームです。HPC のお客様は多くの場合、複雑なクラスタ管理やプロビジョニングタスクを処理する CycleCloud を活用されています。
Red Hat は、RHEL 9.6 イメージを対象として、Ansible を通じて提供される新たに開発された RHEL HPC システムロールを中心とした、Azure Marketplace 向けの最適化された RHEL HPC 製品の提供を開始しています。このオファリングにより、RHEL イメージでの HPC 環境のデプロイメント・エクスペリエンスが大幅に強化されます。
このシステムロールは、先進的な HPC ワークロードに不可欠な多数のコアとなる依存関係を統合するように設計されています。
- NVIDIA CUDA Driver:NVIDIA GPU でのコンピューティングを有効にするために必要なプロプライエタリーのカーネル・モジュールとドライバーをインストールします。
- NVIDIA CUDA Toolkit:CUDA インフラストラクチャを使用するアプリケーションの作成に必要な開発環境が含まれています。
- NVIDIA Collective Communications Library (NCCL):GPU 間の通信用に最適化されたプリミティブです。このライブラリはマルチ GPU シナリオに不可欠であり、NVIDIA リポジトリに含まれています。
- NVIDIA Fabric Manager:このパッケージは、InfiniBand およびネットワーキングユーティリティーに関連しており、とくに GPU 間の高速相互接続に不可欠な NVSwitch などの機能をサポートしています。
- Open MPI (Message Passing Interface):クラスタ内のノード間の通信を可能にする、分散 HPC ジョブの基本標準です。
このソリューションのデプロイ方法の追加情報については、RHEL Azure HPC システムロールについてのドキュメントを参照してください。
ゴール
この初期リリースの MVP は、完全にそろったオファリングに向けた第一歩であり、Azure 上で HPC ワークロードを実行する際に必要となる、さらに多くのツール、ライブラリ、構成が提供されます。今後数カ月にわたり、Red Hat のエキスパートによってテストされ、検証された、この重要な HPC コンテンツをさらに追加したアップデートをリリースしていきます。MVP を購入するお客様は、このオファリングのこれらのアップデートや拡張機能にアクセスできます。
今すぐクラウド HPC の能力を活用する
Red Hat は長年にわたって HPC の世界で信頼されるパートナーとして、科学的発見と製品開発を可能にしてきました。当社は、お客様が HPC のクラウドへの拡張においてもパートナーとして信頼してくださっていることを嬉しく思っています。RHEL for HPC on Azure を使用するお客様は、これまで以上に迅速に HPC クラスタを Azure インフラストラクチャにデプロイできます。
このオファリングは Azure Marketplace で入手でき、Red Hat Enterprise Linux (RHEL) for High Performance Computing (HPC) on Azure という名前で提供されています。今すぐ試して、HPC のデプロイを加速してください。
製品トライアル
Red Hat Enterprise Linux | 製品トライアル
執筆者紹介
James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.
チャンネル別に見る
自動化
テクノロジー、チームおよび環境に関する IT 自動化の最新情報
AI (人工知能)
お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート
オープン・ハイブリッドクラウド
ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。
セキュリティ
環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報
エッジコンピューティング
エッジでの運用を単純化するプラットフォームのアップデート
インフラストラクチャ
世界有数のエンタープライズ向け Linux プラットフォームの最新情報
アプリケーション
アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細
仮想化
オンプレミスまたは複数クラウドでのワークロードに対応するエンタープライズ仮想化の将来についてご覧ください