Die Welt des High-Performance Computings (HPC) ist der Motor für viele der wichtigsten wissenschaftlichen Fortschritte. Als eine bewährte Linux-Plattformen für Unternehmen dient Red Hat Enterprise Linux (RHEL) als Basis für viele dieser HPC-Workloads und wird in Branchen wie der Automobilbranche, dem Finanzdienstleistungssektor, der Biomedizin, dem Energiesektor und darüber hinaus eingesetzt.
Unterdessen hat die Public Cloud auf dem breiteren Markt der Datenverarbeitung weiter an Bedeutung gewonnen und bietet eine enorme Flexibilität und dynamische Infrastruktur. Dieser Trend zeichnet sich auch für HPC ab. Unternehmen möchten diese Flexibilität und zusätzliche Rechenkapazität nutzen, um HPC-Cluster nach Bedarf zu skalieren und so ihre Produktentwicklungs- oder Forschungszyklen zu verkürzen.
Aus diesem Grund freuen wir uns über den Launch eines neuen Angebots: RHEL für HPC auf Azure. Wir haben eng mit Microsoft zusammengearbeitet, um die technischen Anforderungen zu ermitteln, mit denen wir die Zeit bis zum Deployment für unsere gemeinsamen Kunden verkürzen können. Mit RHEL für HPC auf Azure werden die Tools und Libraries, die für eine beschleunigte HPC-Compute-Umgebung auf Azure-Infrastruktur erforderlich sind, über einen Automatisierungsprozess installiert.
Einführung der RHEL HPC-Systemrolle
Das Cloud-Angebot RHEL HPC 9.6 für Azure basiert auf RHEL-Systemrollen.
Die RHEL HPC-Systemrolle ist eine Rolle in Red Hat Ansible Automation Platform, die speziell dafür entwickelt wurde, das Deployment und die Konfiguration von HPC-Umgebungen zu vereinfachen. Diese Systemrolle installiert die erforderlichen Drittanbieterkomponenten, die Kunden andernfalls manuell integrieren müssen, z. B. NVIDIA CUDA-Treiber, CUDA-Toolkit, NVIDIA Collective Communications Library (NCCL), NVIDIA Fabric Manager, NVIDIA RDMA-Pakete und Open MPI. Sie ist modular aufgebaut und ermöglicht Nutzenden, bestimmte Pakete selektiv zu installieren oder zu überspringen. Außerdem bietet sie Funktionen wie das Konfigurieren von Storage Volumes, um sicherzustellen, dass genügend Speicherplatz für diese großen Installationen auf Azure zugewiesen wird.
Sie können ab sofort das RHEL HPC-Image auswählen, das im Azure Marketplace angeboten wird. Nach dem Starten der VM-Instanz müssen Sie nur einige grundlegende Befehle ausführen, um die (bereits auf dem Image installierte) RHEL HPC-Systemrolle auszuführen. Wenn die Systemrollen alle relevanten HPC-Pakete heruntergeladen haben, können Sie dieses Image als Master Image speichern und darauf basierend mehrere HPC-Instanzen erstellen.
Mit der RHEL HPC-Systemrolle kann Red Hat HPC-Pakete innerhalb der nächsten 12 Monate kontinuierlich veröffentlichen (Fast Path), ohne dass eine vollständige Anpassung an die RHEL-Release-Kadenz von 6 Monaten (Slow Path) erforderlich ist. Wenn das Angebot von Red Hat wächst, können Sie davon ausgehen, dass Sie die Möglichkeit haben werden, sowohl die RHEL-Releases (RHEL 9.8, RHEL 9.9, RHEL10.2 usw.) als auch die neuesten Versionen der RHEL HPC-Systemrolle zu nutzen.
Was bieten wir an?
Ziel des RHEL HPC-MVP ist die Erstellung einer für Azure optimierten Image-Instanz, die über Azure CycleCloud bereitgestellt werden kann. Hierbei handelt es sich um die Plattform von Microsoft für die End-to-End-Erstellung und -Verwaltung von HPC-Clustern. HPC-Kunden nutzen häufig CycleCloud, das von Haus aus komplexe Cluster-Management- und -Provisionierungsaufgaben übernimmt.
Red Hat startet sein optimiertes RHEL HPC-Angebot für den Azure Marketplace, basierend auf der neu entwickelten RHEL HPC-Systemrolle, die über Ansible bereitgestellt wird und auf RHEL 9.6-Images abzielt. Dieses Angebot erweitert das Deployment-Erlebnis für HPC-Umgebungen auf RHEL-Images erheblich.
Diese Systemrolle ist auf die Integration zahlreicher Kernabhängigkeiten ausgelegt, die für moderne HPC-Workloads unerlässlich sind:
- NVIDIA CUDA-Treiber: Installiert die erforderlichen proprietären Kernel-Module und -Treiber, um die NVIDIA-GPU für die Berechnung zu aktivieren.
- NVIDIA CUDA-Toolkit: Enthält die Entwicklungsumgebung, die zum Schreiben von Anwendungen erforderlich ist, die die CUDA-Infrastruktur nutzen.
- NVIDIA Collective Communications Library (NCCL): Optimierte Primitive für die Kommunikation zwischen GPUs. Diese Library ist für Multi-GPU-Szenarien von entscheidender Bedeutung und im NVIDIA-Repository enthalten.
- NVIDIA Fabric Manager: Dieses Paket bezieht sich auf InfiniBand und Netzwerkdienstprogramme, insbesondere auf die Unterstützung von Funktionen wie NVSwitch, der für Hochgeschwindigkeitsverbindungen zwischen GPUs unerlässlich ist.
- Open MPI (Message Passing Interface): Ein grundlegender Standard für verteilte HPC-Jobs, der die Kommunikation zwischen Knoten in einem Cluster ermöglicht.
Weitere Informationen zum Deployment dieser Lösung finden Sie in der Dokumentation zur RHEL Azure HPC-Systemrolle.
Unser Ziel
Dieses MVP (erstes Release) ist der erste Schritt zu einem umfassenden Angebot, das noch mehr Tools, Libraries und Konfigurationen bietet, die für die Ausführung von HPC-Workloads auf Azure erforderlich sind. In den kommenden Monaten werden wir Updates veröffentlichen, die noch mehr dieser wichtigen HPC-Inhalte enthalten, die von unseren Fachleuten bei Red Hat getestet und validiert werden. Kunden, die das MVP erwerben, erhalten Zugriff auf diese Updates und können die Funktionen dieses Angebots erweitern.
Erschließen Sie noch heute Ihre Cloud-HPC-Kapazität
Red Hat ist bereits ein zuverlässiger Partner in der Welt des HPC und ermöglicht nicht nur die wissenschaftliche Forschung, sondern auch die Produktentwicklung. Wir freuen uns, ein zuverlässiger Partner bei der HPC-Erweiterung unserer Kunden in die Cloud zu sein. Mit RHEL für HPC auf Azure können Kunden ihre HPC-Cluster schneller als je zuvor auf Azure-Infrastruktur bereitstellen.
Dieses Angebot ist im Azure Marketplace verfügbar und unter dem Namen Red Hat Enterprise Linux (RHEL) for High Performance Computing (HPC) on Azure verfügbar. Testen Sie es noch heute, und beschleunigen Sie Ihre HPC-Deployments.
Produkttest
Red Hat Enterprise Linux | Testversion
Über die Autoren
James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.
Ähnliche Einträge
More than meets the eye: Behind the scenes of Red Hat Enterprise Linux 10 (Part 4)
Why should your organization standardize on Red Hat Enterprise Linux today?
The Overlooked Operating System | Compiler: Stack/Unstuck
Linux, Shadowman, And Open Source Spirit | Compiler
Nach Thema durchsuchen
Automatisierung
Das Neueste zum Thema IT-Automatisierung für Technologien, Teams und Umgebungen
Künstliche Intelligenz
Erfahren Sie das Neueste von den Plattformen, die es Kunden ermöglichen, KI-Workloads beliebig auszuführen
Open Hybrid Cloud
Erfahren Sie, wie wir eine flexiblere Zukunft mit Hybrid Clouds schaffen.
Sicherheit
Erfahren Sie, wie wir Risiken in verschiedenen Umgebungen und Technologien reduzieren
Edge Computing
Erfahren Sie das Neueste von den Plattformen, die die Operations am Edge vereinfachen
Infrastruktur
Erfahren Sie das Neueste von der weltweit führenden Linux-Plattform für Unternehmen
Anwendungen
Entdecken Sie unsere Lösungen für komplexe Herausforderungen bei Anwendungen
Virtualisierung
Erfahren Sie das Neueste über die Virtualisierung von Workloads in Cloud- oder On-Premise-Umgebungen