Il mondo dell'High Performance Computing (HPC) è oggi alla base di gran parte dei principali progressi scientifici in tutto il mondo. Essendo una delle piattaforme Linux aziendali più affidabili, Red Hat Enterprise Linux (RHEL) funge da base per molti di questi carichi di lavoro HPC, che servono i settori automotive, dei servizi finanziari, biomedico, dell’energia e altri.
Nel frattempo, il cloud pubblico ha continuato a prendere piede nel più ampio mercato dell'elaborazione, offrendo un'infrastruttura dinamica e un'eccezionale flessibilità. Questa tendenza è emersa anche per l'HPC, con le organizzazioni che cercano di sfruttare la stessa flessibilità e capacità di elaborazione per ridimensionare i cluster HPC on demand, abbreviando i cicli di ricerca e sviluppo dei prodotti.
Ecco perché siamo entusiasti di lanciare una nuova offerta: RHEL for HPC on Azure. Abbiamo stretto una collaborazione con Microsoft per identificare i requisiti tecnici necessari al fine di accelerare i tempi di deployment per i nostri clienti condivisi. RHEL for HPC su Azure offre l'automazione in grado di installare gli strumenti e le librerie necessari per un ambiente di elaborazione HPC accelerato sull'infrastruttura Azure.
Introduzione al ruolo di sistema RHEL HPC
L'offerta RHEL HPC 9.6 for Azure cloud si basa sui RHEL system roles.
Il ruolo di sistema RHEL HPC è un ruolo di Red Hat Ansible Automation Platform progettato in modo specifico per semplificare il deployment e la configurazione degli ambienti HPC. Questo ruolo di sistema installa i componenti di terze parti necessari che i clienti dovrebbero altrimenti integrare manualmente, come NVIDIA CUDA Driver, CUDA Toolkit, NVIDIA Collective Communications Library (NCCL), NVIDIA Fabric Manager, i pacchetti NVIDIA RDMA e Open MPI. È modulare e consente agli utenti di installare o ignorare selettivamente pacchetti specifici. Offre inoltre funzionalità come la configurazione dei volumi di storage per garantire un'allocazione sufficiente di spazio su disco per queste grandi installazioni su Azure.
Ora puoi selezionare l'elenco delle immagini RHEL HPC nel marketplace di Azure. Dopo aver avviato l'istanza della macchina virtuale (VM), è sufficiente seguire alcuni comandi di base per eseguire il ruolo di sistema RHEL HPC (già installato nell'immagine). Dopo che i ruoli di sistema avranno scaricato tutti i pacchetti HPC pertinenti, potrai salvare l'immagine come golden image e creare più istanze HPC basate si di essa.
Il ruolo di sistema RHEL HPC consente a Red Hat di rilasciare continuamente pacchetti HPC nei 12 mesi successivi (percorso rapido), evitando al contempo di allinearsi completamente alla cadenza di rilascio di RHEL di 6 mesi (percorso lento). Con l'ampliamento dell'offerta Red Hat, hai la possibilità di utilizzare sia le versioni di RHEL (RHEL9.8, RHEL9.9, RHEL10.2 e così via) che le versioni più recenti del ruolo di sistema RHEL HPC.
Cosa offriamo?
L'obiettivo della versione base di RHEL HPC è produrre un'istanza dell'immagine, ottimizzata per Azure, distribuibile su Azure CycleCloud, la piattaforma di Microsoft per la creazione e la gestione di cluster HPC end to end. I clienti HPC spesso si avvalgono di CycleCloud, che intrinsecamente gestisce complesse attività di provisioning e gestione dei cluster.
Red Hat sta lanciando la sua offerta ottimizzata per RHEL HPC su Azure Marketplace; è incentrata sul ruolo di sistema RHEL HPC di nuova concezione distribuito tramite Ansible e destinato alle immagini RHEL 9.6. Questa offerta migliora notevolmente l'esperienza di deployment per gli ambienti HPC su immagini RHEL.
Questo ruolo di sistema è progettato per integrare una serie di dipendenze essenziali per i carichi di lavoro HPC moderni.
- NVIDIA CUDA Driver: installa i moduli e i driver del kernel proprietari necessari per abilitare la GPU NVIDIA per l'elaborazione.
- NVIDIA CUDA Toolkit: contiene l'ambiente di sviluppo necessario per la scrittura di applicazioni che utilizzano l'infrastruttura CUDA.
- NVIDIA Collective Communications Library (NCCL): primitive ottimizzate per la comunicazione tra GPU. Questa libreria è fondamentale per gli scenari multi-GPU ed è inclusa nel repository NVIDIA.
- NVIDIA Fabric Manager: questo pacchetto è correlato a InfiniBand e alle utility di rete, in particolare per il supporto di funzionalità come NVSwitch, essenziali per le interconnessioni ad alta velocità tra le GPU.
- Open MPI (Message Passing Interface): uno standard fondamentale per i processi HPC distribuiti, che consente la comunicazione tra i nodi in un cluster.
Per ulteriori informazioni su come distribuire questa soluzione, consulta la documentazione sui ruoli di sistema RHEL Azure HPC .
Prospettive future
Questa versione base è il primo passo verso un'offerta completa, che fornisce ulteriori strumenti, librerie e configurazioni necessari per l'esecuzione di carichi di lavoro HPC su Azure. Nei prossimi mesi rilasceremo aggiornamenti che incorporeranno altri contenuti HPC critici, testati e convalidati dai nostri esperti di Red Hat. I clienti che acquistano la versione base avranno accesso agli aggiornamenti e alle funzionalità estese di questa offerta.
Sfrutta oggi stesso la capacità del cloud HPC
Red Hat è da tempo un partner di fiducia nel mondo dell'HPC, perché ha consentito scoperte scientifiche e lo sviluppo di diversi prodotti. Siamo entusiasti di poter essere un partner affidabile per l'espansione dell'HPC nel cloud. Con RHEL for HPC on Azure, i clienti possono distribuire i cluster HPC sull'infrastruttura Azure in tempi più rapidi.
Questa offerta è disponibile sul marketplace di Azure con il nome Red Hat Enterprise Linux (RHEL) for High Performance Computing (HPC) on Azure. Provala subito e accelera i deployment HPC.
Prova prodotto
Red Hat Enterprise Linux | Versione di prova
Sugli autori
James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.
Altri risultati simili a questo
More than meets the eye: Behind the scenes of Red Hat Enterprise Linux 10 (Part 4)
Why should your organization standardize on Red Hat Enterprise Linux today?
The Overlooked Operating System | Compiler: Stack/Unstuck
Linux, Shadowman, And Open Source Spirit | Compiler
Ricerca per canale
Automazione
Novità sull'automazione IT di tecnologie, team e ambienti
Intelligenza artificiale
Aggiornamenti sulle piattaforme che consentono alle aziende di eseguire carichi di lavoro IA ovunque
Hybrid cloud open source
Scopri come affrontare il futuro in modo più agile grazie al cloud ibrido
Sicurezza
Le ultime novità sulle nostre soluzioni per ridurre i rischi nelle tecnologie e negli ambienti
Edge computing
Aggiornamenti sulle piattaforme che semplificano l'operatività edge
Infrastruttura
Le ultime novità sulla piattaforma Linux aziendale leader a livello mondiale
Applicazioni
Approfondimenti sulle nostre soluzioni alle sfide applicative più difficili
Virtualizzazione
Il futuro della virtualizzazione negli ambienti aziendali per i carichi di lavoro on premise o nel cloud