El mundo de la informática de alto rendimiento (HPC) impulsa muchos de los principales avances científicos en todo el mundo. Red Hat Enterprise Linux (RHEL) es una de las plataformas empresariales de Linux más confiables y sirve como base para muchas de estas cargas de trabajo de HPC, y presta servicios a sectores como el automotriz, de servicios financieros, biomédico, energético y muchos más.
Mientras tanto, la nube pública sigue ganando terreno en el mercado informático en general, ya que ofrece una gran flexibilidad y una infraestructura dinámica. Esta tendencia también ha surgido para la HPC, ya que las empresas buscan aprovechar esa misma flexibilidad y capacidad informática adicional para ajustar los clústeres de HPC según sea necesario, lo que acorta los ciclos de investigación o desarrollo de productos.
Por eso, nos complace presentar una nueva oferta: RHEL for HPC on Azure. Nos asociamos estrechamente con Microsoft para identificar los requisitos técnicos y acelerar el tiempo de implementación para nuestros clientes compartidos. Con RHEL para HPC en Azure, obtienes la automatización que instala las herramientas y las bibliotecas necesarias para un entorno informático acelerado de HPC en la infraestructura de Azure.
Presentación de la función del sistema HPC de RHEL
La oferta de RHEL HPC 9.6 para la nube de Azure se basa en las funciones del sistema de RHEL.
La función del sistema HPC de RHEL es un rol de Red Hat Ansible Automation Platform diseñado específicamente para simplificar la implementación y la configuración de los entornos de HPC. Esta función del sistema instala los componentes de terceros necesarios que, de lo contrario, los clientes tendrían que integrar manualmente, como NVIDIA CUDA Driver, CUDA Toolkit, NVIDIA Collective Communications Library (NCCL), NVIDIA Fabric Manager, los paquetes NVIDIA RDMA y Open MPI. Es modular, lo que permite que los usuarios instalen u omitan paquetes específicos de forma selectiva y ofrece funciones como la configuración de volúmenes de almacenamiento para garantizar que se asigne suficiente espacio en el disco para estas grandes instalaciones en Azure.
Ahora puedes seleccionar la lista de imágenes de HPC de RHEL en Azure Marketplace. Una vez que se inicia la instancia de máquina virtual (VM), solo necesitas seguir algunos comandos básicos para ejecutar la función del sistema HPC de RHEL (que ya está instalada en la imagen). Una vez que las funciones del sistema hayan descargado todos los paquetes de HPC relevantes, puedes guardar esta imagen como imagen de referencia y crear varias instancias de HPC basadas en ella.
La función del sistema HPC de RHEL permite que Red Hat lance paquetes de HPC de forma permanente durante los próximos 12 meses (proceso rápido), y evita la necesidad de alinearse por completo con la frecuencia de lanzamiento de RHEL de 6 meses (proceso lento). A medida que crezca la oferta de Red Hat, tendrás la opción de utilizar las versiones de RHEL (RHEL9.8, RHEL9.9, RHEL10.2, y así sucesivamente) o las versiones más recientes de la función del sistema RHEL HPC.
¿Qué ofrecemos?
El objetivo del MVP de HPC para RHEL es producir una instancia de imagen optimizada para Azure que se pueda implementar con Azure CycleCloud, que es la plataforma de Microsoft para la creación y la gestión integral de clústeres de HPC. Los clientes de HPC suelen aprovechar CycleCloud, que se encarga de las tareas complejas de gestión y preparación de los clústeres.
Red Hat lanza su oferta optimizada de HPC de RHEL para Azure Marketplace, la cual se centra en la función del sistema de HPC de RHEL que se desarrolló recientemente y se distribuye a través de Ansible, y está dirigida a las imágenes de RHEL 9.6. Esta oferta mejora considerablemente la experiencia de implementación para los entornos de HPC en las imágenes de RHEL.
Esta función del sistema está diseñada para integrar una serie de dependencias principales esenciales para las cargas de trabajo modernas de HPC:
- NVIDIA CUDA Driver: instala los controladores y los módulos propietarios del kernel necesarios para habilitar la GPU de NVIDIA para los procesos informáticos.
- NVIDIA CUDA Toolkit: contiene el entorno de desarrollo necesario para escribir aplicaciones que utilizan la infraestructura de CUDA.
- NVIDIA Collective Communications Library (NCCL): elementos básicos optimizados para la comunicación entre las GPU. Esta biblioteca es fundamental para los entornos con varias GPU y se incluye en el repositorio de NVIDIA.
- NVIDIA Fabric Manager: este paquete está relacionado con InfiniBand y los servicios de red, en especial las funciones de soporte, como NVSwitch, las cuales son esenciales para las interconexiones de alta velocidad entre las GPU.
- Open MPI (Message Passing Interface): se trata de un estándar fundamental para las tareas de HPC distribuidas que permite la comunicación entre los nodos de un clúster.
Para obtener más información sobre la implementación de esta solución, consulta la documentación de la función del sistema RHEL Azure HPC.
Hacia dónde nos dirigimos
Este MVP de la versión inicial es el primer paso hacia una oferta completa, ya que proporciona aún más herramientas, bibliotecas y configuraciones necesarias para ejecutar cargas de trabajo de HPC en Azure. En los próximos meses, lanzaremos actualizaciones que incorporarán aún más contenido esencial de HPC, el cual nuestros especialistas de Red Hat probarán y validarán. Los clientes que adquieran el MVP tendrán acceso a estas actualizaciones y a las funciones ampliadas de esta oferta.
Aprovecha la capacidad de la HPC en la nube hoy mismo
Desde hace mucho tiempo, Red Hat es un partner de confianza en el mundo de la HPC, lo cual facilita los descubrimientos científicos y el desarrollo de productos. Nos entusiasma ser un partner de confianza en la expansión de la HPC de nuestros clientes a la nube. Con RHEL para HPC en Azure, los clientes pueden implementar sus clústeres de HPC en la infraestructura de Azure más rápido que nunca.
Esta oferta se encuentra en Azure Marketplace y está disponible con el nombre Red Hat Enterprise Linux (RHEL) for High Performance Computing (HPC) on Azure. Pruébala hoy mismo y agiliza las implementaciones de la HPC.
Prueba del producto
Prueba del producto Red Hat Enterprise Linux
Sobre los autores
James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.
Más como éste
More than meets the eye: Behind the scenes of Red Hat Enterprise Linux 10 (Part 4)
Looking ahead to 2026: Red Hat’s view across the hybrid cloud
OS Wars_part 1 | Command Line Heroes
OS Wars_part 2: Rise of Linux | Command Line Heroes
Navegar por canal
Automatización
Las últimas novedades en la automatización de la TI para los equipos, la tecnología y los entornos
Inteligencia artificial
Descubra las actualizaciones en las plataformas que permiten a los clientes ejecutar cargas de trabajo de inteligecia artificial en cualquier lugar
Nube híbrida abierta
Vea como construimos un futuro flexible con la nube híbrida
Seguridad
Vea las últimas novedades sobre cómo reducimos los riesgos en entornos y tecnologías
Edge computing
Conozca las actualizaciones en las plataformas que simplifican las operaciones en el edge
Infraestructura
Vea las últimas novedades sobre la plataforma Linux empresarial líder en el mundo
Aplicaciones
Conozca nuestras soluciones para abordar los desafíos más complejos de las aplicaciones
Virtualización
El futuro de la virtualización empresarial para tus cargas de trabajo locales o en la nube