El mundo de la informática de alto rendimiento (HPC) impulsa muchos de los principales avances científicos en todo el mundo. Red Hat Enterprise Linux (RHEL) es una de las plataformas empresariales de Linux más confiables y sirve como base para muchas de estas cargas de trabajo de HPC, y presta servicios a sectores como el automotriz, de servicios financieros, biomédico, energético y muchos más.

Mientras tanto, la nube pública sigue ganando terreno en el mercado informático en general, ya que ofrece una gran flexibilidad y una infraestructura dinámica. Esta tendencia también ha surgido para la HPC, ya que las empresas buscan aprovechar esa misma flexibilidad y capacidad informática adicional para ajustar los clústeres de HPC según sea necesario, lo que acorta los ciclos de investigación o desarrollo de productos.

Por eso, nos complace presentar una nueva oferta: RHEL for HPC on Azure. Nos asociamos estrechamente con Microsoft para identificar los requisitos técnicos y acelerar el tiempo de implementación para nuestros clientes compartidos. Con RHEL para HPC en Azure, obtienes la automatización que instala las herramientas y las bibliotecas necesarias para un entorno informático acelerado de HPC en la infraestructura de Azure.

Presentación de la función del sistema HPC de RHEL

La oferta de RHEL HPC 9.6 para la nube de Azure se basa en las funciones del sistema de RHEL

La función del sistema HPC de RHEL es un rol de Red Hat Ansible Automation Platform diseñado específicamente para simplificar la implementación y la configuración de los entornos de HPC. Esta función del sistema instala los componentes de terceros necesarios que, de lo contrario, los clientes tendrían que integrar manualmente, como NVIDIA CUDA Driver, CUDA Toolkit, NVIDIA Collective Communications Library (NCCL), NVIDIA Fabric Manager, los paquetes NVIDIA RDMA y Open MPI. Es modular, lo que permite que los usuarios instalen u omitan paquetes específicos de forma selectiva y ofrece funciones como la configuración de volúmenes de almacenamiento para garantizar que se asigne suficiente espacio en el disco para estas grandes instalaciones en Azure. 

Ahora puedes seleccionar la lista de imágenes de HPC de RHEL en Azure Marketplace. Una vez que se inicia la instancia de máquina virtual (VM), solo necesitas seguir algunos comandos básicos para ejecutar la función del sistema HPC de RHEL (que ya está instalada en la imagen). Una vez que las funciones del sistema hayan descargado todos los paquetes de HPC relevantes, puedes guardar esta imagen como imagen de referencia y crear varias instancias de HPC basadas en ella.  

La función del sistema HPC de RHEL permite que Red Hat lance paquetes de HPC de forma permanente durante los próximos 12 meses (proceso rápido), y evita la necesidad de alinearse por completo con la frecuencia de lanzamiento de RHEL de 6 meses (proceso lento). A medida que crezca la oferta de Red Hat, tendrás la opción de utilizar las versiones de RHEL (RHEL9.8, RHEL9.9, RHEL10.2, y así sucesivamente) o las versiones más recientes de la función del sistema RHEL HPC. 

Azure RHEL HPC offering in the market place

¿Qué ofrecemos?

El objetivo del MVP de HPC para RHEL es producir una instancia de imagen optimizada para Azure que se pueda implementar con Azure CycleCloud, que es la plataforma de Microsoft para la creación y la gestión integral de clústeres de HPC. Los clientes de HPC suelen aprovechar CycleCloud, que se encarga de las tareas complejas de gestión y preparación de los clústeres. 

Red Hat lanza su oferta optimizada de HPC de RHEL para Azure Marketplace, la cual se centra en la función del sistema de HPC de RHEL que se desarrolló recientemente y se distribuye a través de Ansible, y está dirigida a las imágenes de RHEL 9.6. Esta oferta mejora considerablemente la experiencia de implementación para los entornos de HPC en las imágenes de RHEL. 

Esta función del sistema está diseñada para integrar una serie de dependencias principales esenciales para las cargas de trabajo modernas de HPC: 

  • NVIDIA CUDA Driver: instala los controladores y los módulos propietarios del kernel necesarios para habilitar la GPU de NVIDIA para los procesos informáticos.
  • NVIDIA CUDA Toolkit: contiene el entorno de desarrollo necesario para escribir aplicaciones que utilizan la infraestructura de CUDA.
  • NVIDIA Collective Communications Library (NCCL): elementos básicos optimizados para la comunicación entre las GPU. Esta biblioteca es fundamental para los entornos con varias GPU y se incluye en el repositorio de NVIDIA.
  • NVIDIA Fabric Manager: este paquete está relacionado con InfiniBand y los servicios de red, en especial las funciones de soporte, como NVSwitch, las cuales son esenciales para las interconexiones de alta velocidad entre las GPU.
  • Open MPI (Message Passing Interface): se trata de un estándar fundamental para las tareas de HPC distribuidas que permite la comunicación entre los nodos de un clúster.

Para obtener más información sobre la implementación de esta solución, consulta la documentación de la función del sistema RHEL Azure HPC.

Hacia dónde nos dirigimos

Este MVP de la versión inicial es el primer paso hacia una oferta completa, ya que proporciona aún más herramientas, bibliotecas y configuraciones necesarias para ejecutar cargas de trabajo de HPC en Azure. En los próximos meses, lanzaremos actualizaciones que incorporarán aún más contenido esencial de HPC, el cual nuestros especialistas de Red Hat probarán y validarán. Los clientes que adquieran el MVP tendrán acceso a estas actualizaciones y a las funciones ampliadas de esta oferta.

Aprovecha la capacidad de la HPC en la nube hoy mismo

Desde hace mucho tiempo, Red Hat es un partner de confianza en el mundo de la HPC, lo cual facilita los descubrimientos científicos y el desarrollo de productos. Nos entusiasma ser un partner de confianza en la expansión de la HPC de nuestros clientes a la nube. Con RHEL para HPC en Azure, los clientes pueden implementar sus clústeres de HPC en la infraestructura de Azure más rápido que nunca.

Esta oferta se encuentra en Azure Marketplace y está disponible con el nombre Red Hat Enterprise Linux (RHEL) for High Performance Computing (HPC) on Azure. Pruébala hoy mismo y agiliza las implementaciones de la HPC.

Prueba del producto

Prueba del producto Red Hat Enterprise Linux

Versión de Red Hat Enterprise Linux que organiza los recursos de hardware y se ejecuta en los sistemas físicos, en la nube o como guest de un hipervisor.

Sobre los autores

James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.

UI_Icon-Red_Hat-Close-A-Black-RGB

Navegar por canal

automation icon

Automatización

Las últimas novedades en la automatización de la TI para los equipos, la tecnología y los entornos

AI icon

Inteligencia artificial

Descubra las actualizaciones en las plataformas que permiten a los clientes ejecutar cargas de trabajo de inteligecia artificial en cualquier lugar

open hybrid cloud icon

Nube híbrida abierta

Vea como construimos un futuro flexible con la nube híbrida

security icon

Seguridad

Vea las últimas novedades sobre cómo reducimos los riesgos en entornos y tecnologías

edge icon

Edge computing

Conozca las actualizaciones en las plataformas que simplifican las operaciones en el edge

Infrastructure icon

Infraestructura

Vea las últimas novedades sobre la plataforma Linux empresarial líder en el mundo

application development icon

Aplicaciones

Conozca nuestras soluciones para abordar los desafíos más complejos de las aplicaciones

Virtualization icon

Virtualización

El futuro de la virtualización empresarial para tus cargas de trabajo locales o en la nube