Muchas cargas de trabajo existentes y populares se están integrando y mejorando con inteligencia artificial, y es probable que surja una nueva ola de aplicaciones de inteligencia artificial en el futuro. Esto ha dado lugar a la creciente importancia de los aceleradores de inteligencia artificial, incluidas las unidades de procesamiento gráfico (GPU) y los motores de entrenamiento e inferencia personalizados. Desde las GPU discretas hasta la aceleración de inteligencia artificial integrada en el mismo chip que la CPU tradicional, está claro que se requiere hardware especializado y acelerado para proporcionar el rendimiento necesario para desarrollar e implementar las cargas de trabajo del futuro.

Por eso, anunciamos una nueva y simplificada experiencia del controlador del acelerador de inteligencia artificial en Red Hat Enterprise Linux (RHEL). Ya seas un desarrollador que diseña la próxima aplicación de inteligencia artificial innovadora o un administrador de sistemas de TI que aprovisiona servidores para implementar cargas de trabajo de inteligencia artificial, RHEL ofrece una experiencia perfecta para poner en marcha los sistemas acelerados. Ahora puedes adquirir controladores de aceleradores de inteligencia artificial de NVIDIA y AMD a través de los repositorios de Red Hat, los cuales están diseñados y firmados por Red Hat utilizando prácticas seguras de la cadena de suministro de software y tecnologías de Secure Boot. Con solo un comando, puedes instalar los controladores de acelerador disponibles más recientemente.

El desafío de la gestión de controladores de GPU y nuestra solución

Históricamente, la instalación y el mantenimiento de los controladores de los aceleradores de GPU con distribuciones empresariales de Linux han presentado una serie de desafíos únicos. Los usuarios solían enfrentar algunos obstáculos:

  • Compatibilidad de los controladores: garantiza la versión correcta del controlador para kernels y hardware específicos.
  • Seguridad y confianza: comprobación de la autenticidad y la integridad de los controladores de terceros mediante el arranque seguro.
  • Gastos generales de mantenimiento: actualizar los controladores de forma manual y gestionar posibles conflictos con las actualizaciones del sistema.

Esta nueva oferta de Red Hat aborda estos desafíos de frente. Al proporcionar controladores AMD, Intel y NVIDIA a través de los repositorios de Red Hat, simplificamos la implementación y la gestión de las cargas de trabajo de inteligencia artificial en RHEL, lo que te brinda mayor confianza y control.

Nuestra nueva experiencia incluye:

  • Controladores de modo de usuario y de kernel de los aceleradores de inteligencia artificial de NVIDIA y AMD, diseñados y firmados por Red Hat (cuando corresponda), y empaquetados en los repositorios de Red Hat.
  • Un script para instalar sin problemas los últimos controladores de los aceleradores de inteligencia artificial para centros de datos de NVIDIA y AMD.
  • Controladores de modo kernel de AMD e Intel integrados con el kernel upstream de Linux.
 

Controlador en modo kernel

Controlador en modo de usuario

NVIDIA

Repositorio de Extensiones de RHEL

Kit de herramientas de CUDA: Repositorio Suplementario

AMD

BaseOS, Repositorio de Extensiones de RHEL

ROCm: Repositorio de Extensiones de RHEL

Intel

BaseOS

N/A

La importancia de este aspecto para tus iniciativas de inteligencia artificial

Esta nueva capacidad ofrece varios beneficios clave para los usuarios de RHEL que aprovechan los aceleradores de inteligencia artificial:

  • Agilización de la obtención de resultados: al reducir la fricción en la instalación y gestión de controladores, tus equipos pueden dedicar más tiempo a crear e implementar cargas de trabajo de inteligencia artificial esenciales para tu empresa, y menos tiempo en hacer que todo funcione.
  • Seguridad y confianza mejoradas: todos los controladores están diseñados y firmados por Red Hat, lo cual aumenta la seguridad de la cadena de suministro y se integra con la informática confidencial. Puedes realizar implementaciones con mayor confianza, ya que sabes que los controladores son auténticos y no se han alterado.
  • Acceso optimizado: obtén todos los controladores que necesitas para operar tu hardware acelerador de inteligencia artificial, entregados a través del ecosistema de Red Hat (Repositorios de Extensiones y Suplementarios), integrándose sin problemas con tus flujos de trabajo de actualización de RHEL existentes mediante comandos dnf.
  • Confianza en la compatibilidad gracias a la validación de los partners: nuestros partners prueban y validan los controladores, lo cual garantiza la estabilidad y la compatibilidad con los kernels de RHEL. Esto reduce el riesgo de inestabilidad del sistema y mejora la confiabilidad general de tu infraestructura de inteligencia artificial.

Instalación sencilla con rhel-drivers

El nuevo comando rhel-drivers detecta automáticamente el hardware acelerador de inteligencia artificial para centros de datos presente en tu sistema e instala automáticamente el controlador de modo kernel más reciente disponible en función de tu versión de kernel de Linux. Esta potente herramienta elimina la necesidad de revisar la documentación o las páginas de compatibilidad de los productos, y ofrece la última innovación en aceleradores que se necesita para aprovechar las herramientas de inteligencia artificial que quieres utilizar.

Validación de partners: confianza al ejecutar aceleradores de inteligencia artificial en RHEL

Red Hat cuenta con una larga trayectoria de colaboración con AMD, Intel y NVIDIA para ofrecer soluciones empresariales a nuestros clientes compartidos. Nuestros partners realizaron pruebas exhaustivas en RHEL para garantizar su compatibilidad, rendimiento y estabilidad.

Repositorio de Extensiones y Repositorio Suplementario de RHEL

El ecosistema de software actual tiene una amplia combinación de modelos de desarrollo y licencias. Sabemos que el entorno de TI moderno depende de un conjunto diverso de software y herramientas para ofrecer el valor empresarial que se necesita. Es por eso que brindamos a los clientes acceso a varios repositorios para abordar este ecosistema diverso.

De manera similar, el ecosistema de aceleradores de inteligencia artificial se basa en una combinación de contenido open source y propietario. Con los Repositorios de Extensiones y Suplementarios de RHEL, puedes obtener lo que necesitas para ejecutar tus aceleradores de inteligencia artificial, todo desde el ecosistema de Red Hat.

Repositorio de Extensiones de RHEL

El Repositorio de Extensiones de RHEL se creó para distribuir contenido open source de terceros diseñado y firmado por Red Hat para brindar la confianza en una cadena de suministro segura.

Repositorio Suplementario de Red Hat

El Repositorio Suplementario de Red Hat es la ubicación para el contenido propietario de terceros, diseñado y firmado por Red Hat.

Informática confidencial

Los controladores diseñados y firmados por Red Hat permiten la informática confidencial, lo cual es de suma importancia para las implementaciones de nube seguras y multiempresa.

Primeros pasos

Esta es una guía paso a paso que te ayudará a comenzar a utilizar estos controladores nuevos en RHEL.

Requisitos previos

  • Red Hat Enterprise Linux 10.1: asegúrate de que tu sistema ejecute RHEL 10.1 o una versión posterior.
  • Suscripción activa a Red Hat: necesitas una suscripción activa que brinde acceso a los Repositorios de Extensiones y Suplementarios de Red Hat.
  • Acelerador de inteligencia artificial NVIDIA o AMD compatible: asegúrate de que tu sistema tenga instalada una GPU compatible. Para AMD, consulta Requisitos del sistema (Linux) — Instalación de ROCm (Linux) y, para las GPU Instinct, sigue estos consejos de optimización del sistema para la configuración del BIOS y los argumentos del kernel.

Instalación con un solo comando con rhel-drivers

rhel-drivers es una nueva herramienta de línea de comandos que proporciona una experiencia de instalación optimizada y fluida para los controladores del acelerador de inteligencia artificial de NVIDIA y AMD. El paquete está disponible en el repositorio de Application Streams (AppStreams) en RHEL 10.1. AppStreams está habilitado de forma predeterminada. Todo lo que necesitas hacer es instalar el paquete rhel-drivers, y estarás listo para comenzar. 

rhel-drivers automatiza varios pasos que, de otro modo, tendrían que hacerse de forma manual:

  1. Detecta automáticamente el acelerador de inteligencia artificial presente en el sistema local.
  2. Habilita los Repositorios de Extensiones y Suplementarios de RHEL.
  3. Instala los últimos controladores disponibles de los repositorios de Red Hat.
    • En el caso de los aceleradores de inteligencia artificial para centros de datos de NVIDIA, instalará los controladores OpenRM y cuda-toolkit más recientes.
    • En el caso de los aceleradores de inteligencia artificial para centros de datos de AMD, instalará el controlador AMDGPU más reciente del Repositorio de Extensiones de RHEL. El usuario deberá instalar el paquete AMD ROCm por separado desde el Repositorio de Extensiones.

Instalación de los controladores de modo de usuario y kernel de NVIDIA con rhel-drivers

# Install the rhel-drivers package (not installed by default)
sudo dnf install rhel-drivers
# Install the NVIDIA kernel and user mode drivers
sudo rhel-drivers install nvidia
sudo reboot

Para probar que se instaló correctamente, ejecuta el siguiente comando:

nvidia-smi

Instalación de los controladores de modo de usuario y kernel de AMD con rhel-drivers

# Install the rhel-drivers package (not installed by default)
sudo dnf install rhel-drivers
# Install the AMD kernel mode drivers
sudo rhel-drivers install amdgpu
# Install the AMD ROCm (user mode drivers) from the Extensions Repository
sudo dnf install rocm rocm-devel
sudo reboot

Prueba que se instaló como se esperaba:

$ rocm-smi --showid --showtemp --showpower --showmeminfo vram

Instalación manual de los controladores

Sabemos que cada entorno de TI suele ser diferente y requiere diferentes versiones de controladores que no siempre son la última versión. Para los entornos que requieren otras versiones existentes de los controladores del acelerador de inteligencia artificial, los clientes pueden instalarlas directamente desde los Repositorios de Extensiones y Suplementarios de Red Hat Enterprise Linux.

1 . Habilita los Repositorios de Extensiones y Suplementarios

Primero, habilita el repositorio adecuado para tu versión de RHEL. Para RHEL 10:

sudo subscription-manager repos 
--enable=rhel-10-for-x86_64-supplementary-rpms
sudo subscription-manager repos 
--enable=rhel-10-for-x86_64-extensions-rpms

Asegúrate de que tu sistema RHEL esté actualizado con los paquetes más recientes:

sudo dnf update
sudo reboot

Uso simultáneo de las Extensiones y los repositorios de EPEL

Si bien no se recomienda, en caso de que desees habilitar las Extensiones y los repositorios Extra Packages for Enterprise Linux (EPEL) en paralelo, debes ajustar la prioridad del repositorio para asegurarte de que los paquetes disponibles de ambos repositorios se instalen desde las Extensiones de forma predeterminada.

sudo subscription-manager repo-override 
--repo=rhel-10-for-x86_64-extensions-rpms --add=priority:98

Consulta la referencia de configuración de DNF para conocer la definición de la prioridad del repositorio.

2. Identificar e instalar los paquetes de controladores

Los nombres específicos de los paquetes varían ligeramente entre NVIDIA y AMD.

Controladores NVIDIA

$ sudo dnf install nvidia-driver cuda-toolkit

Para obtener una lista de los metapaquetes disponibles, consulta la Lista de metapaquetes de NVIDIA.

Controladores del acelerador NVIDIA de inteligencia artificial

Por lo general, se instalará el paquetekmod-nvidia junto con los elementosnvidia-driver user-space.

$ sudo dnf install kmod-nvidia nvidia-driver

Este comando extrae automáticamente el módulo del kernel y los controladores de espacio de usuario correctos para tu sistema.

Controladores del acelerador de inteligencia artificial de AMD (ROCm)

Para AMD, instala el controlador de kernel amdgpu más reciente y la stack de espacio de usuario de ROCm.

$ sudo dnf install kmod-amdgpu rocm rocm-devel

3. Reiniciar el sistema

Después de la instalación, es fundamental que reinicies el sistema para asegurarte de que los nuevos módulos del kernel se carguen correctamente.

$ sudo reboot

4. Comprobación de la instalación

Una vez que el sistema se haya reiniciado, puedes verificar que el controlador se haya cargado con un comando específico del proveedor. Por ejemplo, para verificar que el controlador NVIDIA esté cargado y que se reconozca la GPU:

$ nvidia-smi

Verás un resultado similar a este, en el que se detalla tu GPU NVIDIA y la versión del controlador:

Controlador de modo kernel de Intel NPU: validación en BaseOS

El controlador de Intel se incluye en el repositorio de BaseOS porque se encuentra en el kernel de Linux. Las CPU compatibles con las NPU de Intel se validan en los SoC Core Ultra Meteor Lake, Arrow Lake y Lunar Lake. Para verificar la compatibilidad del controlador del kernel:

sudo modprobe -v intel_vpu
lsmod | grep intel_vpu

RHEL: la base para diseñar las aplicaciones de inteligencia artificial del futuro

En Red Hat, trabajamos para que RHEL sea la plataforma Enterprise Linux que permita desarrollar e implementar las aplicaciones y las cargas de trabajo de inteligencia artificial más avanzadas. Nos encantaría conocer tu opinión sobre la forma en que podemos seguir mejorando la experiencia del controlador del acelerador en RHEL. Prueba estos controladores y la nueva experiencia de instalación en RHEL hoy mismo. 

Prueba del producto

Prueba del producto Red Hat Enterprise Linux

Versión de Red Hat Enterprise Linux que organiza los recursos de hardware y se ejecuta en los sistemas físicos, en la nube o como guest de un hipervisor.

Sobre los autores

James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.

UI_Icon-Red_Hat-Close-A-Black-RGB

Navegar por canal

automation icon

Automatización

Las últimas novedades en la automatización de la TI para los equipos, la tecnología y los entornos

AI icon

Inteligencia artificial

Descubra las actualizaciones en las plataformas que permiten a los clientes ejecutar cargas de trabajo de inteligecia artificial en cualquier lugar

open hybrid cloud icon

Nube híbrida abierta

Vea como construimos un futuro flexible con la nube híbrida

security icon

Seguridad

Vea las últimas novedades sobre cómo reducimos los riesgos en entornos y tecnologías

edge icon

Edge computing

Conozca las actualizaciones en las plataformas que simplifican las operaciones en el edge

Infrastructure icon

Infraestructura

Vea las últimas novedades sobre la plataforma Linux empresarial líder en el mundo

application development icon

Aplicaciones

Conozca nuestras soluciones para abordar los desafíos más complejos de las aplicaciones

Virtualization icon

Virtualización

El futuro de la virtualización empresarial para tus cargas de trabajo locales o en la nube