Muchas cargas de trabajo existentes y populares se están integrando y mejorando con inteligencia artificial, y es probable que surja una nueva ola de aplicaciones de inteligencia artificial en el futuro. Esto ha dado lugar a la creciente importancia de los aceleradores de inteligencia artificial, incluidas las unidades de procesamiento gráfico (GPU) y los motores de entrenamiento e inferencia personalizados. Desde las GPU discretas hasta la aceleración de inteligencia artificial integrada en el mismo chip que la CPU tradicional, está claro que se requiere hardware especializado y acelerado para proporcionar el rendimiento necesario para desarrollar e implementar las cargas de trabajo del futuro.
Por eso, anunciamos una nueva y simplificada experiencia del controlador del acelerador de inteligencia artificial en Red Hat Enterprise Linux (RHEL). Ya seas un desarrollador que diseña la próxima aplicación de inteligencia artificial innovadora o un administrador de sistemas de TI que aprovisiona servidores para implementar cargas de trabajo de inteligencia artificial, RHEL ofrece una experiencia perfecta para poner en marcha los sistemas acelerados. Ahora puedes adquirir controladores de aceleradores de inteligencia artificial de NVIDIA y AMD a través de los repositorios de Red Hat, los cuales están diseñados y firmados por Red Hat utilizando prácticas seguras de la cadena de suministro de software y tecnologías de Secure Boot. Con solo un comando, puedes instalar los controladores de acelerador disponibles más recientemente.
El desafío de la gestión de controladores de GPU y nuestra solución
Históricamente, la instalación y el mantenimiento de los controladores de los aceleradores de GPU con distribuciones empresariales de Linux han presentado una serie de desafíos únicos. Los usuarios solían enfrentar algunos obstáculos:
- Compatibilidad de los controladores: garantiza la versión correcta del controlador para kernels y hardware específicos.
- Seguridad y confianza: comprobación de la autenticidad y la integridad de los controladores de terceros mediante el arranque seguro.
- Gastos generales de mantenimiento: actualizar los controladores de forma manual y gestionar posibles conflictos con las actualizaciones del sistema.
Esta nueva oferta de Red Hat aborda estos desafíos de frente. Al proporcionar controladores AMD, Intel y NVIDIA a través de los repositorios de Red Hat, simplificamos la implementación y la gestión de las cargas de trabajo de inteligencia artificial en RHEL, lo que te brinda mayor confianza y control.
Nuestra nueva experiencia incluye:
- Controladores de modo de usuario y de kernel de los aceleradores de inteligencia artificial de NVIDIA y AMD, diseñados y firmados por Red Hat (cuando corresponda), y empaquetados en los repositorios de Red Hat.
- Un script para instalar sin problemas los últimos controladores de los aceleradores de inteligencia artificial para centros de datos de NVIDIA y AMD.
- Controladores de modo kernel de AMD e Intel integrados con el kernel upstream de Linux.
Controlador en modo kernel | Controlador en modo de usuario | |
NVIDIA | Repositorio de Extensiones de RHEL | Kit de herramientas de CUDA: Repositorio Suplementario |
AMD | BaseOS, Repositorio de Extensiones de RHEL | ROCm: Repositorio de Extensiones de RHEL |
Intel | BaseOS | N/A |
La importancia de este aspecto para tus iniciativas de inteligencia artificial
Esta nueva capacidad ofrece varios beneficios clave para los usuarios de RHEL que aprovechan los aceleradores de inteligencia artificial:
- Agilización de la obtención de resultados: al reducir la fricción en la instalación y gestión de controladores, tus equipos pueden dedicar más tiempo a crear e implementar cargas de trabajo de inteligencia artificial esenciales para tu empresa, y menos tiempo en hacer que todo funcione.
- Seguridad y confianza mejoradas: todos los controladores están diseñados y firmados por Red Hat, lo cual aumenta la seguridad de la cadena de suministro y se integra con la informática confidencial. Puedes realizar implementaciones con mayor confianza, ya que sabes que los controladores son auténticos y no se han alterado.
- Acceso optimizado: obtén todos los controladores que necesitas para operar tu hardware acelerador de inteligencia artificial, entregados a través del ecosistema de Red Hat (Repositorios de Extensiones y Suplementarios), integrándose sin problemas con tus flujos de trabajo de actualización de RHEL existentes mediante comandos
dnf. - Confianza en la compatibilidad gracias a la validación de los partners: nuestros partners prueban y validan los controladores, lo cual garantiza la estabilidad y la compatibilidad con los kernels de RHEL. Esto reduce el riesgo de inestabilidad del sistema y mejora la confiabilidad general de tu infraestructura de inteligencia artificial.
Instalación sencilla con rhel-drivers
El nuevo comando rhel-drivers detecta automáticamente el hardware acelerador de inteligencia artificial para centros de datos presente en tu sistema e instala automáticamente el controlador de modo kernel más reciente disponible en función de tu versión de kernel de Linux. Esta potente herramienta elimina la necesidad de revisar la documentación o las páginas de compatibilidad de los productos, y ofrece la última innovación en aceleradores que se necesita para aprovechar las herramientas de inteligencia artificial que quieres utilizar.
Validación de partners: confianza al ejecutar aceleradores de inteligencia artificial en RHEL
Red Hat cuenta con una larga trayectoria de colaboración con AMD, Intel y NVIDIA para ofrecer soluciones empresariales a nuestros clientes compartidos. Nuestros partners realizaron pruebas exhaustivas en RHEL para garantizar su compatibilidad, rendimiento y estabilidad.
Repositorio de Extensiones y Repositorio Suplementario de RHEL
El ecosistema de software actual tiene una amplia combinación de modelos de desarrollo y licencias. Sabemos que el entorno de TI moderno depende de un conjunto diverso de software y herramientas para ofrecer el valor empresarial que se necesita. Es por eso que brindamos a los clientes acceso a varios repositorios para abordar este ecosistema diverso.
De manera similar, el ecosistema de aceleradores de inteligencia artificial se basa en una combinación de contenido open source y propietario. Con los Repositorios de Extensiones y Suplementarios de RHEL, puedes obtener lo que necesitas para ejecutar tus aceleradores de inteligencia artificial, todo desde el ecosistema de Red Hat.
Repositorio de Extensiones de RHEL
El Repositorio de Extensiones de RHEL se creó para distribuir contenido open source de terceros diseñado y firmado por Red Hat para brindar la confianza en una cadena de suministro segura.
Repositorio Suplementario de Red Hat
El Repositorio Suplementario de Red Hat es la ubicación para el contenido propietario de terceros, diseñado y firmado por Red Hat.
Informática confidencial
Los controladores diseñados y firmados por Red Hat permiten la informática confidencial, lo cual es de suma importancia para las implementaciones de nube seguras y multiempresa.
Primeros pasos
Esta es una guía paso a paso que te ayudará a comenzar a utilizar estos controladores nuevos en RHEL.
Requisitos previos
- Red Hat Enterprise Linux 10.1: asegúrate de que tu sistema ejecute RHEL 10.1 o una versión posterior.
- Suscripción activa a Red Hat: necesitas una suscripción activa que brinde acceso a los Repositorios de Extensiones y Suplementarios de Red Hat.
- Acelerador de inteligencia artificial NVIDIA o AMD compatible: asegúrate de que tu sistema tenga instalada una GPU compatible. Para AMD, consulta Requisitos del sistema (Linux) — Instalación de ROCm (Linux) y, para las GPU Instinct, sigue estos consejos de optimización del sistema para la configuración del BIOS y los argumentos del kernel.
Instalación con un solo comando con rhel-drivers
rhel-drivers es una nueva herramienta de línea de comandos que proporciona una experiencia de instalación optimizada y fluida para los controladores del acelerador de inteligencia artificial de NVIDIA y AMD. El paquete está disponible en el repositorio de Application Streams (AppStreams) en RHEL 10.1. AppStreams está habilitado de forma predeterminada. Todo lo que necesitas hacer es instalar el paquete rhel-drivers, y estarás listo para comenzar.
rhel-drivers automatiza varios pasos que, de otro modo, tendrían que hacerse de forma manual:
- Detecta automáticamente el acelerador de inteligencia artificial presente en el sistema local.
- Habilita los Repositorios de Extensiones y Suplementarios de RHEL.
- Instala los últimos controladores disponibles de los repositorios de Red Hat.
- En el caso de los aceleradores de inteligencia artificial para centros de datos de NVIDIA, instalará los controladores OpenRM y cuda-toolkit más recientes.
- En el caso de los aceleradores de inteligencia artificial para centros de datos de AMD, instalará el controlador AMDGPU más reciente del Repositorio de Extensiones de RHEL. El usuario deberá instalar el paquete AMD ROCm por separado desde el Repositorio de Extensiones.
Instalación de los controladores de modo de usuario y kernel de NVIDIA con rhel-drivers
# Install the rhel-drivers package (not installed by default)
sudo dnf install rhel-drivers
# Install the NVIDIA kernel and user mode drivers
sudo rhel-drivers install nvidia
sudo rebootPara probar que se instaló correctamente, ejecuta el siguiente comando:
nvidia-smiInstalación de los controladores de modo de usuario y kernel de AMD con rhel-drivers
# Install the rhel-drivers package (not installed by default)
sudo dnf install rhel-drivers
# Install the AMD kernel mode drivers
sudo rhel-drivers install amdgpu
# Install the AMD ROCm (user mode drivers) from the Extensions Repository
sudo dnf install rocm rocm-devel
sudo rebootPrueba que se instaló como se esperaba:
$ rocm-smi --showid --showtemp --showpower --showmeminfo vramInstalación manual de los controladores
Sabemos que cada entorno de TI suele ser diferente y requiere diferentes versiones de controladores que no siempre son la última versión. Para los entornos que requieren otras versiones existentes de los controladores del acelerador de inteligencia artificial, los clientes pueden instalarlas directamente desde los Repositorios de Extensiones y Suplementarios de Red Hat Enterprise Linux.
1 . Habilita los Repositorios de Extensiones y Suplementarios
Primero, habilita el repositorio adecuado para tu versión de RHEL. Para RHEL 10:
sudo subscription-manager repos
--enable=rhel-10-for-x86_64-supplementary-rpms
sudo subscription-manager repos
--enable=rhel-10-for-x86_64-extensions-rpmsAsegúrate de que tu sistema RHEL esté actualizado con los paquetes más recientes:
sudo dnf update
sudo rebootUso simultáneo de las Extensiones y los repositorios de EPEL
Si bien no se recomienda, en caso de que desees habilitar las Extensiones y los repositorios Extra Packages for Enterprise Linux (EPEL) en paralelo, debes ajustar la prioridad del repositorio para asegurarte de que los paquetes disponibles de ambos repositorios se instalen desde las Extensiones de forma predeterminada.
sudo subscription-manager repo-override
--repo=rhel-10-for-x86_64-extensions-rpms --add=priority:98Consulta la referencia de configuración de DNF para conocer la definición de la prioridad del repositorio.
2. Identificar e instalar los paquetes de controladores
Los nombres específicos de los paquetes varían ligeramente entre NVIDIA y AMD.
Controladores NVIDIA
$ sudo dnf install nvidia-driver cuda-toolkitPara obtener una lista de los metapaquetes disponibles, consulta la Lista de metapaquetes de NVIDIA.
Controladores del acelerador NVIDIA de inteligencia artificial
Por lo general, se instalará el paquetekmod-nvidia junto con los elementosnvidia-driver user-space.
$ sudo dnf install kmod-nvidia nvidia-driverEste comando extrae automáticamente el módulo del kernel y los controladores de espacio de usuario correctos para tu sistema.
Controladores del acelerador de inteligencia artificial de AMD (ROCm)
Para AMD, instala el controlador de kernel amdgpu más reciente y la stack de espacio de usuario de ROCm.
$ sudo dnf install kmod-amdgpu rocm rocm-devel3. Reiniciar el sistema
Después de la instalación, es fundamental que reinicies el sistema para asegurarte de que los nuevos módulos del kernel se carguen correctamente.
$ sudo reboot4. Comprobación de la instalación
Una vez que el sistema se haya reiniciado, puedes verificar que el controlador se haya cargado con un comando específico del proveedor. Por ejemplo, para verificar que el controlador NVIDIA esté cargado y que se reconozca la GPU:
$ nvidia-smiVerás un resultado similar a este, en el que se detalla tu GPU NVIDIA y la versión del controlador:
Controlador de modo kernel de Intel NPU: validación en BaseOS
El controlador de Intel se incluye en el repositorio de BaseOS porque se encuentra en el kernel de Linux. Las CPU compatibles con las NPU de Intel se validan en los SoC Core Ultra Meteor Lake, Arrow Lake y Lunar Lake. Para verificar la compatibilidad del controlador del kernel:
sudo modprobe -v intel_vpu
lsmod | grep intel_vpuRHEL: la base para diseñar las aplicaciones de inteligencia artificial del futuro
En Red Hat, trabajamos para que RHEL sea la plataforma Enterprise Linux que permita desarrollar e implementar las aplicaciones y las cargas de trabajo de inteligencia artificial más avanzadas. Nos encantaría conocer tu opinión sobre la forma en que podemos seguir mejorando la experiencia del controlador del acelerador en RHEL. Prueba estos controladores y la nueva experiencia de instalación en RHEL hoy mismo.
Prueba del producto
Prueba del producto Red Hat Enterprise Linux
Sobre los autores
James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.
Más como éste
More than meets the eye: Behind the scenes of Red Hat Enterprise Linux 10 (Part 4)
Looking ahead to 2026: Red Hat’s view across the hybrid cloud
OS Wars_part 1 | Command Line Heroes
OS Wars_part 2: Rise of Linux | Command Line Heroes
Navegar por canal
Automatización
Las últimas novedades en la automatización de la TI para los equipos, la tecnología y los entornos
Inteligencia artificial
Descubra las actualizaciones en las plataformas que permiten a los clientes ejecutar cargas de trabajo de inteligecia artificial en cualquier lugar
Nube híbrida abierta
Vea como construimos un futuro flexible con la nube híbrida
Seguridad
Vea las últimas novedades sobre cómo reducimos los riesgos en entornos y tecnologías
Edge computing
Conozca las actualizaciones en las plataformas que simplifican las operaciones en el edge
Infraestructura
Vea las últimas novedades sobre la plataforma Linux empresarial líder en el mundo
Aplicaciones
Conozca nuestras soluciones para abordar los desafíos más complejos de las aplicaciones
Virtualización
El futuro de la virtualización empresarial para tus cargas de trabajo locales o en la nube