Una IA preparada para agentes implica una estrategia lista para tokens

13 de mayo de 20264 minutos de lectura

Chief Technology Officer and Senior Vice President, Global Engineering

La TI moderna se rige tanto por decisiones económicas como por conceptos técnicos. Los costos del hardware, los servicios en la nube, el almacenamiento y otros elementos influyen en la manera en que los CIO y los líderes de TI presupuestan y despliegan sus estrategias. Y ahora, con la IA, tenemos otra decisión interdisciplinaria que incorporar: la economía de los tokens; en este caso, cómo nuestras estrategias de IA consumen los costos volátiles de los modelos subyacentes.

Actualmente, la mayor parte de la IA empresarial se basa en llamadas a las API de modelos de vanguardia (frontier models) y en el pago por los tokens consumidos y generados. Si bien este es un punto de partida sencillo, la aritmética está cambiando. El consumo de tokens se está disparando debido a que los nuevos modelos de razonamiento suelen consumir de 10 a 20 veces más tokens que los modelos estándar, solo para "pensar" la solución a un problema.

A medida que entramos en la era de los agentes de IA que iteran, llaman a herramientas y encadenan tareas, este consumo se multiplica de forma exponencial. Para prosperar en esta nueva economía, las organizaciones deben evolucionar: pasar de consumir tokens a proveerlos. Esto significa que el éxito depende de ser dueños de su propia infraestructura de inferencia, dirigir las consultas de los modelos al punto de acceso más rentable e incluso ejecutar modelos auto-hospedados optimizados para sus necesidades de negocio específicas.

En Red Hat, vemos este recorrido como un camino "del metal a los agentes". Requiere un stack abierto y totalmente integrado donde cada capa —desde los aceleradores físicos de IA hasta los propios agentes— esté conectada y construida con la seguridad del sistema como prioridad absoluta. Esta base debe soportar un ecosistema diverso de hardware, que incluya NVIDIA, AMD e Intel, así como silicio personalizado de los principales proveedores de nube. Sobre esta capa de hardware se asienta la infraestructura de IA, comenzando con entornos Linux y Kubernetes centrados en la seguridad que ofrecen una confiabilidad constante, ya sea en un rack de servidores o en satélites en órbita.

El corazón de un sistema de IA es la inferencia, que es el factor determinante para escalar las estrategias de IA. El liderazgo de Red Hat en proyectos como vLLM y nuestro trabajo en inferencia distribuida con llm-d nos otorga una experiencia única en la optimización de la ejecución de modelos y el aprovechamiento de las GPU a nivel de software. En aplicaciones del mundo real, ya hemos visto cómo estas tecnologías logran una reducción de 10 veces en el tiempo hasta el primer token (time-to-first-token) y una mejora del triple en el rendimiento de salida. Sin un control tanto del rendimiento como del costo, las organizaciones acabarán viéndose obligadas a aceptar concesiones que ni los equipos financieros ni los clientes tolerarán.

Sin embargo, los modelos de IA no conocen los factores que diferencian a su empresa a menos que usted se los proporcione. Por ello, la Generación Aumentada por Recuperación (RAG) y el ajuste fino (fine-tuning) han convertido a la IA en un verdadero diferenciador. Las empresas pueden conectar los modelos con documentación interna exclusiva y con el historial de sus clientes, creando modelos que comprenden genuinamente la pericia específica y el conocimiento de dominio de su negocio.

Todo esto es hoy el estándar mínimo (tablestake). La frontera actual son los servicios de agentes. Los agentes ya no son experimentos; son el núcleo de la estrategia empresarial moderna. Pero traen consigo el desafío del "Traiga su propio agente" (Bring Your Own Agent), donde desarrolladores, científicos de datos y equipos de marketing utilizan herramientas distintas, desde LangChain hasta OpenClaw. Una estrategia eficaz debe permitir esta libertad de elección manteniendo un control de TI riguroso. Esto implica otorgar a cada agente una identidad verificada, gestionar su ciclo de vida para versiones y reversiones (rollbacks), y utilizar estándares emergentes como MCP Services para conectar agentes con herramientas y datos sin generar brechas de seguridad.

Vemos esta visión en acción con organizaciones como BNP Paribas, que ha generado casi 600 millones de dólares en valor al industrializar 1,000 casos de uso de IA en una plataforma unificada. Transformaron el aprovisionamiento de GPUs de un cuello de botella de semanas en un servicio de pocos minutos, demostrando que la velocidad y la soberanía digital pueden coexistir. Del mismo modo, el Centro de Vuelo Espacial Marshall de la NASA ha adoptado estas plataformas unificadas para migrar miles de cargas de trabajo heredadas a entornos de contenedores, reduciendo los tiempos de despliegue de días a minutos para dar soporte a operaciones espaciales de misión crítica.

Estos clientes están transformando las estrategias de IA: de estar centradas únicamente en la eficiencia y el ahorro de costos, a ser motores de crecimiento. Sí, queremos ser más eficientes con la IA, pero enfocarse solo en eso es reductivo. El siguiente gran salto para la IA es alinearla con el crecimiento; no solo optimizar el beneficio neto (bottom line), sino elevar los ingresos brutos (top line).

En última instancia, el objetivo de una estrategia de IA empresarial debería ser que, cuando el mercado vuelva a cambiar (y lo hará), usted sea dueño de la plataforma que sustenta lo que le importa a USTED. No necesita una elección forzada entre la potencia de un modelo de vanguardia y la seguridad del control y la gobernanza. Al adoptar un stack abierto e integrado, puede tener ambos. Puede proporcionar el acceso a modelos que sus equipos necesitan mientras mantiene una postura de seguridad que su equipo de TI realmente pueda defender. Esta es la única manera de construir una estrategia que juegue a su favor, convirtiendo el acelerado ritmo de la disrupción en una ventaja competitiva a largo plazo.

Sobre el autor

Chris Wright

Chief Technology Officer and Senior Vice President, Global Engineering

Chris Wright is senior vice president and chief technology officer (CTO) at Red Hat. Wright leads the Office of the CTO, which is responsible for incubating emerging technologies and developing forward-looking perspectives on innovations such as artificial intelligence, cloud computing, distributed storage, software defined networking and network functions virtualization, containers, automation and continuous delivery, and distributed ledger.

During his more than 20 years as a software engineer, Wright has worked in the telecommunications industry on high availability and distributed systems, and in the Linux industry on security, virtualization, and networking. He has been a Linux developer for more than 15 years, most of that time spent working deep in the Linux kernel. He is passionate about open source software serving as the foundation for next generation IT systems.