El camino desde la observabilidad hacia la automatización con AIOps

Copiar URL

En entornos de TI complejos, las herramientas de observabilidad te permiten ver y comprender lo que ocurre. Es información clave, pero ¿y si pudieras aprovecharla aún más?

Gracias a la automatización basada en inteligencia artificial aplicada a las operaciones de TI (AIOps), puedes transformar la información en acciones concretas. De esta manera, impulsas los resultados que necesitas: más eficiencia operativa y sistemas de TI confiables y con capacidad de ajuste.

Cuando se implementan como parte de una estrategia unificada, la observabilidad, AIOps y la automatización potencian sus puntos fuertes entre sí. Sin embargo, muchas empresas realizan grandes inversiones en estos frentes, pero tienen dificultades para articularlos en conjunto. Las herramientas de observabilidad suelen generar un gran volumen de alertas, lo que deriva en agotamiento y presión para los equipos, incluso cuando se aplica inteligencia artificial para priorizarlas o aportarles más valor. Sin el contexto adecuado y sin integraciones sólidas con la plataforma de automatización, podrías enfrentarte a un exceso de datos sin una manera confiable y ajustable de convertirlos en acción.

En este artículo, explicamos cómo la observabilidad con inteligencia puede generar ventajas operativas, con especial énfasis en Red Hat® Ansible® Automation Platform y Event-Driven Ansible. A partir de los conceptos clave de observabilidad, AIOps, eventos y automatización, verás cómo se conectan para llevar a la práctica decisiones basadas en inteligencia artificial, de manera rápida y con automatización bajo control. 

El punto de partida de este camino es un recurso esencial: los datos.

Lee el artículo de analistas: Closing the AIOps gap

Los datos son la materia prima de la automatización con inteligencia artificial. Para empezar a aprovecharlos, la clave es la observabilidad. En entornos de TI cada vez más complejos, no basta con supervisar los registros de errores y actuar en consecuencia: necesitas entender el panorama completo.

La observabilidad lleva la supervisión al siguiente nivel. Su objetivo es generar información que ayude a detectar problemas de manera preventiva y optimizar el rendimiento de tus sistemas y aplicaciones de TI. Las herramientas de observabilidad integran datos tradicionales, registros, indicadores y rastreos, con otras fuentes como metadatos, comportamiento de usuarios, topología de red y detalles a nivel de código. 

Las opciones de herramientas de observabilidad son muchas. Por eso, las plataformas de Red Hat están diseñadas para integrarse a soluciones líderes como Splunk, Dynatrace, IBM Instana y LogicMonitor, así como a tecnologías clave del sector como buses de eventos, Kafka y webhooks. En la práctica, combinar varias herramientas suele ser la mejor forma de observar distintos sistemas y comportamientos con mayor claridad.

Al unificar todos estos datos, obtienes una visión mucho más completa. Gracias a la observabilidad, además de detectar el incidente, entiendes la causa raíz y tienes mayor claridad sobre los próximos pasos.

Todo perfecto hasta ahora. Las herramientas de observabilidad identifican los problemas y orientan las acciones para la gestión operativa de manera eficaz. El desafío se presenta cuando el volumen de alertas se dispara y los equipos quedan saturados. ¿Qué se hace en este caso?

Una estrategia posible es codificar una serie de reglas preestablecidas para responder a cada alerta. Sin embargo, se trata de un proceso que lleva mucho tiempo y genera deuda técnica, lo que supone un problema cada vez que se producen cambios en tus sistemas.
 

La observabilidad, por sí sola, no alcanza. Necesitas aprovechar los datos y la información de forma inteligente. Ahí es donde AIOps entra en juego.

Obtén el ebook "Event-Driven Ansible y la determinación del estado interno de los sistemas"

¿Qué es la observabilidad?

Las alertas no paran de llegar. ¿Cómo decides el próximo paso? AIOps tiene la respuesta. 

AIOps no es una plataforma ni una categoría de producto, sino un concepto. Se trata de un enfoque que combina machine learning (aprendizaje automático) e inteligencia artificial para abordar la complejidad de la automatización en TI. Si se implementa correctamente, aporta la inteligencia necesaria para activar las acciones automatizadas que te acerquen a los resultados que buscas. Todo esto está en consonancia con los objetivos de los equipos de ingeniería de plataformas e ingeniería de confiabilidad del sitio.

Para llevar AIOps a la práctica, necesitas consolidar los datos de tus fuentes de observabilidad en una vista unificada de tu entorno de TI. Luego, el machine learning entra en acción para detectar anomalías, reconocer patrones y generar recomendaciones en tiempo real. Y hay un diferencial clave: los sistemas de inteligencia artificial mejoran con el uso. En lugar de reaccionar siempre igual ante cada evento, aprenden y se ajustan para alcanzar mejor los resultados deseados. 

No hay una única manera de sumar la inteligencia artificial a tus operaciones. Varias herramientas de observabilidad ya traen funciones con esta tecnología. Si lo necesitas, también puedes incorporar tus propios modelos de inteligencia artificial en los flujos de trabajo de automatización.

Hasta ahora queda claro el valor de combinar los datos de observabilidad con inteligencia de AIOps en tiempo real. Sin embargo, aún falta transformar esa inteligencia en acciones concretas. Y eso nos lleva a los eventos.

Un evento es cualquier hecho detectable y significativo dentro de un sistema de TI. Puede tratarse de un cambio de estado en aplicaciones, hardware, software, instancias de nube u otras tecnologías: un servicio que arranca o se apaga, una conexión de red que se abre o se cierra, una actividad que supera un determinado nivel. En todos los casos, estamos hablando de eventos. 

Algunos eventos pueden requerir respuestas muy distintas según el contexto. Por ejemplo, una alta carga en un sistema puede generar solo una notificación en condiciones normales, pero si ejecuta cargas de trabajo confidenciales, podría requerir una acción inmediata, como apagar un sistema, para prevenir riesgos de seguridad. Las herramientas de observabilidad detectan eventos, mientras que AIOps los interpreta en contexto para activar la respuesta automática más adecuada. 

Al complementar los eventos con inteligencia, puedes definir la mejor acción para una gran variedad de situaciones y adaptarte fácilmente a nuevos tipos de eventos a medida que surgen. Con eso, ya tienes la base para aprovechar al máximo la automatización basada en eventos, lo cual nos conduce al próximo capítulo de nuestra historia.

La automatización basada en eventos es una forma de iniciar flujos de trabajo de operaciones de TI a partir de los datos de observabilidad. Este enfoque permite gestionar la complejidad de los sistemas, como entornos de nube híbrida, de inteligencia artificial y del extremo de la red, lo que mantiene a los equipos siempre informados. Al mismo tiempo, elimina las tareas rutinarias y repetitivas para que los equipos de operaciones se centren en actividades más estratégicas.

Como mencionamos antes, puedes aplicar la inteligencia artificial a tus datos de observabilidad para tomar mejores decisiones automatizadas. De este modo, podrás resolver incidentes de manera más eficiente y sacar más valor de tus flujos de trabajo de automatización basada en eventos.

Para los usuarios de Red Hat Ansible Automation Platform, las funciones de Event-Driven Ansible incluidas permiten gestionar eventos y automatizar tareas en diferentes áreas de TI. 

Event-Driven Ansible se basa en tres elementos fundamentales:

  • Las fuentes proporcionan datos sobre eventos relacionados con las condiciones de tu entorno de TI. Estos eventos se envían a Event-Driven Ansible a través de plugins o webhooks.
  • Los rulebooks contienen conjuntos de reglas y condiciones que desencadenan una acción. Las reglas definen las respuestas adecuadas a los eventos.
  • Las acciones son el resultado de la automatización. Su objetivo es abordar o solucionar el evento.

Los rulebooks de Ansible, como los playbooks de Ansible, están escritos en YAML, un lenguaje comprensible para las personas. A diferencia de los playbooks, los rulebooks definen reglas condicionales para indicar cuándo un evento debe desencadenar una acción. Event-Driven Ansible se encarga de supervisar, detectar los eventos y ejecutar automáticamente la acción correspondiente.

Ansible Automation Platform se integra fácilmente a herramientas open source como Prometheus AlertmanagerApache Kafka. Para agilizar la implementación, puedes utilizar conjuntos del ecosistema certificados y validados.

Si combinas la automatización basada en eventos con tus herramientas actuales, comenzarás a notar una serie de ventajas. Con eso, pasamos a la siguiente sección. 
Obtén más información sobre Event-Driven Ansible

El enfoque AIOps aplicado a la automatización basada en eventos te permite integrar datos de observabilidad, información obtenida mediante inteligencia artificial y lógica basada en reglas para automatizar tareas que, de otra forma, implicarían grandes volúmenes de trabajo manual. Gracias a ello, puedes dar prioridad a las acciones preventivas frente a los procesos reactivos y manuales. 

Estas son algunas de las ventajas de este enfoque:

  • Detección preventiva. La detección de anomalías basada en inteligencia artificial ayuda a prevenir problemas antes de que afecten a los usuarios.
  • Análisis inteligente. La identificación automatizada de las causas principales y las recomendaciones te permiten ahorrar tiempo y obtener respuestas precisas cuando las necesitas.
  • Agilización del tiempo de respuesta. Tus equipos pueden actuar con rapidez gracias a las decisiones basadas en la inteligencia artificial y tomadas mediante una automatización controlada.
  • Aprendizaje permanente. Los sistemas basados en inteligencia artificial no funcionan según un conjunto fijo de reglas, sino que mejoran sus recomendaciones gradualmente.

Esto se traduce en una infraestructura más confiable, menos costos y una resolución de incidentes más rápida. A continuación, vamos a explorar algunos casos prácticos concretos donde estas ventajas tienen un impacto real.

La observabilidad, la automatización y AIOps se combinan para abordar una amplia variedad de casos prácticos reales en entornos empresariales.

Confiabilidad de la infraestructura

Puedes usar un enfoque AIOps para gestionar automáticamente alertas frecuentes. De esta manera, tu plataforma de observabilidad activa acciones automatizadas a partir de análisis y recomendaciones basadas en inteligencia artificial. 

Si se detecta que un sistema comienza a fallar, la automatización se activa para reiniciar servicios, eliminar registros, reasignar recursos y ajustar la capacidad de la infraestructura según haga falta. Con este enfoque, te adelantas a los incidentes, reduces el tiempo medio de resolución (MTTR) y potencias la confiabilidad del entorno.

Mejora de las solicitudes de seguimiento de incidentes

Con una visión completa de la situación, los equipos de infraestructura pueden actuar con más precisión sobre las solicitudes de gestión de servicios de TI (ITSM). Si utilizas herramientas de análisis que complementan los eventos con inteligencia artificial, agregas información clave a tus procesos de gestión de solicitudes y seguimiento de ITSM. Esto te permite ofrecer un análisis preliminar y un orden de prioridad antes de que las solicitudes entren en la cola, acotar el MTTR y reducir las tareas manuales.

Gracias a este contexto adicional, tus equipos interpretan los eventos con mayor claridad, agilizan la resolución de problemas y limitan el tiempo de inactividad.

Tres pasos automatizados para agilizar la resolución de solicitudes de ITSM en ServiceNow con Ansible Automation Platform. Duración del video: 10:54.

Optimización de la infraestructura de inteligencia artificial

Las cargas de trabajo de inteligencia artificial ponen a prueba a los equipos de infraestructura de TI. La combinación de observabilidad y automatización te ayuda a mantener estos sistemas complejos funcionando de forma confiable con menos esfuerzo manual. Puedes automatizar las tareas repetitivas de perfeccionamiento de la inteligencia artificial, como redimensionar la infraestructura o reducir la expansión descontrolada de los recursos. Además, al automatizar patrones y configuraciones de optimización, crece la confiabilidad. En conjunto, estos enfoques previenen problemas de rendimiento antes de que afecten a los usuarios.

Como resultado, tus equipos aceleran los ciclos de desarrollo de inteligencia artificial y pasan los modelos a la etapa de producción por procesos probados y confiables. De esta manera, tu empresa innova más rápido y gana ventaja competitiva. 

Detección y corrección automatizadas de los desajustes en la configuración

Los desajustes en la configuración (desviaciones del estado deseado en los sistemas de TI) generan puntos vulnerables de seguridad e inestabilidad. Si bien puedes intentar gestionarlos con métodos de supervisión tradicionales, un enfoque AIOps es más eficaz, ya que ofrece contexto sobre los riesgos y el impacto, y prioriza aquellos problemas que deben resolverse primero. 

Cuando las herramientas de supervisión u observabilidad detectan un desajuste en la configuración, puedes utilizar la automatización potenciada con inteligencia artificial para priorizar las correcciones en función del riesgo y el impacto empresarial. Además, puedes anticipar posibles efectos colaterales antes de intervenir y aplicar los ajustes cuando menos afecten al funcionamiento del sistema. De este modo, lograrás reducir los problemas de seguridad y estabilidad sin generar nuevas interrupciones.

Aplicación y cumplimiento de las políticas

Los equipos de TI se basan en políticas establecidas para garantizar que los sistemas cumplan con la normativa y los estándares de la empresa. Al integrarlas a la automatización basada en eventos, garantizas su cumplimiento de forma permanente.

Como parte de tu enfoque AIOps, puedes incorporar estas políticas en la toma de decisiones automatizada. Cuando un sistema de inteligencia artificial realiza una inferencia e inicia un proceso de automatización, tus sistemas pueden validar esa acción para garantizar que cumple con tus políticas.

Con estos casos prácticos claros, avanzamos al siguiente paso: cómo hacer que estas integraciones funcionen en la práctica. 

Cinco casos prácticos de AIOps para Red Hat Ansible Automation Platform

Para sacar partido de la automatización inteligente, es esencial integrar tus herramientas de observabilidad en tu plataforma de automatización. Con Red Hat Ansible Automation Platform, puedes hacerlo de varias formas:

  • Event-Driven Ansible. Event-Driven Ansible, una herramienta diseñada para el procesamiento de grandes volúmenes de eventos, es la opción recomendada cuando necesitas gestionar picos de alertas de observabilidad o flujos constantes de eventos asíncronos.
  • Protocolo de contexto de modelos (MCP). El MCP es un estándar open source diseñado para agentes de inteligencia artificial que permite la comunicación entre aplicaciones con este tipo de tecnología y servicios externos. Se adapta perfectamente a los flujos de trabajo con agentes y a las operaciones asistidas por inteligencia artificial. Si quieres integrar un modelo de inteligencia artificial en Ansible Automation Platform, el MCP es la opción más adecuada.
  • Webhooks. Los webhooks son un mecanismo de comunicación ligera y basada en eventos entre aplicaciones mediante HTTP. Aunque su alcance es limitado, resultan útiles para acciones sencillas basadas en notificaciones push, como la generación de una solicitud de ITSM.
  • Interfaz de programación de aplicaciones (API) REST. Ansible Automation Platform puede interactuar con otras aplicaciones mediante una API REST y, al hacerlo, se ajusta a un estándar establecido para el intercambio de información entre aplicaciones. Gracias a esto, es compatible con los canales de integración y distribución continuas (CI/CD) y con los sistemas actuales diseñados conforme a los estándares de la API REST. Para las implementaciones nuevas, alguno de los métodos anteriores suele ofrecer ventajas frente al uso del estándar de la API REST tradicional.

Con estos enfoques de integración presentes, veamos cómo las soluciones de Red Hat te ayudan a poner en práctica la observabilidad, AIOps y la automatización en tus equipos. 

Obtén más información sobre el servidor MCP para Ansible Automation Platform

Para respaldar tu estrategia de AIOps, las soluciones unificadas de Red Hat te permiten automatizar procesos en diversos entornos e implementar modelos de inteligencia artificial validados y optimizados.

Red Hat Ansible Automation Platform

Red Hat Ansible Automation Platform es una solución integral de automatización empresarial de TI que te ayuda a mejorar la productividad y a integrar a los equipos. Gracias a sus integraciones con herramientas de inteligencia artificial y observabilidad, convierte la inteligencia en automatización repetible y controlada en todos tus entornos de TI.

Event-Driven Ansible, que está incluida en tu suscripción a Ansible Automation Platform, es una solución adaptable con capacidad de respuesta que analiza los eventos que contienen diversos datos útiles. Permite que los equipos de TI determinen la respuesta apropiada para cada evento y ejecuta las acciones automatizadas para abordarlo o solucionarlo. 

Lee el ebook "Automatización basada en eventos"

Red Hat AI

Red Hat AI es una plataforma de productos y servicios que acompaña a tu empresa en cualquier etapa del proceso de adopción de la inteligencia artificial. Permite distribuir modelos de inteligencia artificial generativa y predictiva, incluidos aquellos que se utilizan para AIOps.

Con esta solución, tienes acceso a Red Hat AI Inference Server para optimizar la inferencia de los modelos y lograr que las implementaciones sean más rápidas y rentables. Red Hat AI Inference Server incluye el repositorio de Red Hat AI, un conjunto de modelos optimizados y validados por terceros que impulsan la flexibilidad y priorizan la uniformidad entre los equipos.

En conjunto, estas soluciones convierten la información generada por la inteligencia artificial en acciones automatizadas, lo cual optimiza la capacidad de tus equipos para tomar decisiones a gran escala y con rapidez.

Recurso

Descubre el potencial de AIOps con la automatización

Para que la inteligencia artificial funcione con éxito, la automatización de la TI debe integrarse desde el comienzo. Descarga el resumen para obtener más información.

Automatización de AIOps con Red Hat Ansible Automation Platform

Red Hat® Ansible® Automation Platform es una solución integral de automatización que permite usar funciones y herramientas de inteligencia artificial en una gran variedad de operaciones de TI.

Más información

Why choose Red Hat for automation?

Red Hat Ansible Automation Platform incluye las herramientas que necesitan los equipos para implementar y compartir la automatización a nivel empresarial.

Learning Ansible basics

Descubre qué es Ansible, cómo funciona y cómo te puede ayudar a automatizar algunos procesos de la TI a nivel empresarial.

What is a software-defined data center (SDDC)?

Un centro de datos definido por software (SDDC) es un enfoque de gestión de TI que extrae los elementos tradicionales de la infraestructura (como la computación, el almacenamiento y las redes) y los ofrece como servicios de software.

Automatización y gestión: lecturas recomendadas

Producto destacado

Artículos relacionados