Resumen
El término AIOps se refiere a la inteligencia artificial aplicada a las operaciones de TI. Se trata tanto de un enfoque específico para estas operaciones como de un sistema de software integrado que utiliza el análisis de datos para mejorar la resolución manual de los problemas y los sistemas. El enfoque AIOps combina el big data con la inteligencia artificial o el aprendizaje automático para mejorar, o remplazar de forma parcial, múltiples procesos y tareas relacionados con las operaciones de TI.
Funcionamiento de AIOps
Hay algo que la inteligencia artificial de AIOps necesita para ponerse en marcha: los datos operativos. La IA requiere información específica, como el tiempo de actividad y de inactividad, el uso del procesamiento, el tráfico de red, los registros de las aplicaciones, los errores, los intentos de autenticación, las alertas de los firewalls y los datos históricos. Por lo general, es más complejo recopilar, organizar y depurar estos datos que incorporar los algoritmos y los modelos de aprendizaje.
Una vez consolidados los datos, es momento de definir los indicadores y los objetivos respecto al servicio. Puede determinar el estado operativo mediante indicadores rastreables, los cuales posteriormente se convertirán en los estándares del sistema AIOps. Muchas plataformas empresariales integran elementos de observación operativa, o se conectan a ellos: Red Hat® OpenShift® incluye Red Hat OpenShift Observability, Red Hat Enterprise Linux® utiliza Red Hat Satellite y Red Hat Ansible® Automation Platform emplea Prometheus y Grafana.
Una vez que haya determinado el estado operativo, puede aplicar la IA. Ahora resulta mucho más sencillo incorporarla a los proyectos.
- Utilice IBM watsonx Code Assistant, el cual forma parte de Ansible® Automation Platform mediante Ansible Lightspeed con IBM watsonx Code Assistant, y el conjunto quantum computing de IBM, que incluso está disponible como servicio para procesar todos los conjuntos de datos mencionados.
- Acceda a ChatGPT de OpenAI, un sistema de IA generativa, mediante una interfaz de programación de aplicaciones (API).
- Utilice la IA de Natural Language de Google como servicio de nube.
Con todas estas posibilidades, no nos sorprende que el procesamiento del lenguaje natural (NLP), la IA, el aprendizaje automático (ML) y el aprendizaje profundo (DL) ya sean parte de nuestro léxico cultural.
Beneficios y desafíos de AIOps
Beneficios
- Agilidad resolutiva: con el enfoque AIOps, es posible detectar los problemas a medida que aparecen y brindar respuestas oportunas, lo cual se traduce en una reducción del tiempo de inactividad y del tiempo medio de resolución (MTTR).
- Sistemas con capacidad autorregenerativa: las infraestructuras con estas características pueden aumentar considerablemente el rendimiento y el tiempo de actividad.
- Big data: AIOps permite depurar y analizar el big data, así como utilizarlo para realizar diversas actividades.
- Eficiencia y flexibilidad: los modelos de IA permiten aumentar la eficiencia del personal, ya que proporcionan información para identificar las acciones que debe realizar y definir su alcance.
- Innovación: al eliminarse el trabajo repetitivo, los equipos de TI pueden desarrollar y distribuir proyectos más estratégicos y que ofrezcan más beneficios.
- Sencillez: el enfoque AIOps puede optimizar varias de las tareas repetitivas propias de la gestión de los servicios de TI.
- Inmediatez en la correlación de los datos y la toma de decisiones: cuando AIOps incluye un motor de automatización, puede responder de forma automática a partir de los datos, lo cual disminuye la intervención y los errores de las personas.
- Flexibilidad en la correlación y la predicción de los datos: AIOps puede analizar todas las permutaciones posibles automáticamente, de una manera que supera ampliamente las capacidades humanas y los métodos manuales.
Desafíos
- Experiencia: dado que se requiere una vasta experiencia en el análisis de datos, incluso los primeros pasos suponen un obstáculo importante.
- Infraestructura: si no cuenta con plataformas ni funciones estandarizadas como las que ofrecen Red Hat OpenShift y Ansible Automation Platform, entrenar el modelo de AIOps para su infraestructura puede resultar todo un desafío.
- Obtención de resultados: la complejidad asociada al diseño, la implementación y la gestión de los sistemas de AIOps hace que el retorno sobre la inversión no sea inmediato.
- Datos: los datos que generan las operaciones modernas de TI pueden resultar abrumadores y difíciles de controlar debido a su volumen, calidad y uniformidad; además, la precisión de los resultados de los sistemas de AIOps dependerá de la calidad de las fuentes de datos.
- Acuerdo común: para determinar el estado de referencia del sistema y establecer objetivos estándares para su funcionamiento, es necesario el respaldo y la participación de varias partes, y no siempre resulta sencillo lograr un consenso.
- Alcance: la cantidad de aspectos que deben tenerse en cuenta, incluso al comienzo, puede ser abrumadora. También puede suceder que el entorno sea demasiado dinámico como para determinar un estado de referencia.
- Tasa de fallo: para los proyectos de IA, es muy alta. Según el informe AI InfrastructureView de IDC, el 31 % de los encuestados trabaja con la IA en la producción, pero solo un tercio de ese porcentaje ha obtenido beneficios para toda la empresa.
Casos prácticos de AIOps
Ahora, analicemos los motivos por los que distintos especialistas usarían sistemas de AIOps.
- Los ingenieros de confiabilidad del sitio (SRE) de las aplicaciones definen las cuatro señales de oro en las que se centra la IA: la latencia, la tasa de errores, el tráfico y la saturación.
- Los desarrolladores utilizan los análisis de los sistemas de AIOps para determinar la causa principal (RCA) de un problema, o bien delegan esta tarea en el motor de AIOps para que realice dicho análisis sin su intervención.
- Los empresarios utilizan AIOps para supervisar las mismas señales de oro de los SRE, lo cual les permite comprender el rendimiento de las aplicaciones desde el punto de vista de los usuarios finales.
- Los operadores de infraestructura emplean los sistemas de AIOps para supervisar los entornos de TI de microservicios, nube híbrida y multicloud, los cuales pueden llegar a contar con decenas de máquinas virtuales o incluso miles de clústeres, y simplificar las operaciones del día 2.
Cada uno de estos casos prácticos pone de manifiesto que los equipos pueden utilizar los sistemas de AIOps para identificar los posibles inconvenientes y responder a ellos, pero que, por ahora, estos no pueden sustituir a los administradores de sistemas de TI experimentados ni a otros miembros del equipo de operaciones. El enfoque AIOps, como la mayoría de los cambios revolucionarios de la TI, permite que las máquinas se encarguen de nuestras tareas mientras nosotros damos las órdenes.
Las máquinas no remplazan a las personas, pero tanto los analistas de datos como los ingenieros de DevOps deberían aprovechar la revolución informática que se avecina para ampliar sus habilidades.
- La supervisión del rendimiento de las aplicaciones (APM) se volverá cada vez más importante a medida que las empresas busquen personal con una formación orientada al rendimiento.
- Las habilidades de automatización serán cada vez más necesarias para comprender, incorporar o escribir los scripts de IA subyacentes, así como para convertir los motores de alertas y correlación de eventos en motores de ejecución.
- Si ya tiene experiencia con la IA, encuentre motivos para comenzar a experimentar de forma segura con la IA de red (por ejemplo: la SD-WAN, el Wi-Fi, entre otras).
Diferencias entre AIOps y DevOps
Las prácticas de DevOps consisten en hacer mejoras pequeñas y graduales a lo largo de todo el ciclo de vida de la aplicación, de forma permanente. El problema es que esto genera tiempo de inactividad, y ahí es donde entra en juego AIOps. Esta tecnología amplía la cultura de DevOps al incorporar el análisis de datos a los procesos de desarrollo y operaciones.
No sustituye a DevOps, sino que lo mejora. En otras palabras, es otra etapa del ciclo de vida de la transformación digital. Ambas tecnologías comparten las mismas responsabilidades, solo que AIOps enriquece la inteligencia humana al sumarle facultades artificiales.
Si bien la división real entre DevOps y AIOps no es del todo clara, esta última funciona muy bien en cualquiera de los extremos de los procesos de DevOps:
- Al principio, puede consumir grandes cantidades de datos de infraestructura y alertar a los ingenieros de DevOps sobre los problemas del entorno de desarrollo integrado (IDE) subyacente, o directamente solucionarlos.
- Al final, puede resolver automáticamente los problemas de TI redundantes en la etapa de producción, mientras aprende a solucionar los errores nuevos que surgen con cada lanzamiento gradual.
Tal como sucede con DevOps, no hay una herramienta, una plataforma ni un producto de AIOps único. Las herramientas que se utilizan para diseñar las funciones de DevOps y AIOps son tan numerosas y únicas como su stack de TI (los sistemas de hardware y software). Esto se debe a que cada solución de AIOps que diseñe debe integrar y analizar todos los elementos que contribuyen a la singularidad de sus entornos de desarrollo y de producción, y también funcionar en todos ellos.
AIOps y la tecnología de open source
AIOps está muy presente en las tecnologías de open source, en forma de proyectos upstream y dentro de varias comunidades. Si bien ningún producto es una solución integral de AIOps, hay muchos proyectos open source de desarrollo, operaciones, IA y automatización que puede utilizar como parte de su solución de AIOps exclusiva. También se están desarrollando varios proyectos específicos para proporcionar soluciones de AIOps a los problemas puntuales de esta tecnología.
Las empresas lanzan el código de los productos de IA downstream como proyectos upstream:
- Meta, el conglomerado de redes sociales más grande del mundo, lanzó el modelo de lenguaje de gran tamaño Llama 2 como un proyecto open source.
- En Red Hat esperamos que el proyecto open source Project Thoth dé como resultado productos empresariales reforzados, del mismo modo que Project Wisdom dio lugar al elemento Ansible Lightspeed con IBM watsonx Code Assistant de Ansible Automation Platform.
- También colaboramos con los proyectos de AIOps de otras empresas, por ejemplo, el que lidera Artificial Intelligence Center of Excellence (AICoE).
Motivos para elegir Red Hat
Nuestra plataforma de automatización combinada con la IA de nuestros partners puede ofrecerle a su empresa una gran ventaja para desarrollar una solución estratégica de AIOps: tan solo tiene que conectar las funciones de IA que permiten determinar el estado interno de los sistemas con la arquitectura basada en eventos de nuestro motor de automatización.
Utilice Event-Driven Ansible para tomar medidas con los datos obtenidos mediante IA. Utilice nuestra plataforma de automatización junto con los motores de IA causal de nuestros partners (como los que ofrece Dynatrace y otras herramientas modernas que brindan datos sobre el estado interno de los sistemas). También puede aprovechar Ansible Lightspeed con IBM watsonx Code Assistant para que los equipos de desarrollo y de operaciones con diferentes tipos de habilidades puedan escribir código sintácticamente correcto basándose en las recomendaciones que genera la IA.