Da observabilidade à automação da AIOps

Copiar URL

Em ambientes de TI complexos, as ferramentas de observabilidade permitem ver e entender o que está acontecendo. Esses insights são úteis, mas e se você pudesse ir além?

Com a automação da inteligência artificial para operações de TI (AIOps), você pode usar a IA para transformar insights em ações. Essa abordagem ajuda você a trabalhar com mais eficiência e a entregar sistemas de TI confiáveis e escaláveis.

Quando implantadas como parte de uma estratégia unificada, a observabilidade, a AIOps e a automação podem amplificar os pontos fortes umas das outras. Ainda assim, muitas organizações não conseguem integrar essas três frentes, apesar dos recursos que já dedicam a elas. As ferramentas de observabilidade podem gerar um grande volume de alertas. Mesmo quando a IA já é usada para classificá-los por prioridade ou enriquecê-los com contexto, as equipes acabam sobrecarregadas e estressadas. Sem contexto e integrações eficazes com a plataforma de automação, um volume enorme de dados se acumula sem que você consiga transformá-los em ações consistentes e escaláveis por meio de uma automação confiável.

Este artigo explica como a observabilidade com inteligência pode gerar benefícios operacionais com ênfase no Red Hat® Ansible® Automation Platform e no Event-Driven Ansible, que integra a solução. Usaremos os conceitos centrais de observabilidade, AIOps, eventos e automação para mostrar como eles se conectam e permitem executar decisões informadas por IA com rapidez, usando a automação com governança. 

Nossa jornada começa com um recurso fundamental: os dados.

Leia o relatório de analistas: Do insight à ação

Os dados são a matéria-prima que possibilita a automação aprimorada por IA. A primeira etapa para extrair valor dos seus dados é a observabilidade. Com os ambientes de TI se tornando mais complexos, já não basta monitorar os logs de erros e responder a eles. Você precisa de um panorama mais abrangente.

A observabilidade vai além do monitoramento. O objetivo dela é gerar insights que ajudem você a solucionar problemas e otimizar suas aplicações e sistemas de TI proativamente. As ferramentas de observabilidade podem combinar dados tradicionais (logs, métricas e rastreio) com fontes adicionais, como metadados, comportamento do usuário, topologia de rede e detalhes no nível do código. 

Há muitas opções de ferramentas de observabilidade. As plataformas da Red Hat se integram a plataformas de observabilidade conhecidas, como SplunkDynatraceIBM InstanaLogicMonitor, e a tecnologias do setor como barramentos de eventos, Kafka e webhooks. É comum usar várias ferramentas de observabilidade ao mesmo tempo para monitorar diferentes sistemas e comportamentos.

Reunir todas essas informações expande a sua perspectiva. Com a observabilidade, você sabe não apenas que um problema ocorreu, mas também sua causa e o que fazer para resolvê-lo.

Até aí, tudo bem. As ferramentas de observabilidade são excelentes para identificar o que está errado e auxiliar o gerenciamento de operações com o que precisa ser feito. Mas suas equipes podem ficar sobrecarregadas com o grande número de alertas. Então, o que fazer?

Uma opção é programar uma série de regras sobre como responder a cada alerta. Infelizmente, esse processo demorado gera uma dívida técnica que precisa ser paga sempre que há uma mudança no funcionamento dos seus sistemas.
 

A observabilidade por si só não resolve muita coisa. Você precisa usar os dados e insights com inteligência. E é aí que a AIOps entra na jornada.

Leia o e-book "Observabilidade e Event-Driven Ansible"

O que é observabilidade?

De repente, você recebe uma enxurrada de alertas. Como você decide o que fazer? A resposta está na AIOps

Pense na AIOps como um conceito, e não como uma categoria de produto ou plataforma. Ela é uma abordagem que aplica machine learning e inteligência artificial para gerenciar a complexidade da automação de TI. Idealmente, a AIOps fornece a inteligência necessária para iniciar ações automatizadas que possibilitem os resultados desejados. Os conceitos de AIOps se alinham com os objetivos das equipes de engenharia de plataforma e de engenharia de confiabilidade de sites.

A implementação começa pela consolidação dos dados das suas fontes de observabilidade em uma visão unificada do ambiente de TI. A etapa seguinte é usar o machine learning para detectar anomalias, identificar padrões e gerar recomendações úteis em tempo real. Os sistemas orientados por IA têm outra vantagem, eles melhoram com o tempo. Em vez de simplesmente responder a todos os eventos da mesma forma, eles podem observar e se ajustar para alcançar os resultados esperados com mais eficiência. 

Existem várias formas de incorporar a IA nas operações. Muitas ferramentas de observabilidade, agora, contam com recursos de IA integrados. Você também pode usar seus próprios modelos de IA nos fluxos de trabalho de automação.

A esta altura, você já deve ter percebido a vantagem de combinar os dados de observabilidade com a inteligência em tempo real da AIOps. Mas ainda precisa de uma forma de transformá-los em ações. É aqui que entram os eventos.

Um evento é qualquer ocorrência detectável e significativa em um sistema de TI. Pode ser uma mudança de estado em qualquer uma das suas aplicações, hardwares, softwares, instâncias de nuvem ou outras tecnologias. Por exemplo, um serviço inicia ou é encerrado uma conexão de rede é aberta ou fechada, uma atividade ultrapassa o limite determinado. Tudo isso são eventos. 

Alguns deles demandam respostas extremamente diferentes dependendo das circunstâncias. Uma carga elevada em um sistema pode acionar uma notificação em operações normais, mas em cargas de trabalho confidenciais talvez exija o desligamento imediato para evitar riscos de segurança. As ferramentas de observabilidade detectam eventos, enquanto a AIOps ajuda a contextualizá-los para que você possa acionar a resposta automatizada apropriada. 

Com eventos aprimorados pela inteligência da AIOps, é possível determinar o melhor plano de ação para diversas situações e se adaptar a novos tipos de eventos conforme eles surgem. Agora você tem a base necessária para aproveitar ao máximo a automação orientada a eventos, que é o tema do próximo capítulo.

A automação orientada a eventos é uma maneira de acionar fluxos de trabalho de operações de TI automatizados com base em dados de observabilidade. Esse tipo de automação ajuda as equipes a manter a visibilidade sobre sistemas complexos, incluindo ambientes de nuvem híbrida, IA e edge. Ela reduz o número de tarefas rotineiras e repetitivas, liberando as equipes de operações de TI para se concentrarem em questões mais importantes.

Como mencionamos anteriormente, é possível usar a IA para analisar os dados de observabilidade e orientar a automação de decisões. Com isso, você conseguirá resolver problemas eficientemente e obter mais valor dos seus fluxos de trabalho de automação orientada a eventos.

Para os usuários do Red Hat Ansible Automation Platform, o Event-Driven Ansible, que integra a plataforma, oferece recursos de tratamento de eventos para automatizar tarefas em diferentes domínios de TI. 

O Event-Driven Ansible se baseia em três componentes fundamentais:

  • As fontes disponibilizam dados de eventos relacionados às condições do seu ambiente de TI. Esses eventos são enviados ao Event-Driven Ansible por meio de plugins ou webhooks.
  • Os rulebooks contêm conjuntos de regras e condições que disparam uma ação. As regras definem as respostas apropriadas aos eventos.
  • As ações são o resultado da automação. Elas são disparadas para tratar ou corrigir o evento.

Os Ansible Rulebooks, assim como os Ansible Playbooks, são escritos em formato YAML legível por humanos. Diferentemente dos playbooks, os rulebooks usam regras condicionais para definir quando um evento deve disparar uma ação. O Event-Driven Ansible verifica continuamente a ocorrência de eventos, reconhece quando eles acontecem e executa automaticamente a ação adequada.

Você pode integrar o Ansible Automation Platform com ferramentas open source como o Prometheus Alertmanager ou o Apache Kafka. Você pode escolher entre coleções de ecossistemas certificadas e validadas para implantar essas integrações de automação com mais rapidez.

Ao combinar a automação orientada a eventos com as ferramentas que já usa, você perceberá os benefícios que abordaremos na próxima seção. 
Mais informações sobre o Event-Driven Ansible

Com a abordagem da AIOps para a automação orientada a eventos, você pode aplicar dados de observabilidade, insights de IA e lógica baseada em regras para automatizar o que seria uma quantidade enorme de trabalho manual. Você consegue priorizar medidas proativas em vez de processos reativos e manuais. 

Alguns benefícios dessa abordagem incluem:

  • Detecção proativa: utilizar a IA na detecção de anomalias ajuda a prevenir problemas antes que eles afetem seus usuários.
  • Análise inteligente: identificação de causa raiz e recomendações automatizadas ajudam a economizar tempo e a entregar respostas precisas no momento certo.
  • Respostas mais rápidas: suas equipes ganham agilidade ao usar a IA para embasar decisões e a automação com governança para executá-las.
  • Aprendizado contínuo: em vez de operar com um conjunto fixo de regras, os sistemas orientados por IA podem aprimorar as recomendações ao longo do tempo.

Isso resulta em uma infraestrutura mais confiável, custos reduzidos e resolução de problemas mais rápida. Agora, vamos analisar alguns casos de uso para os quais esses benefícios fazem a diferença.

A observabilidade, a automação e a AIOps podem ajudar a solucionar uma variedade de casos de uso empresariais.

Confiabilidade da infraestrutura

Você pode usar a abordagem da AIOps para resolver alertas frequentes automaticamente. Com essa estratégia, sua plataforma de observabilidade realiza ações automatizadas com base em análises e recomendações aprimoradas por IA. 

Se um determinado sistema começar a falhar, a automação reinicia serviços, limpa os logs, realoca recursos ou escala a infraestrutura. Essa abordagem pode ajudar você a corrigir problemas antes que se agravem, reduzir o tempo médio de resolução (MTTR) e aumentar a confiabilidade de sistemas.

Tickets de serviço aprimorados

As equipes de infraestrutura conseguem responder melhor aos tickets de gerenciamento de serviços de TI (ITSM) quando têm uma visão clara da situação. Com ferramentas de análise de dados que complementam os eventos com insights de IA, você consegue adicionar informações úteis aos processos de registro e acompanhamento de tickets de ITSM. Você pode realizar análises preliminares e atribuir prioridades antes de os tickets entrarem na fila, reduzindo o MTTR e o trabalho manual.

Esse contexto adicional permite às equipes entender melhor os eventos para resolver os problemas rapidamente e limitar o tempo de inatividade.

Três etapas para acelerar a resolução de tickets do ServiceNow ITSM com automação Duração do vídeo: 10:54.

Infraestrutura de IA otimizada

Atender às demandas das cargas de trabalho de IA é um desafio para as equipes de infraestrutura de TI. A observabilidade e a automação mantêm esses sistemas complexos funcionando confiavelmente com menos esforço manual. Você pode automatizar tarefas repetitivas de ajuste de IA, como redimensionar a infraestrutura e reduzir a dispersão de recursos. Também é possível tornar os sistemas mais confiáveis ​​automatizando padrões e configurações de otimização. Juntas, essas abordagens evitam problemas de desempenho antes que afetem os usuários.

Como resultado, suas equipes conseguem acelerar os ciclos de desenvolvimento da IA e colocar modelos em produção por caminhos testados e confiáveis. Assim, sua organização acelera a inovação e continua competitiva. 

Detecção e correção automatizadas de desvios de configuração

Os desvios de configuração (quando os sistemas de TI se afastam do estado desejado) são uma origem comum de instabilidade e vulnerabilidades de segurança. É possível gerenciar esses desvios com o monitoramento tradicional, mas uma abordagem de AIOps vai além ao contextualizar os riscos e impactos, indicando o que corrigir primeiro. 

Quando as ferramentas de observabilidade ou monitoramento identificam desvios de configuração, a automação aprimorada por IA prioriza as correções com base no risco e no impacto nos negócios. Elas também permitem prever efeitos em cascata antes de aplicar as correções e realizar esses ajustes quando forem menos disruptivos. Os problemas de segurança e estabilidade decorrentes dos desvios de configuração são reduzidos sem gerar mais interrupções.

Conformidade e aplicação de políticas

Suas equipes de TI se baseiam em diretrizes estabelecidas para garantir que os sistemas estejam em conformidade com as regulamentações e normas organizacionais. Você pode alinhar seus sistemas de automação orientada a eventos a essas políticas para garantir que elas sejam seguidas.

Como parte da abordagem da AIOps, é possível incorporá-las ao processo automatizado de decisões. Quando um sistema de IA faz uma inferência e inicia uma automação, seus sistemas podem validar a ação para se certificar de que ela esteja em conformidade.

Com esses casos de uso em mente, a próxima etapa na nossa jornada é analisar formas específicas de fazer essas integrações funcionarem. 

Cinco casos de uso da AIOps para o Ansible Automation Platform

Para se beneficiar da automação inteligente orientada por dados, você precisa integrar suas ferramentas de observabilidade à plataforma de automação. Os usuários do Red Hat Ansible Automation Platform contam com diversas opções:

  • Event-Driven Ansible: ideal para processamento de um alto volume de eventos. É a alternativa recomendada para lidar com grandes volumes de alertas de observabilidade ou fluxos de eventos assíncronos.
  • Model Context Protocol (MCP): projetado para agentes de IA, o MCP é um padrão open source para comunicação entre aplicações de IA e serviços externos. É recomendado para fluxos de trabalho com agentes e operações assistidas por IA. Se estiver integrando um modelo de IA ao Ansible Automation Platform, o MCP é a melhor opção.
  • Webhooks: um webhook é uma maneira de enviar comunicações leves orientadas a eventos entre aplicações por HTTP. Sua funcionalidade é limitada, sendo mais adequado para ações simples e do tipo "push", como acionar um ticket de ITSM.
  • Interface de programação de aplicações (API) REST. o Ansible Automation Platform pode interagir com outras aplicações usando uma API REST e seguindo um padrão estabelecido para compartilhamento de informações entre aplicações. Isso ajuda a viabilizar pipelines de integração e entrega contínua (CI/CD) e a integração com sistemas existentes criados para padrões de API REST. No caso de novas instalações, um dos métodos acima provavelmente oferecerá mais vantagens do que o padrão de API REST mais antigo.

Com essas abordagens de integração em mente, analisaremos agora como as soluções Red Hat podem ajudar você a colocar a observabilidade, a AIOps e a automação em prática nas suas equipes. 

Conheça o servidor MCP do Ansible Automation Platform

Para auxiliar na sua estratégia de AIOps, as soluções unificadas da Red Hat permitem automatizar em diversos ambientes e implantar modelos de IA validados e otimizados.

Red Hat Ansible Automation Platform

O Red Hat Ansible Automation Platform é uma solução empresarial de automação de TI abrangente que ajuda a impulsionar a produtividade e eliminar barreiras entre equipes. Ao se integrar com ferramentas de IA e observabilidade já existentes, o Ansible Automation Platform transforma inteligência em automação repetível e com governança nos seus ambientes de TI.

Incluído na subscrição do Ansible Automation Platform, o Event-Driven Ansible é uma solução de automação escalável e responsiva que processa eventos contendo informações específicas e relevantes. Suas equipes de TI definem a resposta adequada para cada evento e a automação lida com o restante. 

Leia o e-book sobre o Event-Driven Ansible

Red Hat AI

O Red Hat AI é uma plataforma de soluções e serviços que pode auxiliar sua empresa em qualquer etapa da jornada de IA. Ela viabiliza a entrega de modelos de IA generativa e preditiva, entre eles os usados pela AIOps.

Com o Red Hat AI, você pode acessar o Red Hat AI Inference Server para otimizar a inferência de modelos, assegurando implantações mais rápidas e econômicas. O Red Hat AI Inference Server inclui o repositório do Red Hat AI, uma coleção de modelos validados e otimizados que oferece flexibilidade na escolha e prioriza a consistência entre equipes.

Juntas, essas soluções ajudam a transformar a inteligência orientada por IA em ações automatizadas, permitindo que suas equipes tomem decisões em grande escala, com mais rapidez.

Recurso

Aproveite todo o potencial da AIOps com a automação

Para que a IA seja operacionalizada, a automação da TI deve ser integrada desde o início. Faça o download para ler mais.

Automação de AIOps com o Red Hat Ansible Automation Platform

O Red Hat® Ansible® Automation Platform é uma solução de automação de ponta a ponta que oferece ferramentas e recursos de IA para uma grande variedade de operações de TI.

Leia mais

Learning Ansible basics

Conheça os princípios básicos do Ansible e veja como o Ansible é eficiente na automação de processos de TI, como provisionamento e gerenciamento de configurações.

How to build an IT automation strategy

Isolada, a automação tem alcance limitado. Para ampliar a automação a todas as áreas das suas operações de TI, você precisa de uma estratégia que integre equipes, processos e fluxos de trabalho desconectados.

What is a software-defined data center (SDDC)?

Data center definido por software (SDDC) é uma abordagem de gerenciamento de TI que abstrai componentes de infraestrutura tradicionais, como computação, armazenamento e rede, e os fornece como serviços de software.

Automação e gerenciamento: conteúdo adicional

Produto em destaque

Artigos relacionados