Panoramica
Gli strumenti di osservabilità migliorano la visibilità sugli ambienti IT e permettono di capire i meccanismi al loro interno. Le informazioni estrapolate dagli ambienti sono utili, ma per le aziende moderne non bastano.
Per incrementare l'efficienza e distribuire sistemi IT affidabili e scalabili, alle organizzazioni serve un approccio che trasformi le informazioni di osservabilità in azioni attraverso l'automazione dell'IA per le operazioni IT (AIOps).
Se adottate congiuntamente nell'ambito di una strategia unificata, osservabilità, AIOps e automazione permettono di ottenere vantaggi esponenzialmente superiori. Resta però una difficoltà: le organizzazioni che investono cifre considerevoli in tali ambiti faticano a coordinare le tecnologie perché lavorino in sinergia. Gli strumenti di osservabilità possono generare un numero elevato di avvisi, il che rischia di sottoporre i team a un forte stress e desensibilizzarli alle notifiche, anche qualora si applichi l'IA per catalogare gli avvisi in base a urgenza o valore. Solo con una contestualizzazione adeguata e l'integrazione con la piattaforma di automazione in uso, i team potranno gestire l'enorme quantità di dati e intervenire in modo coerente e scalabile grazie a processi automatizzati affidabili.
Questo articolo illustra i vantaggi operativi apportati da strumenti di osservabilità intelligenti, approfondendo le funzionalità di Red Hat® Ansible® Automation Platform e Event-Driven Ansible. Il primo approfondimento analizza i concetti fondamentali di osservabilità, AIOps, eventi e automazione, e spiega in che modo si possono integrare per ottenere processi decisionali basati sull'IA grazie all'automazione gestita.
La nostra analisi parte da una risorsa chiave: i dati.
Gli strumenti di osservabilità e i loro limiti
I dati sono la componente indispensabile che alimenta le pratiche di automazione potenziate dall'IA e l'osservabilità è lo strumento che serve a trasformare i dati in valore. Gli ambienti IT diventano sempre più complessi, monitorare i log degli errori e rispondere alle criticità non è più sufficiente. Per questo i team devono avere una visibilità completa sull'ambiente IT.
L'osservabilità risponde a questa esigenza portando il monitoraggio a un livello superiore. Il suo obiettivo è infatti quello di fornire informazioni utili per la risoluzione proattiva dei problemi e l'ottimizzazione dei sistemi e delle applicazioni IT. Gli strumenti di osservabilità in genere sfruttano sia dati tradizionali (log, metriche e tracce) che altre sorgenti di dati, come metadati, comportamento degli utenti, topologia di rete e dettagli a livello di codice.
Gli strumenti di osservabilità attualmente in commercio sono svariati. Le piattaforme Red Hat, ad esempio, integrano noti strumenti di osservabilità, come Splunk, Dynatrace, IBM Instana e LogicMonitor, e altre tecnologie, come bus di eventi, Kafka e webhook. È prassi comune, infatti, utilizzare contemporaneamente diversi strumenti di osservabilità per monitorare al meglio sistemi e comportamenti differenti.
La capacità di raccogliere tutte queste informazioni aiuta ad avere una visione più completa dell'ambiente IT. Grazie all'osservabilità, i team sapranno non solo che si è verificato un problema, ma anche qual è la causa principale e come risolverlo.
Gli strumenti di osservabilità sono efficaci per individuare le criticità così come gli interventi da attuare a supporto della gestione operativa. Il problema è legato all’elevato numero di avvisi che generano e che possono confondere i team. Per risolvere questa difficoltà, potrebbe risultare utile scrivere una serie di regole che definiscano a priori come rispondere a ogni avviso.
Un simile processo richiede però molto tempo e genera un debito tecnico ogni volta che si apporta una modifica al funzionamento dei sistemi.
Alle aziende occorre un approccio che permetta di applicare i dati e le informazioni raccolte in maniera intelligente e in questo caso l'osservabilità non può aiutare. In questo contesto si inserisce AIOps.
Cos'è l'osservabilità?
Intelligenza operativa scalabile con AIOps
Se gli avvisi generati dagli strumenti di osservabilità arrivano a un troppo ritmo serrato, AIOps può aiutare a superare l’ostacolo.
Con il termine AIOps non si intende un prodotto o una piattaforma specifica, ma un approccio che mira a semplificare la gestione dell'automazione dell'IT attraverso il machine learning e l’intelligenza artificiale. La metodologia AIOps fornisce le capacità di IA necessarie per avviare interventi in maniera automatizzata al fine di ottenere uno specifico risultato e si allinea agli obiettivi dei team di ingegneria della piattaforma e site reliability engineering (SRE).
Il primo passo per implementare un approccio AIOps è raccogliere i dati ottenuti con gli strumenti di osservabilità per ottenere una visione unificata dell'intero ambiente IT. È poi possibile utilizzare il machine learning per individuare anomalie, identificare modelli e generare suggerimenti utili in tempo reale. Importante notare anche che i sistemi basati sull'IA hanno la capacità di migliorarsi nel tempo. Anziché reagire sempre allo stesso modo a un evento, tali sistemi sono in grado di osservare e adattarsi per raggiungere al meglio i risultati desiderati.
Non esiste un unico modo per integrare l'IA nelle proprie operazioni. Molti strumenti di osservabilità ora includono funzionalità di IA integrate, ma è anche possibile utilizzare i propri modelli di IA nei flussi di lavoro dell'automazione.
I vantaggi derivanti dall'utilizzo dei dati di osservabilità in combinazione alle capacità di AIOps sono evidenti. Tuttavia, manca ancora trasformare questa intelligenza in risultati misurabili. A questo servono gli eventi.
Gli eventi e la loro importanza per AIOps
Si definisce evento una qualsiasi cosa rilevabile e significativa che accade in un sistema IT. Pensiamo ad esempio a un cambiamento di stato in una applicazione, componente hardware o software, istanza cloud o altra tecnologia. Qualcosa che si avvia o si arresta, una connessione di rete che si apre o si chiude, un'attività che supera un certo livello, tutti questi prendono il nome di eventi.
Alcuni eventi potrebbero richiedere risposte completamente diverse a seconda delle circostanze. Ad esempio, la risposta standard a un carico elevato su un sistema potrebbe essere l'invio di una semplice notifica. Se però il sistema eseguisse carichi di lavoro sensibili, potrebbe essere più indicato l'arresto immediato per prevenire rischi di sicurezza. Gli strumenti di osservabilità consentono di individuare gli eventi e le pratiche AIOps aiutano a contestualizzarli in modo da attivare la risposta automatizzata appropriata.
Grazie agli eventi potenziati dall'intelligenza artificiale, è possibile stabilire il piano più adeguato per un'ampia gamma di situazioni e adattarsi a nuove tipologie di eventi man mano che si presentano. I concetti fin qui illustrati costituiscono le basi necessarie per ottenere il massimo dall'automazione guidata dagli eventi, l'argomento trattato di seguito.
Automazione guidata dagli eventi e basata sull'IA
L'automazione guidata dagli eventi è un approccio che permette di automatizzare i flussi di lavoro relativi alle operazioni IT a partire dai dati di osservabilità. Aiuta a mantenere il controllo di sistemi complessi, inclusi ambienti ibridi, di IA e di edge computing. Riduce le attività di routine, permettendo ai team IT di dedicare più tempo alle attività strategiche.
Come accennato in precedenza, è possibile applicare l'IA ai dati di osservabilità per automatizzare i processi decisionali e renderli più efficaci. Questo permette di accelerare la risoluzione dei problemi e trarre il massimo vantaggio dai flussi di lavoro dell'automazione guidata dagli eventi.
Red Hat Ansible Automation Platform include Event-Driven Ansible, un set di funzionalità per la gestione degli eventi pensato per agevolare l'automazione delle attività in diversi ambiti IT.
Gli elementi fondamentali di Event-Driven Ansible sono tre:
- Sorgenti. Forniscono i dati relativi agli eventi, come le condizioni dell'ambiente IT. Gli eventi sono trasmessi a Event-Driven Ansible tramite plugin o webhook.
- Rulebook. Contengono un set di regole e condizioni che definiscono quale intervento avviare in risposta a un dato evento.
- Interventi. Sono il risultato dell'automazione. Si tratta delle azioni pratiche che vengono intraprese dal sistema per rispondere a un evento.
Analogamente agli Ansible Playbook, gli Ansible Rulebook sono scritti in linguaggio YAML leggibile in chiaro, ma si avvalgono di regole condizionali per stabilire quando avviare un determinato intervento. Event-Driven Ansible monitora l'ambiente, rileva la presenza di eventi ed esegue automaticamente la risposta appropriata.
Gli utenti di Ansible Automation Platform possono integrare la piattaforma con strumenti open source, come Prometheus Alertmanager o Apache Kafka. Red Hat mette a disposizione un ampio ecosistema di soluzioni certificate e convalidate per assicurare integrazioni lineari.
Associando l'automazione guidata dagli eventi agli strumenti aziendali in uso, le aziende possono beneficiare di una serie di vantaggi senza precedenti.
I vantaggi dell'automazione di AIOps supportata dall'osservabilità
Scegliere AIOps come approccio all'automazione guidata dagli eventi consente di sfruttare dati di osservabilità, informazioni derivate dall'IA e logica basata su regole per automatizzare quella che altrimenti sarebbe un'enorme mole di lavoro manuale. Ciò permette di sostituire i vecchi processi reattivi e manuali con misure proattive.
Di seguito alcuni vantaggi di questo approccio:
- Rilevamento proattivo. Il rilevamento delle anomalie basato sull'IA aiuta a prevenire i problemi prima che si ripercuotano sugli utenti.
- Analisi intelligente. L'identificazione automatizzata delle cause principali di un errore e di suggerimenti mirati per la risoluzione del problema aiutano a risparmiare tempo.
- Tempi di risposta più rapidi. I team possono agire rapidamente grazie a decisioni basate sull'IA e all'automazione gestita.
- Apprendimento continuo. I sistemi basati sull'IA sono in grado di perfezionare i loro suggerimenti nel tempo, anziché operare su un set di regole fisso.
Questo approccio permette di ottenere un'infrastruttura affidabile, ridurre i costi e accelerare la risoluzione dei problemi. La prossima sezione analizza alcuni scenari di utilizzo specifici in cui i vantaggi appena elencati fanno la differenza.
Scenari di utilizzo dell'automazione di AIOps
Osservabilità, automazione e AIOps consentono di risolvere svariati scenari di utilizzo aziendali.
Infrastruttura affidabile
L'approccio AIOps aiuta a gestire in maniera automatizzata gli avvisi più comuni. Coadiuvata da analisi e suggerimenti generati dall'IA, la piattaforma di osservabilità sarà in grado di avviare interventi automatizzati.
Ad esempio, se un sistema inizia a presentare segni di malfunzionamento, la piattaforma attiverà in automatico il riavvio dei servizi, la cancellazione dei log, la riallocazione delle risorse o il ridimensionamento dell'infrastruttura. Questo approccio aiuta a risolvere i problemi prima che si aggravino, riduce il tempo medio di ripristino (MTTR) e migliora l'affidabilità dei sistemi.
Risposta ai ticket migliorata
Con un quadro più chiaro dell'ambiente IT, i team responsabili dell'infrastruttura possono rispondere in modo più efficace ai ticket di gestione dei servizi IT (ITSM). L'utilizzo di strumenti di analisi che integrano gli eventi con l'analisi basata sull'IA permette di aggiungere informazioni utili ai processi di gestione dei ticket e di monitoraggio ITSM. La piattaforma svolge infatti un'analisi preliminare e assegna un punteggio di priorità prima che i ticket entrino in coda, il che riduce il tempo MTTR e il lavoro manuale.
Grazie a questa contestualizzazione aggiuntiva, i team potranno comprendere meglio gli eventi, risolvere rapidamente i problemi e limitare i tempi di fermo.
Tre passaggi automatizzati per accelerare la risoluzione dei ticket ITSM di ServiceNow con Ansible Automation Platform. Durata del video: 10:54.
Infrastruttura di IA ottimizzata
Soddisfare i requisiti dei carichi di lavoro dell'IA rappresenta una sfida per i team responsabili dell'infrastruttura IT. L'introduzione di osservabilità e automazione contribuisce ad assicurare il corretto funzionamento di questi sistemi complessi riducendo al minimo il lavoro manuale. Grazie a questi strumenti, i team possono automatizzare le attività ripetitive legate all'ottimizzazione dell'IA, come il ridimensionamento dell'infrastruttura e il controllo sulla proliferazione delle risorse, oltre a migliorare l'affidabilità dei sistemi grazie all'automazione delle configurazioni e dei modelli di ottimizzazione. Questi approcci permettono di prevenire i problemi prestazionali prima che si ripercuotano sugli utenti.
I team possono inoltre accelerare i cicli di sviluppo dell'IA e far passare i modelli dalla fase di sviluppo a quella di produzione seguendo percorsi collaudati e affidabili. Tutto ciò consente alle aziende di accelerare le iniziative di innovazione garantendosi una posizione di primo piano nel mercato odierno.
Rilevamento e correzione automatizzati degli errori di configurazione
Con errore di configurazione si intende la situazione in cui un sistema IT si discosta dalla condizione desiderata ed è una problematica comune che genera vulnerabilità di sicurezza e instabilità. Anche se si può tentare la via del monitoraggio tradizionale, l'approccio AIOps si rivela più efficace perché capace di contestualizzare rischi e conseguenze, oltre a classificare i problemi in base all'urgenza.
Quando gli strumenti di monitoraggio o osservabilità rilevano un errore di configurazione, i team possono sfruttare l'automazione potenziata dall'IA per dare priorità alle correzioni in base al rischio e all'impatto sul business. Possono inoltre prevedere eventuali effetti a cascata e decidere di posticipare l'intervento per contenere le interruzioni. Così facendo si possono ridurre i problemi di sicurezza e stabilità causati dagli errori di configurazione senza causare ulteriori tempi di fermo.
Applicazione dei criteri e conformità
Per garantire che i sistemi siano conformi alle normative e agli standard aziendali, i team IT si affidano a policy consolidate. Allineando i sistemi di automazione guidata dagli eventi a tali policy, le aziende possono assicurare la massima conformità.
Nell'ambito della strategia di AIOps, è possibile integrare le policy aziendali nei processi decisionali automatizzati. Questo significa che ogni volta che un sistema di IA formula un'inferenza e avvia un intervento automatizzato, questo verrà convalidato per assicurarne la conformità alle policy definite.
Tenendo in considerazione questi scenari di utilizzo, nella prossima sezione vengono descritte alcune modalità specifiche che permettono di integrare i sistemi di osservabilità e automazione in maniera efficace.
Come integrare i sistemi di osservabilità e automazione
Per ottenere il massimo vantaggio dall'automazione intelligente basata sui dati, è necessario integrare gli strumenti di osservabilità con la piattaforma di automazione. Gli utenti di Red Hat Ansible Automation Platform hanno a disposizione diverse opzioni:
- Event-Driven Ansible. Event-Driven Ansible è particolarmente adatto all'elaborazione di grandi volumi di eventi. Si presta alla gestione di picchi importanti di avvisi di osservabilità o di flussi di eventi asincroni.
- Model Context Protocol (MCP). Progettato per gli agenti IA, MCP è uno standard open source per la comunicazione tra applicazioni di IA e servizi esterni. È indicato per i flussi di lavoro dell'Agentic AI e per le operazioni assistite dall'IA. MCP è uno strumento valido per chi desidera integrare un modello di IA con Ansible Automation Platform.
- Webhook. Un webhook è un metodo per garantire la comunicazione guidata dagli eventi fra applicazioni tramite HTTP. I webhook hanno funzionalità limitate e sono adatti ad azioni semplici e di tipo push, come l'apertura di un ticket ITSM.
- API REST. Ansible Automation Platform è in grado di interagire con altre applicazioni tramite API REST, uno standard comprovato per la condivisione di informazioni fra le applicazioni. In questo modo supporta pipeline di integrazione e distribuzione continue (CI/CD) e i sistemi esistenti progettati per gli standard API REST. Per le nuove installazioni, è consigliabile orientarsi su un altro dei metodi appena elencati anziché affidarsi al vecchio standard API REST.
La nostra analisi descrive infine l'offerta di soluzioni Red Hat che agevolano il lavoro dei team integrando strumenti di osservabilità, AIOps e automazione.
Perché scegliere Red Hat per AIOps
Red Hat offre un portafoglio di soluzioni a supporto delle strategie di AIOps che aiutano le aziende a estendere l'automazione in tutti gli ambienti e distribuire modelli di IA convalidati e ottimizzati.
Red Hat Ansible Automation Platform
Red Hat Ansible Automation Platform è una soluzione di automazione end to end progettata per contesti aziendali che aiuta a migliorare la produttività e favorisce la collaborazione fra i team. Grazie all'integrazione con gli strumenti di IA e di osservabilità in uso, Ansible Automation Platform permette di trasformare le informazioni raccolte in processi automatizzati ripetibili e di applicare tali processi in modo coerente in tutto l'ambiente IT.
La sottoscrizione Ansible Automation Platform include anche Event-Driven Ansible, una soluzione di automazione scalabile e reattiva capace di elaborare eventi contenenti informazioni fruibili e distinte. Consente ai team IT di determinare la risposta appropriata a un determinato evento e di intervenire in maniera automatizzata.
Red Hat AI
Red Hat AI è una piattaforma che include prodotti e servizi progettati per semplificare l'adozione dell'IA. Aiuta a sviluppare modelli di IA predittiva e di IA generativa, compresi quelli a supporto dell'approccio AIOps.
Red Hat AI mette a disposizione Red Hat AI Inference Server con cui è possibile ottimizzare l'inferenza dei modelli per garantire deployment più rapidi e contenere i costi. Red Hat AI Inference Server include il repository Red Hat AI, una raccolta di modelli di terze parti convalidati e ottimizzati che garantisce la flessibilità dei modelli e promuove la coerenza tra i team.
Insieme, queste soluzioni aiutano le aziende a trasformare le informazioni guidate dall’IA in azioni automatizzate, migliorando l’adattabilità e la velocità dei processi decisionali.
Cogli tutte le opportunità offerte da AIOps attraverso l'automazione
Affinché l'IA sia operativa ed efficace, l'automazione dell'IT deve essere integrata fin dall'inizio. Esegui il download per saperne di più.