Person mit langen roten Haaren, die an einem Schreibtisch mit Blick auf einen Computer arbeitet
Zu Abschnitt

Was ist AIOps?

URL kopieren

AIOps steht für künstliche Intelligenz für IT-Operationen. Dabei handelt es sich sowohl um einen konzeptuellen Ansatz für IT-Abläufe als auch um ein integriertes Softwaresystem, das die manuelle Problemlösung und Systembehebung mittels Data Science ergänzt. AIOps kombiniert Big Data mit künstlicher Intelligenz oder maschinellem Lernen, um ein breites Spektrum von IT-Prozessen und -Aufgaben zu verbessern oder teilweise zu ersetzen.

Voraussetzung für das Funktionieren der KI-Komponente von AIOps ist, dass sie etwas zu tun hat. Sie benötigt Daten, operative Daten. Spezifikationen wie Verfügbarkeit, Ausfallzeiten, Datennutzung, Netzwerkverkehr, Anwendungsprotokolle, Fehler, Authentifizierungsversuche und Firewall-Warnungen sowie historische Daten. Diese Datenerfassung, -organisation und -bereinigung ist in der Regel schwieriger als die Integration der Algorithmen und Lernmodelle.

Wenn diese Daten vorliegen, können Ziele und Indikatoren für das Serviceniveau festgelegt werden. Definieren Sie diesen operativen Zustand anhand nachverfolgbarer Metriken, die dann die Basis für ein AIOps-System bilden. Viele Unternehmensplattformen verfügen über Komponenten zur operativen Überwachung (oder sind damit verbunden): Red Hat® OpenShift® verfügt über Red Hat OpenShift Observability, Red Hat Enterprise Linux® nutzt Red Hat Satellite und Red Hat Ansible® Automation Platform nutzt Prometheus und Grafana.

Nach der Definition des Betriebszustands können Sie KI anwenden. Es ist einfacher denn je, KI in Projekte einzubinden. 

Angesichts dieser zahlreichen Möglichkeiten ist es kaum verwunderlich, dass natürliche Sprachverarbeitung (NLP), künstliche Intelligenz (KI), maschinelles Lernen (ML) und Deep Learning (DL) zu einem festen Bestandteil unserer kulturellen Realität geworden sind.

Vorteile

  • Schnelle Lösung: AIOps reduziert Ausfallzeiten, indem es mögliche Probleme erkennt und auf sie reagiert und so die MTTR (Mean Time To Resolution) verkürzt.
  • Systeme mit Selbstreparaturfunktion: Eine Infrastruktur mit Selbstreparaturfunktion kann die Performance und Verfügbarkeit erheblich verbessern. 
  • Big Data: AIOps nutzen Big Data, indem sie sie bereinigen, analysieren und entsprechende Maßnahmen ergreifen.
  • Effizienz und Umfang: Verbesserte Mitarbeitereffizienz durch das Nutzen von Erkenntnissen aus KI-Modellen, um Aktionen zu identifizieren und die Erkennungsrate zu erhöhen.
  • Innovation: Durch die Beseitigung repetitiver Aufgaben können die IT-Teams strategischere und hochwertigere Projekte entwickeln und durchführen.
  • Vereinfachung: AIOps ermöglicht die Optimierung vieler sich wiederholender Aufgaben im IT-Service-Management.
  • Datenkorrelation und Entscheidungsfindung in Echtzeit: Wenn AIOps eine Automatisierungs-Engine enthält, kann es automatisch auf Datenbasis reagieren und so menschliche Eingriffe und Fehler reduzieren und gleichzeitig Noise minimieren.
  • Skalierte Datenkorrelation und -prognose: AIOps kann automatisch sämtliche möglichen Permutationen analysieren, und zwar weit über menschliche Möglichkeiten hinaus.

Herausforderungen

  • Expertise: Da umfangreiche Kenntnisse in Data Science erforderlich sind, ist die Einstiegshürde sehr hoch.
  • Infrastruktur: Ohne standardisierte Plattformen und Funktionen (wie diejenigen von Red Hat OpenShift und Ansible Automation Platform) kann das Training von AIOps für Ihre spezifische Infrastruktur kompliziert sein.
  • Wertschöpfung: AIOps-Systeme sind mitunter schwierig zu konzipieren, zu implementieren, bereitzustellen und zu verwalten, sodass es mitunter dauern kann, bis sich die Investition auszahlt.
  • Daten: Das Volumen, die Qualität und die Konsistenz der Daten, die durch moderne IT-Abläufe erzeugt werden, können überwältigend und schwer zu kontrollieren sein. Außerdem sind die Ergebnisse von AIOps nur so gut wie die Qualität der Datenquellen.
  • Kollektive Einigung: Das Definieren des Systemzustands und das Festlegen von Standardbetriebszielen erfordert die Zustimmung vieler Beteiligter – ein Konsens, der mitunter nur schwer zu erreichen ist.
  • Umfang: Die Vielzahl der zu berücksichtigenden Aspekte kann schon beim Einstieg überwältigend sein. Oder die Umgebung ist einfach zu dynamisch, um als Basis zu dienen.
  • Misserfolgsquote: KI-Projekte haben eine hohe Misserfolgsquote. Laut dem AI InfrastructureView von IDC setzen 31 % der befragten Unternehmen KI in der Produktion ein, aber nur ein Drittel davon konnte unternehmensweite Vorteile realisieren.

Im Detail: Warum können verschiedene Berufsgruppen von AIOps profitieren?

  • Anwendungs-SREs (Site Reliability Engineers) können die 4 wichtigsten Kriterien definieren, auf die sich die KI konzentrieren kann: Latenz, Fehlerrate, Datenverkehr und Auslastung.
  • Entwicklungsteams können AIOps-Analysen verwenden, um ihre eigene RCA (Root Cause Analysis) durchzuführen, oder sie können der AIOps-Engine erlauben, RCA ohne menschliches Eingreifen durchzuführen.
  • Führungskräftekönnen AIOps nutzen, um dieselben wichtigen Kriterien zu überwachen, die von SREs genutzt werden, um die Anwendungs-Performance aus Sicht der Endnutzenden zu verstehen.
  • Infrastruktur-Operators können mit AIOps Hybrid Cloud-, Multicloud- und Microservice-basierte IT-Umgebungen überwachen – von einigen Dutzend virtueller Maschinen (VMs) bis zu Tausenden von Clustern – und Day-2-Operationen vereinfachen.

Diese Use Cases zeigen, dass Teams mithilfe von AIOps potenzielle Probleme erkennen und darauf reagieren können. AIOps-Systeme können jedoch noch nicht erfahrene IT-Systemadmins und andere Operations-Teams ersetzen. Wie bei den meisten IT-Revolutionen übernehmen mit AIOps Maschinen einfach nur unsere Routinen, während wir das Steuer selbst in der Hand behalten.

Maschinen ersetzen also nicht den Menschen. Allerdings könnten Data Scientists und DevOps Engineers die neue IT-Revolution auch nutzen, um ihre Kompetenzen zu erweitern.

  • APM (Application Performance Monitoring) gewinnt zunehmend an Bedeutung, da Unternehmen Kandidatinnen und Kandidaten mit performance-orientiertem Hintergrund suchen.
  • Kompetenzen in der Automatisierung sind zunehmend wichtig, um die zugrundeliegenden KI-Skripte zu verstehen, einzubinden oder zu schreiben und um Event Correlation and Alert Engines in Execution Engines zu verwandeln. 
  • Wenn Sie bereits über fundierte Kenntnisse auf dem Gebiet der KI verfügen, könnten Sie damit beginnen, (sicher) mit Netzwerk-KI zu experimentieren (wie etwa SD-WAN, Wi-Fi usw.).

Bei DevOps geht es darum, kleine, inkrementelle Verbesserungen entlang des gesamten Anwendungs-Lifecycles vorzunehmen – und zwar kontinuierlich. Der Fluch von DevOps sind also Ausfallzeiten – und hier setzt AIOps an. AIOps erweitert die DevOps-Kultur, indem es die Entwicklungs- und Betriebsabläufe um Data Science ergänzt. 

AIOps ersetzt DevOps also nicht, sondern stellt eine Weiterentwicklung von DevOps dar. AIOps ist nur ein weiterer Punkt im Lifecycle der digitalen Transformation. AIOps und DevOps haben dieselben Aufgaben. AIOps erweitert lediglich die menschliche Intelligenz durch ein mechanisches Gehirn. 

Obwohl die Grenzen zwischen DevOps und AIOps fließend sind, fügt sich AIOps nahtlos an beiden Enden der DevOps-Prozesse ein:

  • Am Frontend kann AIOps riesige Mengen an Infrastrukturdaten verarbeiten und DevOps Engineers auf zugrundeliegende Probleme in der IDE (Integrated Development Environment) hinweisen (oder sie direkt beheben). 
  • Am anderen Ende können AIOps automatisch redundante IT-Probleme in der Produktion beheben und gleichzeitig lernen, neue Bugs zu beheben, die mit neuen inkrementellen Releases auftreten. 

Wie bei DevOps auch gibt es kein einzelnes AIOps-Tool, keine einzelne AIOps-Plattform und kein einzelnes AIOps-Produkt. Die Tools, die Sie zum Erstellen von DevOps- und AIOps-Funktionen verwenden, sind so zahlreich und individuell wie Ihr IT-Stack (Hardware und Software). Das liegt daran, dass die von Ihnen entwickelte AIOps-Lösung die verschiedenen besonderen Komponenten Ihrer Entwicklungs- und Produktionsumgebungen integrieren, analysieren und umsetzen muss.

AIOps ist in Open Source sehr präsent – sowohl als Upstream-Projekt als auch innerhalb vieler Communities. Obwohl kein einzelnes Produkt eine vollständige AIOps-Lösung darstellt, gibt es viele Open Source-Projekte für Entwicklung, Operationen, KI und Automatisierung, die als Teil Ihrer individuellen AIOps-Lösung verwendet werden können. Darüber hinaus gibt es viele spezifische Open Source-Projekte, die entwickelt werden, um AIOps-Lösungen für spezifische AIOps-Probleme anzubieten.

Einige Unternehmen veröffentlichen ihren Downstream-KI-Produktcode als Upstream-Projekte:

  • Meta, das weltweit größte Social-Media-Konglomerat, hat das große Sprachmodell Llama 2 als Open Source-Projekt veröffentlicht.
  • Red Hat hofft, dass das Open Source-Projekt Project Thoth zu gehärteten Produkten für Unternehmen führen wird, so wie Project Wisdom zu Ansible Automation Plaforms Ansible Lightspeed mit IBM watsonx Code Assistant-Komponente geführt hat.
  • Wir beteiligen uns auch an AIOps-Projekten, die von anderen Organisationen geleitet werden, wie dem AIOps-Projekt des Artificial Intelligence Center of Excellence (AICoE).

Unsere Automatisierungsplattform in Kombination mit den KI-Fähigkeiten unserer Partner verschafft Ihrem Unternehmen einen enormen Vorsprung bei der Programmierung einer strategischen AIOps-Lösung, denn sie kombiniert die Beobachtungsfähigkeiten von KI mit der eventgesteuerten Architektur unserer Automatisierungs-Engine. 

Verwenden Sie Event-Driven Ansible, um Maßnahmen zu den Erkenntnissen Ihrer KI zu ergreifen. Koppeln Sie unsere Automatisierungsplattform mit den kausalen KI-Engines unserer Partner (wie denjenigen von Dynatrace und anderen modernen Beobachtungstools). Außerdem können Sie Ansible Lightspeed mit IBM watsonx Code Assistant verwenden, um Entwicklungs- und Operations-Teams unterschiedlicher Kompetenzstufen beim Schreiben von syntaktisch korrektem Code mit KI-generierten Empfehlungen zu unterstützen.

Weiterlesen

Artikel

Die Grundlagen von Ansible

Ansible automatisiert IT-Prozesse wie Provisionierung und Konfigurationsmanagement. Erlernen Sie die Grundlagen von Ansible mit dieser Einführung in die wichtigsten Konzepte.

Artikel

Was ist ein Ansible Playbook?

Ein Ansible® Playbook ist ein Blueprint von Automatisierungsaufgaben, also IT-Aktionen, die mit geringem manuellem Aufwand über ein Inventory von IT-Lösungen ausgeführt werden können.

Artikel

Warum Red Hat für die Automatisierung?

Die Red Hat Ansible Automation Platform umfasst alle Tools, die Sie zur Implementierung einer unternehmensweiten Automatisierung und zum teamübergreifenden Teilen von Automatisierungsprozessen benötigen.

Mehr über Automatisierung

Produkte

Interaktionen mit unseren strategischen Beratern, die sich ein Gesamtbild von Ihrem Unternehmen machen, Ihre Herausforderungen analysieren und Ihnen helfen, diese mit umfassenden, kosteneffektiven Lösungen zu meistern.

Eine Plattform für die Implementierung unternehmensweiter Automatisierungsprozesse – unabhängig davon, in welcher Phase der Automatisierung Sie sich befinden.

Ressourcen

Training

Learning Hub

Hier finden Sie Lernmaterialien und Tools, die Sie bei der Verwendung von Red Hat® Ansible® Automation Platform unterstützen, geordnet nach den Aufgaben, die Sie zu erledigen haben.

Interactive Labs

Diese interaktiven Szenarien ermöglichen es Ihnen, die Verwendung von Ansible Automation Platform für eine Vielzahl von Use Cases zu erlernen - in Ihrem eigenen Browser.

Kostenloser Trainingskurs

Diese Reihe von On-Demand-Videos zeigt Ihnen die Verwendung von Red Hat Ansible Automation Platform für eine Vielzahl von Use Cases.  

Trainingskurs

In diesem Kurs lernen Sie, wie Sie Red Hat Enterprise Linux mit der aktuellen Version von Ansible Automation Platform automatisieren können.