Was ist Machine Learning?

URL kopieren

Machine Learning (ML) ist eine Unterkategorie der künstlichen Intelligenz (KI). Dabei kommen Algorithmen zum Einsatz, um innerhalb eines Datensatzes Muster zu erkennen und Vorhersagen zu treffen. Diese Daten können aus Zahlen, Text oder sogar Fotos bestehen. 

Unter idealen Bedingungen ermöglicht Machine Learning dem Menschen eine schnellere und präzisere Interpretation von Daten, als es uns selbst je möglich wäre. Machine Learning wird von mathematischen Grundlagen abgeleitet, die es Algorithmen ermöglichen, aus Daten zu lernen, Vorhersagen zu treffen und Modelle zu optimieren.

Mehr über Red Hat AI erfahren

Künstliche Intelligenz entsteht, wenn Menschen Maschinen so programmieren, dass sie einen Eindruck menschenähnlicher Intelligenz vermitteln. Für Machine Learning bedeutet das, dass Maschinen so programmiert werden, dass sie bestimmte kognitive Funktionen nachahmen, über die der Mensch von Natur aus verfügt, wie etwa Wahrnehmung, Lernen und Problemlösung. 

Wie wird erreicht, dass eine Maschine „denkt“ wie ein Mensch? Sie wird so trainiert, dass sie ihr eigenes Vorhersagemodell erstellen kann. Dieses Vorhersagemodell dient als Mittel, mit dem die Maschine Daten analysiert und schließlich zu einer „lernenden“ Maschine wird. Dazu müssen Sie dem Computer Daten zur Verfügung stellen und ein Lernmodell auswählen, das der Maschine vorgibt, wie sie die Daten zu verarbeiten hat. 

Mehr über den Einsatz von KI in Unternehmen erfahren
Ein ML-Modell kann Daten letztlich für 3 Funktionen nutzen:

  • Beschreiben, was passiert ist
  • Vorhersagen, was passieren wird
  • Vorschläge machen, welche Maßnahmen als Nächstes zu ergreifen sind

Welches Lernmodell zum Trainieren der Maschine gewählt wird, hängt von der Komplexität der Aufgabe und dem gewünschten Ergebnis ab. Machine Learning wird in der Regel in 3 Lernmethoden unterteilt: Supervised Learning (überwachtes Lernen), Unsupervised Learning (unüberwachtes Lernen) und Reinforcement Learning (bestärkendes Lernen).

Supervised Learning-Modelle werden mit gekennzeichneten Datensätzen trainiert. Dieses Modell wird für Aufgaben wie die Bilderkennung verwendet.

Unsupervised Learning-Modelle prüfen nicht gekennzeichnete Daten und suchen nach Gemeinsamkeiten, Mustern und Trends. Dieses Modell wird für Aufgaben wie Kundensegmentierung, Empfehlungssysteme und allgemeine Datenexploration verwendet.

Reinforcement Learning-Modelle trainieren nach dem Trial and Error-Prinzip innerhalb eines etablierten Belohnungssystems. Diese Art des Lernens wird beispielsweise verwendet, um einem Computer beizubringen, ein Spiel zu spielen, bei dem Aktionen zu einem Sieg oder einer Niederlage führen. 

Sobald der Computer mit der Art und Weise vertraut ist, wie er Daten interpretieren soll (dank des Lernmodells und der Trainingsdaten), kann er Vorhersagen treffen und Aufgaben ausführen, wenn ihm neue Daten vorgelegt werden. Nach und nach kann der Computer immer genauere Vorhersagen treffen, da er aus kontinuierlichen Daten-Streams lernt und in der Lage ist, Aufgaben in kürzerer Zeit und mit größerer Genauigkeit auszuführen als ein Mensch.

Hybrid Cloud-Plattform für KI/ML-Workloads entwickeln

Red Hat Ressourcen

In der Trainingsphase des Machine Learnings lernt das Modell anhand eines bereitgestellten Datensatzes. In dieser Phase besteht das Ziel der Entwicklungsteams darin, die Parameter des Modells anzupassen und Fehler in der Ausgabe zu minimieren. 

Dies geschieht durch das Erstellen einer Pipeline, über die Daten durch das Modell geschickt und seine Vorhersagen bewertet werden. Anschließend wird das Modell anhand der Vorhersagen optimiert. Die Pipeline umfasst oft die folgenden Schritte:

  1. Erfassen und Vorbereiten von Daten: Daten werden erfasst und anschließend vorbereitet, indem sie in Trainings- und Testdaten unterteilt, unerwünschte Daten entfernt und für eine gleichmäßige Verteilung zufällig angeordnet werden. Wenn die Anzahl der Eingabevariablen oder Features in einem Datensatz derart reduziert wird, wesentliche Informationen aber beibehalten werden, spricht man auch von einer „Reduzierung der Dimensionalität“.
  2. Auswählen des Modells: Data Scientists und Engineers haben verschiedene ML-Algorithmen für unterschiedliche Aufgaben wie Spracherkennung, Bildanalyse, Vorhersage und mehr entwickelt.
  3. Trainieren: Die vorbereiteten Eingabedaten werden durch das Modell gesendet, um Muster zu finden (Mustererkennung) und Vorhersagen zu treffen.
  4. Bewerten: Nach dem Training wird die Ausgabe eines Modells anhand eines bislang nicht genutzten Datensatzes bewertet.

Tuning: Entwicklungsteams stimmen die Parameter anschließend per Fine Tuning ab, um das Modell basierend auf den Erkenntnissen des vorherigen Bewertungsschritts noch weiter zu verbessern.

Häufige Herausforderungen während Training und Bewertung

Bei einem Modell, das mit den Trainingsdaten gut funktioniert, aber bei einem Durchlauf mit den Testdaten schlecht abschneidet, liegt unter Umständen eine Überanpassung vor. Das bedeutet, es lernt zu viel vom als „Noise“ bezeichneten „Rauschen“ in den Trainingsdaten, also unerwünschten oder irrelevanten Information, die die Qualität beeinträchtigen. Bei einem Modell, das mit beiden Datensätzen schlecht abschneidet, besteht möglicherweise eine Unteranpassung – es hat die zugrunde liegenden Muster nicht erlernt.

LoRA und QLoRA sind ressourceneffiziente Methoden zum Fine Tuning, mit denen Nutzende eine Überanpassung vermeiden können. 

Um eine Überanpassung der Trainingsdaten zu vermeiden, kann ein separater Validierungsdatensatz verwendet werden. Die Ausgabe des Modells wird nach jeder Iteration anhand der Validierungsdaten bewertet. 

Anschließend werden Änderungen vorgenommen, um eine Überanpassung zu verhindern. Durch die hier angewendete Reduzierung der Dimensionalität werden also irrelevante Daten entfernt, die zu einer Überanpassung führen könnten. Bei einer solchen Reduzierung muss jedoch vorsichtig vorgegangen werden, da es sonst zu einer Unteranpassung kommen kann.

Eine Unteranpassung korrigieren die Entwicklungsteams, indem sie informativere Features hinzufügen. Dadurch kann die Fähigkeit des Modells, komplexe Beziehungen in den Daten zu erkennen, verbessert werden.

Datenlecks treten auf, wenn Informationen des Testdatensatzes versehentlich in den Trainingsdatensatz gelangen, was dem Modell einen unfairen Vorteil verschafft und eine überschätzte Performance zur Folge hat.

Tuning, neue Features und relevantere Daten können Fehler in zukünftigen Iterationen minimieren. 

Sind ML-Modelle bereit für das Deployment, führen sie einen Prozess namensInferenzaus. Inferenz ist die „Aktionsphase“, in der ein KI-Modell das anwendet, was es während des Trainings erlernt hat, um Ausgaben in einer Produktivumgebung bereitzustellen. 

vLLM, ein Inferenzserver und eine Inferenz-Engine, sorgt für einen effizienteren Inferenzprozess. Es nutzt Speicherverwaltungstechniken, um die Verarbeitungsgeschwindigkeit (Durchsatz) zu maximieren, damit Nutzende schnelle und zuverlässige Ergebnisse mit ihren ML-Modellen erhalten. 

Red Hat AI Inference Server

Neuronale Netze beziehen sich auf einen Algorithmustyp, der im Machine Learning genutzt wird. Sie eignen sich besonders für Aufgaben, bei denen es um komplexe, nicht lineare Beziehungen in Daten geht. Deep Learning ist ein Teilbereich von Machine Learning, bei dem mehrschichtige neuronale Netze verwendet werden. Diese tiefen neuronalen Netze sind gut strukturiert, um hierarchische Darstellungen von Daten zu erlernen. Das macht Deep Learning zu einer extrem leistungsstarken Lösung für Aufgaben wie Bilderkennung, Verarbeitung natürlicher Sprache und Spracherkennung.

Erfahren Sie, wie MoE-Modelle (Mixture of Experts) mithilfe von Deep Learning und neuronalen Netzen die KI-Inferenz beschleunigen.

Mehr über die Funktionsweise von MoEs erfahren

Machine Learning und künstliche Intelligenz können eingesetzt werden, um das Benutzererlebnis zu verbessern, das Kundenverhalten zu antizipieren und Systeme zur Betrugserkennung zu überwachen. Sie können sogar Anbietern im Gesundheitswesen helfen, lebensbedrohliche Zustände zu erkennen. Die meisten von uns profitieren von Machine Learning und arbeiten täglich damit. Zu den gängigen Use Cases für Machine Learning gehören etwa:

  • Empfehlungsalgorithmen bei Ihren bevorzugten Streaming-Diensten
  • Automatische Hotlines und Chatbots
  • Gezielte Werbung
  • Automatisierte Angebote von Finanzinstituten

Prädiktive KI im Vergleich zu generativer KI

Generative KI, auf der mittlerweile viele KI-Tools basieren, wird durch Deep Learning ermöglicht, eine Machine Learning-Technik zur Analyse und Interpretation großer Datenmengen. Large Language Models (LLMs), eine Untergruppe der generativen KI, stellen mit ihrer Fähigkeit zum Verstehen und Erzeugen menschlicher Sprache in einem noch nie dagewesenen Umfang eine bedeutende Anwendung des Machine Learnings dar. 

Machine Learning wird für viele Unternehmen immer mehr zu einer selbstverständlichen Funktion, und in den Bereichen Gesundheitswesen, Finanzdienstleistungen, Telekommunikation, für Behörden und in anderen Branchen gibt es transformative Use Cases für KI/ML.

Use Cases für generative KI ansehen
Use Cases für prädiktive KI ansehen

ML-Modelle können Verzerrungen aufweisen: ML-Modelle lernen aus Mustern in historischen Daten, was bedeutet, dass sie Verzerrungen und Diskriminierung erlernen können. Beispielsweise können Daten eine vorhandene rassistische, geschlechtsspezifische oder sozioökonomische Voreingenommenheit in einer Gesellschaft widerspiegeln. Werden die Trainingsdaten nicht von Bias bereinigt, kann das Modell solche Vorurteile aufrechterhalten und sogar verstärken.

Genauso können Entscheidungen von ML-Modellen, etwa bei Kreditgenehmigungen, Einstellungen oder strafrechtlichen Verurteilungen, Randgruppen überproportional betreffen. Fairness-Frameworks sollen gerechte Ergebnisse in den verschiedenen Gruppen sicherstellen.

ML-Modelle zeigen möglicherweise nicht, wie sie funktionieren: Einige Modelle für Machine Learning sind „Black Boxes“, das heißt, ihre internen Prozesse sind nicht nachvollziehbar. Durch diese fehlende Transparenz können Menschen nur schwer nachvollziehen, wie ein Modell Entscheidungen fällt, was wiederum zu fehlendem Vertrauen führen kann.

Zur Lösung dieses Problems können XAI-Techniken (erklärbare KI) eingesetzt und so die KI-Ergebnisse für Menschen nachvollziehbarer gemacht werden. Die Implementierung von XAI erfordert mehr Transparenz im gesamten ML-Lifecycle – vom ersten Entwurf bis zum Monitoring. 

Mehr über erklärbare KI erfahren

Red Hat® AI ist mit seinem vLLM-basierten Server für schnelle, flexible und effiziente Inferenz konzipiert. Die Lösung verknüpft die Modelle zuverlässig mit Ihren Daten, um die Anpassung und Entwicklung spezialisierter Agenten auf einer einzelnen Plattform zu vereinheitlichen. Unsere Produkte basieren auf Open Source und bieten Ihnen die vollständige End-to-End-Kontrolle über KI-Workflows in beliebigem Umfang. 

Das Red Hat AI Portfolio beinhaltet jetzt Red Hat AI Enterprise: eine Plattform zum Bereitstellen, Verwalten und Skalieren von KI-Inferenz, agentischen KI-Workflows und KI-gestützten Anwendungen auf beliebigen Infrastrukturen.

Mehr über Red Hat AI erfahren

Der offizielle Red Hat Blog

Lernen Sie mehr über unser Ökosystem von Kunden, Partnern und Communities und erfahren Sie das Neueste zu Themen wie Automatisierung, Hybrid Cloud, KI und mehr.

Red Hat Testversionen

Unsere kostenlosen Testversionen unterstützen Sie dabei, praktische Erfahrungen zu sammeln, sich auf eine Zertifizierung vorzubereiten oder zu bewerten, ob ein Produkt die richtige Wahl für Ihr Unternehmen ist.

Weiterlesen

What is Mixture of Experts (MoE)?

„Mixture of Experts“ (MoE) ist eine Modellarchitekturtechnik, mit der sich die KI-Inferenz beschleunigen lässt. Dabei werden Aufgaben an den leistungsfähigsten Teil des Modells weitergeleitet.

What is AgentOps?

AgentOps (Agent Operations) ist ein Framework von Tools zum Monitoring des „Gehirns“ einer KI bei der Entscheidungsfindung in Echtzeit.

What are predictive analytics

Verbessern Sie Ihre IT-Performance durch prädiktive Analysen. Von neuronalen Netzwerken bis zum maschinellen Lernen – Daten zeigen Ihnen Trends und Chancen.

Ressourcen zu KI/ML