Anmelden / Registrieren Konto

Thema

Datenservices

Datenservices steigern den Geschäftswert von Daten, damit sie als Bestandteil cloudnativer Anwendungen implementiert werden können – eine wesentliche Komponente von IT-Strategien für Open Hybrid-Clouds.

Was sind Datenservices?

Datenservices (oder Data-as-a-Service) sind Sammlungen kleiner, unabhängiger und lose gekoppelter Funktionen, die in Data Storage Volumes gesammelte und gespeicherte Informationen verbessern, organisieren, teilen oder berechnen. Datenservices optimieren herkömmliche Daten, indem sie ihre Resilienz, Verfügbarkeit und Gültigkeit verbessern und Daten Eigenschaften verleihen, die sie nativ noch nicht besitzen, wie Metadaten.

Wie funktionieren Datenservices?

Datenservices sind eigenständige Einheiten von Softwarefunktionen, die Daten Eigenschaften verleihen, die sie noch nicht besitzen. Datenservices können Daten verfügbarer, resilienter, verständlicher und damit für Nutzer und Programme nützlicher machen.

Mit Datenservicefunktionen werden Eingaben in Ausgaben umgewandelt. Bei den Eingaben handelt es sich um verschiedene Sätze von Rohdaten, die noch nicht für einen bestimmten Zweck verarbeitet wurden. Sie werden in ihrem nativen Format konfiguriert und in physischen, virtuellen oder cloudbasierten Storage Volumes gespeichert. Die Ausgaben sind in der Regel:

  • Organisatorisch: Sie entstehen durch Konsolidierung, Stapelverarbeitung und Strukturierung von Daten, die normalerweise aus strukturierten (Datenbanken), halbstrukturierten (Data Warehouses) oder unstrukturierten Quellen (Data Lakes) stammen.
  • Übertragbar: Sie entstehen durch Verschieben von Daten von ihrem Ursprungsort über ein Netzwerk zu einem Endpunkt wie einer Anwendung oder Plattform.
  • Prozedural: Sie entstehen durch Verarbeitung von Daten, normalerweise als Teil von Datenmodellierungs-, Analyse- oder KI/ML-Software (Künstliche Intelligenz/Maschinelles Lernen).

Wofür werden Datenservices verwendet?

Data at Rest

Dies sind Daten, die in Storage Volumes gespeichert sind. Datenservices extrahieren Rohdaten aus ihren Quellen – wie Kundendatensätze aus OLTP-Datenbanken (Online Transactional Processing), Informationen zu Sachschäden aus Data Warehouses oder Bilder und Videos aus Data Lakes – und wenden Governance-Prinzipien, Organisation und Wartung an, um die Daten für Anwendungen nutzbar und für Nutzer zugänglich zu machen. Datenservices sind ein wichtiger Bestandteil von Big Data-Strategien, da sie aus umfangreichen Sammlungen strukturierter, halbstrukturierter und unstrukturierter Daten, die an verschiedenen Stellen gespeichert sind, sinnvolle Daten machen können.

Data in Motion

Dies sind Daten, die von ihrem ursprünglichen Speicherplatz zu einer Anwendung oder Plattform verschoben werden, normalerweise in Echtzeit. Datenservices können Daten-Pipelines erstellen, um Daten kontinuierlich zwischen mehreren Endpunkten hin und her zu verschieben. So können Datenservices Organisationen dabei unterstützen, von der stapelorientierten Datenverarbeitung zur ereignisgesteuerten Datenverarbeitung überzugehen, indem sie Daten sofort beim Generieren verarbeiten. Datenservices stellen außerdem sicher, dass Daten niemals von ihrem Ursprungsort entfernt werden, sodass mehrere Endpunkte denselben Datenpunkt gleichzeitig verwenden können. Dies ist sehr nützlich beim Aufbau skalierbarer, ereignisgesteuerter Architekturen.

Data in Action

Aktive Daten, die in Datensätze gruppiert und von Data-Science-, Datenanalyse- und Datenmodellierungs-Software verwendet werden. Mithilfe von Datenservices kann der Datenzugriff auf leistungsstarke, intelligente Datenverarbeitungsplattformen wie KI/ML- und Deep Learning-Tools verbessert werden. Je nach Datenservice können Data in Action aus Sammlungen kleiner, unabhängiger und lose gekoppelter Services bestehen, die gewöhnlich in Containern paketiert und von einer Kubernetes-Plattform orchestriert werden.

Ohne Datenservices, die Entwicklern und Datenwissenschaftlern bei der Datenübertragung zwischen Systemen helfen, ist eine cloudnative Anwendungsentwicklung nicht möglich. Wenn mehrere Code-Commits dieselben Daten verwenden, kann sich der Build-Prozess verlängern. Ein Datenservice wie Red Hat® OpenShift® Container Storage kann jedoch die zeitlichen Abhängigkeiten bei gleichzeitigen Builds verringern.

Traditioneller Storage und Datenservices im Vergleich

Traditioneller Storage

Darunter versteht man die Erfassung und Speicherung digitaler Rohdaten – der Bits und Bytes hinter Anwendungen, Netzwerkprotokollen, Dokumenten, Medien, Adressbüchern, Benutzereinstellungen und mehr. Wird ein Dokument gespeichert und ein Speicherort ausgewählt, ist dies ein Vorgang des Data Storage. Ein Nutzer sieht den Data Storage normalerweise auf der Ebene der Infrastruktur, selten sind Storage Volumes verbunden. Beispielsweise gibt es normalerweise keine native Methode zum Anzeigen aller Dateien, Blöcke oder Objekte, die auf einer Workstation, bei einem Cloud-Storage-Anbieter oder auf einer externen Festplatte gespeichert sind. Dies führt dazu, dass die Untersuchung von Data Storage ein sehr manueller und monolithischer Vorgang ist.

Datenservices

Hierbei handelt es sich um Software, die in traditionellen Data Storage Volumes gespeicherte Daten als Eingaben verwendet, um bestimmte Ausgaben zu erstellen – oder um Software, die herkömmliche Daten optimiert, indem ihre Resilienz, Verfügbarkeit und Gültigkeit verbessert wird. Nutzer interagieren normalerweise innerhalb einer Anwendung mit den Datenservices, wodurch der Prozess sehr flexibel und individuell anpassbar wird. Der von Red Hat OpenShift Container Storage bereitgestellte Datenservice abstrahiert beispielsweise die Storage-Infrastruktur, sodass Daten an vielen verschiedenen Orten gespeichert werden können und trotzdem als ein persistentes Repository agieren.

Wer nutzt Datenservices?

Die Massachusetts Open Cloud (MOC) verwendet Datenservices. Die MOC ist eine gemeinnützige Initiative, die Universitäten, Regierungsbehörden und Unternehmen umfasst. Sie wurde gegründet, um eine gemeinsame, cloudbasierte Infrastruktur für Unternehmen, Behörden und gemeinnützige Organisationen zu entwickeln, auf der Big Data analysiert werden konnten. MOC verwendete Red Hat Ceph Storage, einen Software-Defined-Storage-Service, um große Datenmengen zu organisieren und mit mehreren Entitäten zu teilen, auf denen benutzerdefinierte Datenanalyseplattformen ausgeführt werden.

Warum Red Hat?

Weil unsere Datenservices nicht nur mit jedem Data-Storage-Anbieter gut funktionieren, sondern auch die Entwicklung cloudnativer Anwendungen ergänzen. 

Sie können also ein beliebiges Rechenzentrum oder eine beliebige Cloud nutzen und mit der Implementierung Ihrer Daten in sich ständig weiterentwickelnden cloudnativen Apps beginnen. Mit unseren Datenservices können die alten Daten Ihres Unternehmens aufgearbeitet und direkt in Ihre cloudnativen Apps gestreamt werden. Damit erhalten Sie wichtige Informationen, mit denen Sie die großen Herausforderungen von morgen lösen können.

Datenservices für Ihren Einstieg

Red Hat OpenShift Container Storage product logo

Softwaredefinierter Storage für Container-Umgebungen.

Datenservices haben noch viel mehr zu bieten