Überblick
Dateien, Blöcke und Objekte sind Storage-Formate, mit denen Daten auf verschiedene Weise gespeichert, organisiert bzw. präsentiert werden und von denen jedes seine eigenen Vor- und Nachteile hat. Mit File Storage werden Daten in einer Ordnerhierarchie organisiert und dargestellt. Beim Block Storage werden Datensätze in willkürlich zusammengestellte gleich große Volumes eingeteilt. Beim Object Storage wiederum werden Daten verwaltet und mit den dazugehörigen Metadaten verknüpft.
Container sind sehr flexibel und ermöglichen eine enorme Skalierung bei der Bereitstellung von Anwendungen und Storage.
Was ist File Storage?
File Storage, auch Dateiebenen- oder dateibasierter Storage genannt, ist genau das, was Sie sich darunter vorstellen: Daten werden genau wie bei der Organisation von Papierseiten in einem Aktenordner als individuelle Informationen in einem Verzeichnis abgelegt. Um auf diese Informationen zugreifen zu können, muss der Computer den dazugehörigen Pfad kennen. Und der kann extrem lang und komplex sein. In Dateien gespeicherte Daten werden mit einer begrenzten Menge an Metadaten organisiert und abgerufen, die dem Rechner alle Informationen zum genauen Standort der Datei bereitstellen. Man kann sich das wie den Kartenkatalog einer Bibliothek vorstellen, eben nur für Datendateien.
Oder auch wie ein Schrank voller Dateiarchive. Alle Dokumente sind nach einer bestimmten Hierarchie angeordnet, also entweder nach Aktenschrank, Schublade, Ordner oder einzelnen Seiten. Deshalb nennt man File Storage zuweilen auch hierarchischer Storage. Es handelt sich hier um das älteste und am weitesten verbreitetste Datenspeichersystem für Direct und Network-Attached Storage und dazu eines, dass Sie womöglich schon seit Jahrzehnten verwenden. Jedes Mal, wenn Sie auf in einem PC gespeicherte Dateien zugreifen, nutzen Sie de facto File Storage. Dieses Speichersystem bietet umfassende Funktionen sowie quasi unbegrenzte Speichermöglichkeiten. So können Sie damit ganze Arrays an komplexen Dateien archivieren und profitieren dabei noch von einer schnellen Navigation.
Das Problem dabei ist nur, dass sich diese virtuelle Schublade (wie auch in einem echten Aktenschrank) nur bis zu einem gewissen Punkt öffnen lässt. Dateibasierte Storage-Systeme können lediglich horizontal (durch Hinzufügen weiterer Systeme) und nicht vertikal (durch Hinzufügen von mehr Kapazität) skaliert werden.
Red Hat Ressourcen
Was ist Block Storage?
Beim Block Storage werden Daten, wie der Name schon sagt, in Blöcke aufgeteilt und separat gespeichert. Jeder dieser Blöcke erhält eine eindeutige Kennzeichnung, was es dem Storage-System ermöglicht, kleinere Datenmengen dort abzulegen, wo es am praktischsten ist. Will heißen, manche Daten lassen sich in einer Linux®-Umgebung, andere wiederum in einem Windows-System speichern.
Bei der Konfiguration von Block Storage werden Daten oft von der Umgebung des Nutzenden entkoppelt und auf mehrere Umgebungen verteilt, um eine bessere Bereitstellung zu ermöglichen. Wenn Daten dann angefordert werden, setzt die zugrunde liegende Storage-Software die Datenblöcke aus diesen Umgebungen entsprechend zusammen, um sie dann dem Nutzenden zu präsentieren. Block Storage wird üblicherweise in SAN-Umgebungen (Storage Area Network) eingesetzt und muss mit einem funktionsfähigen Server verknüpft werden.
Und da dieser Storage-Typ im Gegensatz zum File Storage mehrere Datenpfade verwendet, können Informationen schneller abgerufen werden. Alle Blöcke sind voneinander unabhängig und können für den Zugriff durch verschiedene Betriebssysteme partitioniert werden, was Nutzenden wiederum eine große Freiheit bei der Konfiguration der Dateien gewährt. Block Storage ist eine effiziente und zuverlässige Methode zur Datenspeicherung und lässt sich dazu auf einfachste Weise verwenden und verwalten. Er eignet sich besonders gut für Unternehmen mit großen Transaktionen oder riesigen Datenbanken. Das heißt, je mehr Daten gespeichert werden müssen, desto mehr spricht für den Einsatz von Block Storage.
Allerdings hat auch diese Methode ihre Nachteile. Zunächst einmal ist Block Storage nicht gerade kostengünstig. Dazu bietet er nur eine begrenzte Kapazität zur Handhabung von Metadaten, d. h. er muss auf Anwendungs- oder Datenbankebene implementiert werden, was wiederum mehr Aufwand für Entwickler oder Systemadministratoren bedeutet.
Was ist Object Storage?
Object Storage oder objektbasierter Storage integriert eine flache Struktur, bei der Dateien in einzelne Komponenten aufgeschlüsselt und über die Hardware verteilt werden. Diese diskreten Einheiten oder Objekte werden nicht als Dateien in Ordnern oder als Blöcke auf Servern, sondern in einem einzelnen Repository gespeichert.
Object Storage Volumes fungieren als modulare Einheiten. Jedes Volume ist ein eigenständiges Repository, das eine eindeutige Kennzeichnung zwecks Auffinden des Objekts in einem verteilten System sowie die Metadaten zur Beschreibung der Daten integriert. Diese Metadaten sind äußerst wichtig und enthalten Daten wie Alter, Datenschutz/Sicherheiten sowie Zugriffspläne. Solche Metadaten können extrem ausführlich sein und Informationen dazu enthalten, wo ein Video aufgenommen bzw. welche Kamera verwendet wurde und welche Schauspieler in jedem Frame zu sehen sind. Zum Abrufen der Daten verwendet das Storage-Betriebssystem Metadaten und Kennzeichnungen, mit denen sich die Last besser verteilen lässt und die Anwendung von Richtlinien zur Durchführung robusterer Suchvorgänge ermöglicht wird.
Object Storage erfordert lediglich eine einfache HTTP-API (Application Programming Interface), die von den meisten Clients in allen Sprachen verwendet wird. Dazu ist dieser Storage-Typ äußerst kosteneffizient, d. h. Sie bezahlen lediglich den Speicher, den Sie auch nutzen. Object Storage lässt sich einfach skalieren und eignet sich so bestens für Public Clouds. Darüber hinaus wird er für statische Daten empfohlen, denn seine Agilität und flache Struktur ermöglichen die Skalierung auf riesige Datenmengen. Die verwendeten Objekte enthalten genügend Informationen für ein schnelles Auffinden von Daten durch Anwendungen und eignen sich besonders gut für unstrukturierte Daten.
Aber auch dieser Storage-Typ birgt Nachteile. So können Objekte nicht modifiziert, sondern müssen komplett und auf einmal geschrieben werden. Dazu verträgt sich Object Storage nicht sonderlich gut mit herkömmlichen Datenbanken, denn das Schreiben von Objekten ist ein extrem langsamer Prozess, und auch die Erstellung einer App zur Verwendung einer Object-Storage-API ist wesentlich komplexer als die Verwendung von File Storage.
Der offizielle Red Hat Blog
Lernen Sie mehr über unser Ökosystem von Kunden, Partnern und Communities und erfahren Sie das Neueste zu Themen wie Automatisierung, Hybrid Cloud, KI und mehr.