Connexion / Inscription Account

Thème

Comprendre les services de données

Les services de données apportent davantage de valeur aux données leur permettant d'être exploitées dans des applications cloud-native, qui font partie intégrante des stratégies informatiques de cloud hybride ouvert.

Définition des services de données

Les services de données (ou Data-as-a-Service) sont des ensembles de petites fonctions indépendantes et faiblement couplées qui permettent d'améliorer, d'organiser, de partager ou de calculer des informations recueillies et enregistrées dans des volumes de stockage de données. Les services de données développent les données ordinaires en améliorant leur niveau de résilience, de disponibilité et de validité, ainsi qu'en leur ajoutant des caractéristiques dont elles ne disposent pas de façon native, telles que des métadonnées.

Fonctionnement des services de données

Les services de données sont des unités autonomes de fonctions logicielles qui ajoutent aux données des caractéristiques dont elles ne disposent pas. Les données peuvent ainsi devenir plus disponibles, résilientes et complètes, et donc plus utiles pour les utilisateurs et les programmes.

Les fonctions des services de données transforment les ressources en résultats. Les ressources sont des ensembles variés de données brutes, qui n'ont pas été traitées dans un but précis, configurées dans leur format natif et enregistrées dans des volumes de stockage physiques, virtuels ou dans le cloud. Généralement, les résultats s'obtiennent à trois niveaux :

  • Structure : consolidation, création de lots et structuration des données, généralement extraites de sources structurées (bases de données), semi-structurées (entrepôts de données) ou non structurées (data lakes)
  • Transfert : mouvement des données depuis leur emplacement d'origine sur un réseau vers un point de terminaison, tel qu'une application ou une plateforme
  • Traitement : traitement des données, généralement dans le cadre de la modélisation des données, de l'analyse ou de l'intelligence artificielle/apprentissage automatique (IA/AA)

Utilisation des services de données

Données au repos

Données enregistrées dans des volumes de stockage. Les services de données extraient des données brutes de leurs sources, par exemple des dossiers clients issus de bases de données de traitement transactionnel en ligne, des informations sur les dommages matériels issues d'entrepôts de données, ou encore des images et vidéos issues de data lakes. Ils appliquent ensuite des principes de gouvernance, d'organisation et de maintenance qui rendent les données utiles aux applications et accessibles aux utilisateurs. Les services de données représentent une part importante des stratégies de Big Data, car les gros volumes de données structurées, semi-structurées et non structurées peuvent être exploités, quel que soit leur emplacement de stockage.

Données en transit

Données qui se déplacent, depuis leur volume de stockage d'origine vers une application ou une plateforme, généralement en temps réel. Les services de données peuvent créer des pipelines pour faciliter le déplacement régulier des données entre plusieurs points de terminaison. Par exemple, ils peuvent aider les entreprises à passer du traitement par lots des données à un traitement basé sur les événements en agissant sur les données dès qu'elles sont générées. Les services de données garantissent aussi que les données ne sont jamais vraiment supprimées de leur emplacement d'origine, ce qui permet à plusieurs points de terminaison d'utiliser un même point de données simultanément. Ces avantages peuvent faciliter la création d'architectures orientées événements et évolutives.

Données en action

Données actives regroupées dans des ensembles de données qui sont utilisés par des logiciels de science des données, d'analyse des données et de modélisation des données. Les services de données permettent d'améliorer l'accès des données à des plateformes de traitement des données intelligentes et hautes performances, telles que les outils d'IA/AA et d'apprentissage profond. Selon le service, les données en action pourraient impliquer des ensembles de petits services indépendants et faiblement couplés, généralement regroupés dans des conteneurs et gérés par une plateforme Kubernetes.

Sans services de données, qui facilitent la collaboration entre développeurs et spécialistes des données lorsque les données se déplacent entre les systèmes, le développement d'applications cloud-native est impossible. Les contributions de codes multiples qui utilisent les mêmes données peuvent allonger les délais de création des versions. Avec un service de données tel que celui fourni par Red Hat® OpenShift® Container Storage, il est cependant possible de limiter les dépendances de temps pour des versions simultanées.

Stockage traditionnel et services de données

Stockage traditionnel

Recueil et conservation d'informations numériques brutes, c'est-à-dire les octets et bits des applications, protocoles réseau, documents, fichiers multimédias, carnets d'adresses, préférences utilisateur, etc. Lorsque vous enregistrez un document et que vous sélectionnez un emplacement, vous êtes au cœur du processus de stockage des données. Pour l'utilisateur, la visibilité sur le stockage des données se limite souvent à l'infrastructure et n'informe pas sur les liens entre les volumes de stockage. Par exemple, il n'existe généralement pas de fonction native qui permet de voir chaque fichier, bloc ou objet enregistré sur un poste de travail, sur une plateforme de stockage dans le cloud et sur un disque dur externe, ce qui oblige l'utilisateur à explorer le stockage des données de façon très manuelle et monolithique.

Services de données

Logiciels qui utilisent des données enregistrées dans des volumes de stockage traditionnels comme ressources pour créer des résultats spécifiques, ou logiciels qui développent les données ordinaires en améliorant leur niveau de résilience, de disponibilité et de validité. Les utilisateurs interagissent généralement avec des services de données dans le cadre d'une application, ce qui rend le processus très flexible et personnalisable. Par exemple, le service de données fourni par Red Hat OpenShift Container Storage extrait l'infrastructure de stockage afin que les données puissent être stockées dans différents emplacements, tout en formant un référentiel persistant unique.

Utilisateurs des services de données

Le Massachusetts Open Cloud (MOC) utilise des services de données. Le MOC est un projet à but non lucratif réunissant des universités, des agences gouvernementales et des entreprises privées. Il a été fondé dans le but de développer une infrastructure cloud commune qui permettrait aux entreprises privées, agences gouvernementales et associations à but non lucratif d'analyser les Big Data. Le MOC a utilisé Red Hat Ceph Storage, un service de stockage logiciel, pour organiser et partager de grands volumes de données avec plusieurs entités qui utilisent des plateformes d'analyse des données personnalisées.

Red Hat, un partenaire de choix en matière de stockage

Nos services de données ne sont pas seulement conçus pour fonctionner avec tous les systèmes de stockage de données, ils viennent compléter la liste des outils de développement d'applications cloud-native

Vous pouvez ainsi utiliser le datacenter ou cloud que vous souhaitez et commencer à mettre en œuvre toutes ces données dans vos applications cloud-native en constante évolution. Avec nos services de données, les anciennes données de votre entreprise peuvent être améliorées et diffusées directement dans vos applications cloud-native pour révéler des informations importantes susceptibles de résoudre les plus grands problèmes que vous réserve l'avenir.

Ce dont vous avez besoin pour gérer des services de données

Red Hat OpenShift Container Storage product logo

Solution de stockage logiciel pour les environnements de conteneurs.

Vous ne savez pas encore tout sur les services de données...