Jump to section

Comprendre les services de données

Copier l'URL

Les services de données peuvent désigner diverses catégories de logiciels qui facilitent l'accès aux données ainsi que leur gestion et leur analyse. Les services de données sont essentiels au développement d'applications cloud-native et aux stratégies informatiques de cloud hybride ouvert.

Les services de données (parfois appelés Data-as-a-Service) désignent généralement des petites fonctions indépendantes et faiblement couplées qui permettent d'améliorer, d'organiser, de partager ou de calculer des informations recueillies et enregistrées dans des volumes de stockage de données. Les services de données développent les données ordinaires en améliorant leur niveau de résilience, de disponibilité et de validité, ainsi qu'en leur ajoutant des caractéristiques dont elles ne disposent pas de façon native, telles que des métadonnées.Les architectures de services de données peuvent contenir de nombreux services d'applications et de données différents qui fonctionnent ensemble vers un objectif commun, comme c'est le cas pour les architectures de type iDaaS (intelligent Data-as-a-Service).

Les services de données sont des unités autonomes de fonctions logicielles qui ajoutent aux données des caractéristiques dont elles ne disposent pas. Les données peuvent ainsi devenir plus disponibles, résilientes et complètes, et donc plus utiles pour les utilisateurs et les programmes.

Les fonctions des services de données transforment les ressources en résultats. Les ressources sont des ensembles variés de données brutes, qui n'ont pas été traitées dans un but précis, configurées dans leur format natif et enregistrées dans des volumes de stockage physiques, virtuels ou dans le cloud. Généralement, les résultats s'obtiennent à trois niveaux :

  • Structure : consolidation, gestion, création de lots et structuration des données, généralement extraites de sources structurées (bases de données), semi-structurées (entrepôts de données) ou non structurées (data lakes)
  • Transfert : mouvement des données depuis leur emplacement d'origine sur un réseau vers un point de terminaison, tel qu'une application ou une plateforme
  • Traitement : traitement des données, généralement dans le cadre de la modélisation des données, de l'analyse ou de l'intelligence artificielle/apprentissage automatique (IA/AA)

Gestion des données stockées

Les services de données permettent de gérer les données au repos, c'est-à-dire les données sauvegardées dans des volumes de stockage. Les services de données extraient des données brutes de leurs sources, par exemple des dossiers clients issus de bases de données de traitement transactionnel en ligne, des informations sur les dommages matériels issues d'entrepôts de données, ou encore des images et vidéos issues de data lakes. Ils appliquent ensuite des principes de gouvernance, d'organisation et de maintenance qui rendent les données utiles aux applications et accessibles aux utilisateurs. Les services de données représentent une part importante des stratégies de Big Data, car les gros volumes de données structurées, semi-structurées et non structurées peuvent être exploités, quel que soit leur emplacement de stockage.

Déplacement de données

Les services de données peuvent être utilisés pour les données en transit, depuis leur volume de stockage d'origine vers une application ou une plateforme, généralement en temps réel. Les services de données peuvent créer des pipelines pour faciliter le déplacement régulier des données entre plusieurs points de terminaison. Par exemple, ils peuvent aider les entreprises à passer du traitement par lots des données à un traitement basé sur les événements en agissant sur les données dès qu'elles sont générées. Les services de données garantissent aussi que les données ne sont jamais vraiment supprimées de leur emplacement d'origine, ce qui permet à plusieurs points de terminaison d'utiliser un même point de données simultanément. Ces avantages peuvent faciliter la création d'architectures orientées événements et évolutives.

Utilisation des données

Les services de données peuvent faciliter l'utilisation de données actives par des logiciels de science des données, d'analyse des données et de modélisation des données. Les services de données permettent d'améliorer l'accès des données à des plateformes de traitement des données intelligentes et hautes performances, telles que les outils d'IA/AA et d'apprentissage profond. Selon le service, les données en action pourraient impliquer des ensembles de petits services indépendants et faiblement couplés, généralement regroupés dans des conteneurs et gérés par une plateforme Kubernetes.

Stockage traditionnel

Recueil et conservation d'informations numériques brutes, c'est-à-dire les octets et bits des applications, protocoles réseau, documents, fichiers multimédias, carnets d'adresses, préférences utilisateur, etc. Lorsque vous enregistrez un document et que vous sélectionnez un emplacement, vous êtes au cœur du processus de stockage des données. Pour l'utilisateur, la visibilité sur le stockage des données se limite souvent à l'infrastructure et n'informe pas sur les liens entre les volumes de stockage. Par exemple, il n'existe généralement pas de fonction native qui permet de voir chaque fichier, bloc ou objet enregistré sur un poste de travail, sur une plateforme de stockage dans le cloud et sur un disque dur externe, ce qui oblige l'utilisateur à explorer le stockage des données de façon très manuelle et monolithique.

Services de données

Logiciels qui utilisent des données enregistrées dans des volumes de stockage traditionnels comme ressources pour créer des résultats spécifiques, ou logiciels qui développent les données ordinaires en améliorant leur niveau de résilience, de disponibilité et de validité. Les utilisateurs interagissent généralement avec des services de données dans le cadre d'une application, ce qui rend le processus très flexible et personnalisable. Par exemple, le service de données fourni par Red Hat® OpenShift® Data Foundation extrait l'infrastructure de stockage afin que les données puissent être stockées dans différents emplacements, tout en formant un référentiel persistant unique.

Les solutions Red Hat permettent de prendre en charge chaque aspect du développement d'une application cloud-native, y compris les services de données, afin que vous puissiez proposer de nouvelles fonctions à vos clients en continu. 

L'offre Red Hat Cloud Services comprend plusieurs plateformes dont Red Hat OpenShift Data Science, qui fournit un environnement entièrement pris en charge pour développer, entraîner et tester rapidement des modèles d'apprentissage automatique dans le cloud public avant leur déploiement en production.

Découvrez Red Hat OpenShift Service on AWS (ROSA)

Keep reading

ARTICLE

Red Hat, un partenaire de choix en matière de stockage

Découvrez ce qu'est le stockage logiciel et apprenez à déployer une solution de stockage logiciel Red Hat qui vous permettra de gérer, stocker et partager des données selon vos besoins.

ARTICLE

Le stockage dans le cloud, qu'est-ce que c'est ?

Le stockage dans le cloud est l'organisation des données stockées dans un emplacement accessible depuis Internet par toute personne qui dispose d'une autorisation. Apprenez-en davantage sur son fonctionnement.

THÈME

Comprendre les services de données

Les services de données sont des ensembles de petites fonctions indépendantes et faiblement couplées qui permettent d'améliorer, d'organiser, de partager ou de calculer des informations recueillies et enregistrées dans des volumes de stockage de données.