Une plateforme d'IA, qu'est-ce que c'est ?

Publié 19 mars 2025•7 minutes (temps de lecture)

Une plateforme d'intelligence artificielle (IA) est un ensemble intégré de technologies qui permettent de développer, d'entraîner et d'exécuter des modèles ML (machine learning ou apprentissage automatique). Ce type de plateforme inclut généralement des fonctionnalités d'automatisation, d'analyse prédictive des données, MLOps (Machine Learning Operations) ainsi que d'autres fonctions. On pourrait la comparer à un établi qui donne accès à tous les outils nécessaires et qui offre une base stable pour créer et perfectionner des modèles.

Il existe de plus en plus de plateformes d'IA disponibles sur le marché. Voici les éléments à prendre en compte pour choisir la solution adaptée.

Cinq façons d'adopter des pratiques MLOps

Se lancer avec l'IA en entreprise: guide pour les débutants

Pour toutes les entreprises, le choix de la première plateforme d'IA implique de déterminer si celle-ci doit être préconfigurée ou s'il est plus judicieux de concevoir une plateforme personnalisée en interne.

Acheter une plateforme d'IA

Pour déployer rapidement des applications, modèles et algorithmes d'IA, la meilleure option consiste à acheter une plateforme d'IA complète et préconfigurée. Ces plateformes incluent des outils, des référentiels linguistiques et des API testées en amont à des fins de sécurité et de performances. Certains fournisseurs proposent des modèles de fondation et d'IA générative préentraînés, qui s'intègrent facilement aux environnements et workflows existants grâce à des ressources spécifiques.

Les principaux fournisseurs de cloud proposent aussi désormais des plateformes d'IA, notamment Amazon Web Services (AWS) Sagemaker, Google Cloud AI Platform, Microsoft Azure AI Platform et IBM watsonx.ai™ AI studio. Souvent, les fournisseurs de plateformes d'IA proposent également des outils d'IA autonomes qui peuvent s'utiliser en association avec d'autres solutions d'IA.

Concevoir une plateforme d'IA

Pour s'adapter à des cas d'utilisation spécifiques ou répondre à des besoins avancés en matière de confidentialité, certaines entreprises doivent personnaliser et gérer intégralement leur propre plateforme d'IA. Par exemple, Uber a développé sa plateforme d'IA qui utilise des technologies telles que le traitement du langage naturel (TLN) et la vision par ordinateur pour améliorer ses fonctionnalités GPS et de détection des accidents. Syapse, une entreprise du secteur de la santé axée sur les données, a créé Syapse Raydar®, une plateforme de données basée sur l'IA qui convertit les données d'oncologie en informations exploitables.

La conception d'une plateforme d'IA en interne permet de bien contrôler tout l'environnement et de répondre aux besoins spécifiques de l'entreprise. Cette approche nécessite toutefois davantage de préparation en amont pour obtenir une plateforme opérationnelle. En outre, la maintenance, l'assistance et la gestion ne peuvent pas être externalisées.

Faire le choix de l'Open Source

Les communautés Open Source sont au cœur des avancées en matière d'intelligence artificielle et d'apprentissage automatique. Lorsqu'elles choisissent une solution logicielle Open Source comme base pour leurs projets d'IA, les entreprises peuvent s'appuyer sur une communauté de pairs et de professionnels qui améliorent en permanence les frameworks et outils les plus utilisés. Bon nombre d'entre elles commencent par adopter des outils Open Source, puis s'en servent comme base pour développer des projets. Tensorflow et PyTorch sont des plateformes Open Source qui fournissent des bibliothèques et des frameworks pour développer des applications d'IA.

Qu'est-ce que l'IA d'entreprise ?

MLOps

Acronyme de Machine Learning Operations, le MLOps désigne un ensemble de pratiques de gestion des workflows qui vise à rationaliser le déploiement et la maintenance des modèles d'AA. Toute plateforme d'IA devrait faciliter l'exécution des étapes du MLOps telles que l'entraînement, la distribution et la surveillance des modèles.Le

LLMOps (Large Language Model Operations) est un sous-ensemble du MLOps qui regroupe les pratiques, techniques et outils utilisés pour gérer l'exploitation de grands modèles de langage dans les environnements de production. Ces modèles peuvent réaliser des tâches telles que la génération de texte, le résumé de contenu et la catégorisation d'informations. Ils exploitent une grande quantité de ressources de calcul des GPU, ce qui implique que la plateforme d'IA doit être suffisamment puissante pour s'adapter aux entrées et sorties des modèles.

IA générative

L'IA générative s'appuie sur des réseaux neuronaux et des modèles d'apprentissage profond entraînés avec de grands ensembles de données pour créer des contenus. S'il est suffisamment entraîné, le modèle est capable d'appliquer l'apprentissage tiré de l'entraînement à des situations réelles. Ce phénomène est appelé l'inférence IA.

Cette technologie englobe de nombreuses fonctionnalités que les utilisateurs finaux associent à l'intelligence artificielle, notamment la génération de texte et d'image, l'augmentation de données ainsi que les systèmes d'IA conversationnelle tels que les chatbots. Il est important que la plateforme d'IA offre des capacités d'IA générative avec un bon niveau de performances et de précision.

Comparer l'IA générative et l'IA prédictive

Évolutivité

Les performances des modèles dépendent uniquement de leur capacité d'évolutivité. Les équipes de science des données ont besoin d'une solution centralisée à partir de laquelle elles peuvent concevoir et déployer des modèles d'IA, réaliser des essais et des réglages et collaborer avec d'autres équipes. Ces opérations impliquent d'exploiter de grandes quantités de données ainsi qu'une puissance de calcul élevée, et surtout de disposer d'une plateforme capable de tout gérer.

Une fois que les modèles sont performants, il faut pouvoir les utiliser dans différents environnements : sur site, sur des plateformes de cloud public ou en périphérie du réseau. Avec une solution évolutive, ces modèles pourront facilement être déployés dans tous les environnements.

Automatisation

L'automatisation devient essentielle lorsque l'entreprise passe de quelques modèles à déployer en production à une dizaine ou plus. L'automatisation des pipelines de science des données transforme les processus les plus efficaces en tâches reproductibles. Cette approche permet non seulement d'accélérer les workflows, mais aussi de rendre l'expérience des utilisateurs plus agréable et prévisible ainsi que d'améliorer l'évolutivité. L'automatisation élimine également les tâches répétitives et permet aux équipes de science des données et d'ingénierie de consacrer davantage de temps au développement, à l'itération et au perfectionnement des modèles.

Outils et intégrations

Les équipes de développement et de science des données s'appuient sur des outils et des intégrations pour créer et déployer efficacement des applications et des modèles. Les entreprises doivent choisir une plateforme d'IA qui prend en charge les outils, langages et référentiels déjà utilisés par leurs équipes, et compatible avec l'ensemble de leur pile technologique et de leurs solutions partenaires.

Sécurité et contrôle

Des pratiques de sécurité renforcées doivent être mises en œuvre pour limiter les risques et protéger les données avec une plateforme d'IA. Dans le cadre des opérations quotidiennes d'entraînement et de développement, il est essentiel de rechercher des CVE (Common Vulnerabilities and Exposures) et de protéger les applications et les données au moyen de la gestion des accès, de la segmentation réseau et du chiffrement.

Responsabilité et gouvernance

Les plateformes d'IA doivent également permettre d'utiliser et de surveiller les données de manière à respecter les normes éthiques et à garantir la conformité. Pour protéger à la fois les données de l'entreprise et celles des utilisateurs, il est important de choisir une plateforme qui soutienne les stratégies de visibilité, de suivi et de gestion des risques tout au long du cycle de vie de l'AA. Cette plateforme doit également respecter les normes actuelles de l'entreprise en matière de conformité et de sécurité des données.

Assistance

Avec une plateforme d'IA préconfigurée et complète, les entreprises peuvent profiter d'une assistance. Les performances des modèles seront renforcées grâce à un processus continu de suivi et de correction des erreurs qui peut être adapté à chaque déploiement. Certains fournisseurs de plateformes d'IA proposent des ressources d'intégration et de formation pour permettre aux équipes de se lancer rapidement. Les entreprises qui souhaitent concevoir leur propre plateforme avec des outils Open Source peuvent s'adresser à des fournisseurs qui proposent une assistance pour les fonctions d'apprentissage automatique et l'infrastructure.

Éléments importants pour la création d'un environnement d'IA/AA prêt pour la production

Télécommunications

Avec des services d'IA complets, il est possible de rationaliser le secteur des télécommunications, par exemple pour optimiser les performances du réseau et améliorer la qualité des produits et services. Il en résulte une meilleure qualité de service, des améliorations audio et visuelles, ainsi qu'une moindre perte de clientèle.

Red Hat Consulting : AI Platform Foundation

Santé

Une plateforme d'IA robuste peut apporter des avantages déterminants dans les environnements de santé, parmi lesquels des diagnostics plus rapides, des avancées dans la recherche clinique et un accès étendu aux services pour les patients. Tous ces avantages peuvent améliorer l'état des patients en permettant aux médecins et aux autres professionnels de santé de réaliser des diagnostics et des plans de traitement plus précis.

En savoir plus sur l'IA dans le secteur de la santé

Fabrication

L'automatisation intelligente basée sur l'apprentissage automatique transforme la fabrication tout au long de la chaîne d'approvisionnement. La robotisation industrielle et l'analyse prédictive réduisent les tâches répétitives et permettent de mettre en œuvre des workflows plus efficaces en temps réel.

Découvrir comment Guise AI a automatisé le contrôle qualité en périphérie du réseau

Lorsqu'il s'agit de plateformes d'IA, nous accordons la priorité à la création de solutions d'IA flexibles et fiables à grande échelle.

Notre gamme de produits Red Hat® AI repose sur des solutions que nos clients utilisent déjà en toute confiance.

Elle offre les avantages suivants :

Rapidité d'adoption de l'IA et d'innovation
Simplification de la distribution de solutions d'IA
Possibilité de déploiement dans tous les environnements

Découvrir Red Hat AI

Mise à l'échelle flexible

Lorsque vient l'étape de la mise à l'échelle, notre plateforme Red Hat AI offre aux équipes de développement les outils pour créer, déployer et gérer des applications basées sur l'IA.

Grâce à une collaboration continue et prise en charge, les entreprises peuvent personnaliser les applications de modèles d'IA de manière simple et rapide en fonction de leurs cas d'utilisation.

Mettre en œuvre l'IA avec Red Hat AI

Créer une application RAG

Red Hat OpenShift AI est une plateforme qui sert à réaliser des projets de science des données et à servir des applications basées sur l'IA. Il est possible d'intégrer tous les outils nécessaires pour prendre en charge la génération augmentée de récupération (RAG), un moyen d'obtenir des réponses d'une IA basées sur des documents de référence spécifiques. L'association d'OpenShift AI et de NVIDIA AI Enterprise permet d'utiliser des LLM afin de trouver le modèle optimal pour chaque application.

Concevoir un pipeline pour les documents

Pour tirer parti de la RAG, il est nécessaire, dans un premier temps, d'ajouter des documents dans une base de données vectorielle. Dans notre exemple d'application, nous intégrons un ensemble de documents relatifs à des produits dans une base de données Redis. Puisque ces documents changent fréquemment, nous avons créé un pipeline pour ce processus que nous exécuterons régulièrement, afin de nous assurer que l'IA dispose toujours des dernières versions des documents.

Parcourir le catalogue de LLM

NVIDIA AI Enterprise donne accès à un catalogue varié de LLM. Il est donc possible de tester plusieurs modèles et de sélectionner celui qui offre les meilleurs résultats. Les modèles sont hébergés dans le catalogue d'API de NVIDIA. Une fois le jeton textuel API configuré, un modèle peut être déployé directement à partir d'OpenShift AI, en utilisant la plateforme de service de modèles NVIDIA NIM.

Choisir le modèle le plus adapté

Lors du test de différents LLM, les utilisateurs peuvent noter chaque réponse générée. Il est possible de configurer un tableau de bord de surveillance Grafana pour comparer les notes ainsi que la latence et le temps de réponse pour chaque modèle. Ensuite, ces données peuvent être utilisées pour choisir le meilleur LLM à utiliser en production.

An architecture diagram shows an application built using Red Hat OpenShift AI and NVIDIA AI Enterprise. Components include OpenShift GitOps for connecting to GitHub and handling DevOps interactions, Grafana for monitoring, OpenShift AI for data science, Redis as a vector database, and Quay as an image registry. These components all flow to the app frontend and backend. These components are built on Red Hat OpenShift AI, with an integration with ai.nvidia.com.

Télécharger le PDF

En savoir plus

Les petits modèles de langage, qu'est-ce que c'est ?

Version réduite d'un grand modèle de langage (LLM), le petit modèle de langage (SLM) repose sur des connaissances plus spécialisées et offre aux équipes une personnalisation plus rapide ainsi qu'une efficacité d'exécution accrue.

Les modèles Granite, qu'est-ce que c'est ?

Les modèles Granite d'IBM correspondent à de grands modèles de langage créés pour les applications d'entreprise. Ils peuvent prendre en charge les cas d'utilisation de l'intelligence artificielle générative qui reposent sur un langage spécifique et du code.

L'inférence distribuée, qu'est-ce que c'est ?

L'inférence distribuée est une approche qui permet aux modèles d'IA de traiter les charges de travail plus efficacement en répartissant les tâches liées à l'inférence entre plusieurs équipements interconnectés.

Une plateforme d'IA, qu'est-ce que c'est ?

Acheter une plateforme d'IA

Concevoir une plateforme d'IA

Faire le choix de l'Open Source

Ressources Red Hat

MLOps

IA générative

Évolutivité

Automatisation

Outils et intégrations

Sécurité et contrôle

Responsabilité et gouvernance

Assistance

Télécommunications

Santé

Fabrication

Mise à l'échelle flexible

Créer une application RAG

Concevoir un pipeline pour les documents

Parcourir le catalogue de LLM

Choisir le modèle le plus adapté

Se lancer avec l'IA en entreprise : guide pour les débutants

Tous les essais de produits Red Hat

En savoir plus

Les petits modèles de langage, qu'est-ce que c'est ?

Les modèles Granite, qu'est-ce que c'est ?

L'inférence distribuée, qu'est-ce que c'est ?

IA/ML : ressources recommandées

Plateformes

Outils

Essayer, acheter et vendre

Communication

About Red Hat

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links