Guide sur l'approche MaaS

26 mai 2026

•

Type de ressource : Présentation de technologie

L'adoption croissante de l'IA apporte son lot de défis en matière d'infrastructure et d'accès

L'intérêt pour l'IA ne cesse de croître. Les entreprises cherchent à exploiter les grands modèles de langage (LLM), l'analyse prédictive, la vision par ordinateur ainsi que d'autres outils avancés pour en extraire de la valeur métier. Cependant, le passage de projets pilotes isolés à une adoption généralisée à l'échelle de l'entreprise pose d'importants défis au niveau de l'infrastructure et de l'exploitation.

Beaucoup d'entreprises commencent leur parcours d'adoption de l'IA en se connectant à des API de LLM commerciales, comme celles d'OpenAI ou d'Anthropic, estimant qu'il s'agit de la voie la plus rapide vers la production. Toutefois, à mesure que l'utilisation se développe, les coûts augmentent et les équipes se heurtent aux limites de ces outils en matière de confidentialité des données, d'observabilité et de personnalisation. Il arrive également que les fournisseurs d'IA commerciales apportent des modifications à leurs modèles, parfois sans préavis, ce qui peut perturber l'activité des entreprises.

C'est pourquoi certaines entreprises adoptent aujourd'hui une approche diamétralement opposée en créant leur propre infrastructure de modèle à partir de zéro. Cette approche artisanale conduit souvent les équipes à déployer de manière indépendante des modèles Open Source tels que Llama ou Mistral, sans réellement se concerter. Il en résulte un environnement fragmenté, dans lequel chaque service met en place ses propres piles technologiques, ce qui entraîne une redondance de l'infrastructure, la sous-utilisation des processeurs graphiques (GPU) et des frais d'exploitation importants. La sécurité et la gouvernance en pâtissent, tandis que les coûts s'envolent sans générer de réelle valeur métier.

Ces difficultés ont encore été accentuées par la taille croissante des LLM récents comme Llama, DeepSeek, Mistral ou Qwen. Contrairement aux modèles d'IA relativement petits d'il y a seulement quelques années, les grands modèles actuels sollicitent jusqu'à plusieurs téraoctets de vRAM. Or, les GPU coûtent cher. Une utilisation inefficace de ces ressources peut rapidement entraîner une explosion des coûts. La situation s'aggrave lorsque plusieurs équipes d'une même entreprise tentent de déployer ces modèles de manière indépendante. Cette approche fragmentée augmente la surcharge opérationnelle et alourdit les dépenses.

Les entreprises ont besoin d'une approche interne qui rationalise et centralise l'utilisation des modèles, optimise l'allocation des ressources matérielles, et permet un accès contrôlé et évolutif pour différents types d'utilisateurs internes. Sans une telle stratégie, les initiatives en matière d'IA restent coûteuses et peinent à se répandre. Les investissements en matière d'infrastructure sont sous-utilisés et il est difficile d'obtenir des résultats mesurables (comme l'augmentation de la productivité, la réduction des coûts d'exploitation ou l'accélération de la collecte d'informations exploitables).

Définition du MaaS

Le Models-as-a-Service (MaaS) est une approche qui consiste à fournir les modèles d'IA sous la forme de ressources mutualisées. Elle permet aux utilisateurs d'une même entreprise d'y accéder à la demande. Elle fournit une base d'IA prête à l'emploi, sous la forme de points de terminaison d'interface d'API, qui encourage l'utilisation de solutions d'IA privées et efficaces à grande échelle.

L'approche MaaS aide à relever les défis

Le MaaS permet aux entreprises de déployer des modèles d'IA une seule fois, puis de les distribuer en tant que ressources partagées et axées sur la sécurité à grande échelle. Au lieu de gérer des déploiements isolés pour chaque équipe, elles peuvent centraliser l'infrastructure et l'exploitation de l'IA, ce qui simplifie son adoption en interne.

Figure 1 : workflow d'une configuration MaaS

Offrez un accès partagé à l'IA en centralisant l'exploitation des modèles

Pour les équipes d'ingénierie de l'IA, le MaaS fournit un accès plus rapide aux modèles hautement performants via les API, ce qui évite d'avoir à télécharger des modèles, à gérer les dépendances ou à solliciter l'allocation de GPU par le biais de tickets chronophages.

Dans le cadre du MaaS, l'équipe d'exploitation de l'IA devient responsable des ressources d'IA partagées. Les modèles sont déployés sur une plateforme évolutive (comme Red Hat® OpenShift® AI ou d'autres solutions similaires), puis exposés via une passerelle d'API. Cette configuration permet à plusieurs utilisateurs, équipes de développement et services métier de fournir un accès simplifié aux utilisateurs finaux, tout en répondant aux priorités de sécurité et de gouvernance définies par les équipes informatiques et financières. Ces priorités peuvent inclure la mise en œuvre de fonctionnalités de refacturation interne afin d'adopter un modèle de consommation qui ne nécessite pas d'accès direct au matériel ni d'expertise technique approfondie. L'objectif est de fournir un accès intuitif aux modèles d'IA et non aux ressources nécessaires à leur exécution (comme les GPU et les unités de traitement de tenseur), tout en respectant les exigences de performances et de conformité des entreprises et sans compliquer l'accès pour les utilisateurs finaux.

En pratique, les utilisateurs interagissent uniquement avec des API qui produisent des réponses générées par les modèles. À l'instar des fournisseurs d'IA publics qui épargnent aux utilisateurs finaux les difficultés liées au matériel, les déploiements MaaS internes visent à simplifier la vie des équipes. Elles n'ont plus à gérer directement l'infrastructure matérielle et logicielle, à attendre la résolution de tickets, ni à patienter pendant la configuration des environnements. Les équipes d'IA et d'exploitation informatique sont responsables de la gestion du cycle de vie des modèles, de la sécurité, des mises à jour et de la mise à l'échelle de l'infrastructure, offrant ainsi aux utilisateurs finaux un accès simplifié, mais contrôlé.

Cette centralisation permet non seulement de rationaliser l'exploitation de l'IA en interne, mais aussi de renforcer la sécurité et la gouvernance. L'accès aux modèles d'IA est strictement contrôlé par le biais d'un système de gestion des informations d'identification via une passerelle d'API. Les entreprises peuvent facilement suivre l'utilisation des ressources, mettre en place des mécanismes de refacturation interne, s'assurer que les exigences de confidentialité sont respectées et établir des limites d'exploitation claires, ce qui rend l'IA plus pratique et plus simple à gérer. Pour ce faire, le suivi de l'utilisation au niveau des jetons textuels (entrants et sortants) est la méthode idéale, plus granulaire et précise que tout autre indicateur de mesure au niveau des GPU.

Contrôlez l'utilisation, limitez les accès et gérez les coûts

La supervision centralisée permet aux équipes informatiques et d'ingénierie de plateforme d'éviter les déploiements de modèles non autorisés, d'appliquer les normes de sécurité et de conformité, et, de manière générale, simplifie la gestion du cycle de vie et de l'infrastructure.
Pour les équipes financières, le suivi centralisé de l'utilisation et les mécanismes de refacturation interne contribuent à réduire le gaspillage. En exploitant les GPU de façon plus prévisible et plus responsable, les entreprises évitent les dépenses excessives liées à la sous-utilisation des ressources matérielles spécialisées.

Dans une architecture MaaS, le contrôle passe principalement par l'intégration d'une passerelle d'API à l'infrastructure d'IA. Cette approche permet aux équipes de gérer et surveiller l'utilisation de l'IA à un niveau très précis.

Les déploiements d'IA traditionnels sont souvent mal gérés ou inefficaces, car les modèles sont déployés de manière indépendante et sans supervision centralisée. Cette approche fragmentée entraîne l'inactivité ou de la sous-utilisation des ressources GPU, ce qui génère des inefficacités coûteuses. Les passerelles d'API placées au cœur de l'infrastructure d'IA créent un point d'accès contrôlé entre les utilisateurs et les modèles.

Cette configuration facilite le suivi précis de l'utilisation, jusqu'au niveau du jeton textuel. Les équipes peuvent clairement identifier la quantité consommée par chaque utilisateur, équipe ou application, et attribuer avec exactitude les coûts correspondants. Il est ainsi possible de déterminer si un utilisateur ou une application spécifique utilise trop de ressources et de prendre des mesures correctives, par exemple en limitant l'utilisation ou en recourant à des mécanismes de refacturation interne.

Les fonctions de limitation de requêtes fournies par la passerelle d'API assurent la cohérence des performances et évitent l'épuisement des ressources. Elles aident à réguler les accès, afin d'empêcher un seul utilisateur de monopoliser les ressources GPU ou de dégrader l'expérience des autres.

De plus, les passerelles d'API garantissent une gestion des identifiants et un contrôle des accès précis. Les utilisateurs internes ont la possibilité de générer des informations d'identification pour accéder aux modèles d'IA de manière indépendante, ce qui limite la charge de travail administrative. Ces informations d'identification peuvent également être annulées ou modifiées plus rapidement afin de s'adapter à l'évolution des exigences en matière de sécurité ou aux schémas d'utilisation.

De cette manière, la gestion des coûts devient plus transparente et plus responsable. Il est possible d'attribuer avec précision les dépenses liées aux GPU et à l'infrastructure aux équipes ou services concernés.

Prenez en charge tous les modèles, tous les accélérateurs et tous les clouds

Le contrôle est au cœur de l'approche MaaS. Elle permet aux entreprises de sélectionner et déployer de nombreux modèles d'IA, de choisir leurs accélérateurs matériels et de poursuivre l'exploitation dans leurs environnements cloud ou sur site existants. Elles ont ainsi toute la liberté de mettre en œuvre une IA qui répond à leurs besoins techniques, exigences de sécurité et préférences opérationnelles.

Les entreprises qui souhaitent adopter l'IA se heurtent à diverses limitations, dont les plus communes sont les suivantes :
- Limitations inhérentes aux services cloud spécifiques
- Dépendance vis-à-vis d'écosystèmes de modèles propriétaires
- Contraintes liées à l'utilisation d'infrastructures matérielles fixes
Le MaaS contribue à lever ces obstacles de plusieurs façons :
- Il prend en charge des modèles Open Source ou propriétaires, des modèles entraînés sur mesure et les LLM prisés comme Llama et Mistral.
- Outre la prise en charge des modèles textuels, cette approche permet l'analyse prédictive, la vision par ordinateur, la transcription audio et d'autres cas d'utilisation de l'IA générative multimodale comme la génération d'images ou de vidéos.
Le MaaS reste indépendant des accélérateurs matériels :
- Aux entreprises de sélectionner les GPU ou autres accélérateurs adaptés à leurs charges de travail, leurs structures de coûts et leurs besoins en matière de performances
- Aux équipes responsables de l'IA de prendre les décisions critiques concernant le dimensionnement et le déploiement, ce qui améliore l'efficacité et réduit les erreurs des utilisateurs inexpérimentés
La gestion centralisée assure :
- Une allocation et une utilisation optimales des ressources de l'infrastructure
- Une réduction des coûts d'exploitation et la prévention des erreurs de configuration des ressources
Le MaaS peut être déployé dans tous les types d'environnement, notamment :
- Sur site, dans le cloud hybride, dans les environnements air gap et dans les clouds publics. Cette flexibilité s'avère particulièrement utile pour assurer la souveraineté des données, la conformité réglementaire et des contrôles de sécurité stricts dans les secteurs très réglementés.

Mise en œuvre du MaaS par Red Hat

Chez Red Hat, nous avons adopté l'approche MaaS en centralisant le déploiement des modèles d'IA et leur accès. Notre équipe d'IA interne gère les ressources d'IA et l'exploitation des modèles en s'appuyant sur la solution Red Hat OpenShift ainsi que sur Red Hat OpenShift AI comme plateforme sous-jacente. Ce déploiement centralisé de modèles simplifie le recours à l'IA pour les utilisateurs de toute l'entreprise. Nos équipes de développement et métier peuvent ainsi intégrer efficacement les capacités d'IA à leurs workflows sans avoir besoin de matériel spécialisé ni de compétences techniques approfondies.

Notre mise en œuvre repose sur une architecture de distribution évolutive qui utilise des GPU dans OpenShift AI et connecte les utilisateurs via une passerelle d'API centralisée. Les accès aux modèles d'IA sont ainsi traçables, contrôlés et sécurisés. L'utilisation est soigneusement surveillée au niveau des jetons textuels. De cette manière, il est plus facile de savoir qui utilise les ressources, à quelle fréquence et en quelle quantité. Ce suivi permet d'optimiser l'utilisation du matériel et la consommation des GPU, et d'obtenir des informations détaillées afin d'attribuer avec précision les coûts aux équipes et projets internes.

Notre mise en œuvre du MaaS s'appuie sur des workflows GitOps qui assurent fiabilité et haute disponibilité. Cette approche de l'exploitation réduit les interventions manuelles et les erreurs potentielles, et établit un contrôle clair sur les déploiements d'IA.

Parmi les principaux résultats mesurés, nous avons constaté une utilisation plus efficace des ressources et une expérience utilisateur améliorée. En centralisant le provisionnement de GPU et le déploiement de modèles, le MaaS a permis d'éliminer les efforts redondants et de rationaliser l'exploitation interne et a considérablement réduit les délais de rentabilisation. Une fois les nouveaux modèles testés et validés, nos équipes peuvent les intégrer et les utiliser immédiatement, sans être ralenties par des tâches d'allocation de matériel ou de provisionnement.

Commencez à créer votre plateforme d'IA interne dès aujourd'hui

Pour simplifier le déploiement de l'IA et tirer le meilleur parti de votre infrastructure, commencez par lire notre article de présentation du MaaS afin de mieux comprendre son fonctionnement. Parcourez ensuite la page du produit OpenShift AI pour évaluer les capacités de la plateforme et obtenir des conseils d'utilisation des GPU.

Nos services de consulting aident les entreprises qui souhaitent adopter une approche MaaS en interne à concevoir et exploiter des environnements de mise à disposition de modèles adaptés à leurs besoins. Pour en savoir plus, consultez la page des services de consulting Red Hat pour l'IA.

Si vous cherchez des exemples concrets, découvrez notre série de webinars disponibles à la demande, notamment la session sur le MaaS.

Tags:IA/ML

About Red Hat

Red Hat is the open hybrid cloud technology leader, delivering a trusted, consistent and comprehensive foundation for transformative IT innovation and AI applications. Its portfolio of cloud, developer, AI, Linux, automation and application platform technologies enables any application, anywhere—from the datacenter to the edge. As the world's leading provider of enterprise open source software solutions, Red Hat invests in open ecosystems and communities to solve tomorrow's IT challenges. Collaborating with partners and customers, Red Hat helps them build, connect, automate, secure, and manage their IT environments, supported by consulting services and award-winning training and certification offerings.

North America
Asia Pacific
Latin America
Europe, Middle East, and Africa

888-REDHAT1
+6564904200
+5443297300
+0080073342835

Copyright © 2026 Red Hat. Red Hat, the Red Hat logo, Ansible, and OpenShift are trademarks or registered trademarks of Red Hat, LLC or its subsidiaries in the United States and other countries. Linux® is the registered trademark of Linus Torvalds in the U.S. and other countries. The OPENSTACK logo and word mark are trademarks or registered trademarks of OpenInfra Foundation, used under license. All other trademarks are the property of their respective owners.

Guide sur l'approche MaaS

L'adoption croissante de l'IA apporte son lot de défis en matière d'infrastructure et d'accès

Définition du MaaS

L'approche MaaS aide à relever les défis

Offrez un accès partagé à l'IA en centralisant l'exploitation des modèles

Contrôlez l'utilisation, limitez les accès et gérez les coûts

Prenez en charge tous les modèles, tous les accélérateurs et tous les clouds

Mise en œuvre du MaaS par Red Hat

Commencez à créer votre plateforme d'IA interne dès aujourd'hui

About Red Hat

Plateformes

Outils

Essayer, acheter et vendre

Communication

About Red Hat

Changer la langue

Red Hat legal and privacy links

Red Hat legal and privacy links