Skip to contentRed Hat

Navigation

IA
  • Notre approche

    • Actualité
    • Blog technique
    • Recherche
    • Événements IA en direct
    • Découvrir l'IA chez Red Hat
  • Notre gamme de produits

    • Red Hat AI
    • Red Hat Enterprise Linux AI
    • Red Hat OpenShift AI
    • Red Hat AI Inference Server
  • Collaborer et apprendre

    • Hub d'apprentissage pour l'IA
    • Partenaires IA
    • Services pour l'IA
Cloud hybride
  • Solutions de plateforme

    • Intelligence artificielle

      Créez et déployez les modèles et applications d'IA.

    • Standardisation basée sur Linux

      Assurez la cohérence entre tous vos environnements.

    • Développement d'applications

      Créez, déployez et gérez vos applications facilement.

    • Automatisation

      Automatisez à grande échelle et unifiez technologies et équipes.

    • Découvrir les solutions
  • Cas d'utilisation

    • Virtualisation

      Modernisez l'exploitation des charges de travail virtualisées et conteneurisées.

    • Souveraineté numérique

      Contrôlez et protégez vos infrastructures critiques.

    • Sécurité

      Codez, créez, déployez et surveillez des logiciels sécurisés.

    • Edge computing

      Déployez plus près de la source grâce à l'edge computing.

  • Solutions par secteur

    • Industrie automobile
    • Services financiers
    • Secteur de la santé
    • Secteur industriel
    • Les médias et le divertissement
    • Secteur public (monde)
    • Secteur public (États-Unis)
    • Télécommunications

Découvrez les technologies cloud

Apprenez à utiliser nos produits et solutions cloud à votre rythme dans Red Hat® Hybrid Cloud Console.

Produits
  • Produits de plateforme

    • Red Hat AI

      Développez et déployez des solutions d'IA dans le cloud hybride.

      Nouvelle version
    • Red Hat Enterprise Linux

      Innovez dans le cloud hybride avec un système d'exploitation flexible.

    • Red Hat OpenShift

      Créez et déployez des applications à grande échelle.

    • Red Hat Ansible Automation Platform

      Automatisez à l'échelle de l'entreprise.

  • À la une

    • Red Hat OpenShift Virtualization Engine
    • Red Hat OpenShift Service on AWS
    • Microsoft Azure Red Hat OpenShift
    • Voir tous les produits
  • Essayer et acheter

    • Commencer un essai
    • Acheter en ligne
    • Intégrez vos produits à ceux des principaux fournisseurs de cloud
  • Services et assistance

    • Consulting
    • Assistance pour les produits
    • Services pour l'IA
    • Gestion de compte technique
    • Découvrir tous nos services
Formation
  • Formations et certifications

    • Cours et examens
    • Certifications
    • Red Hat Academy
    • Learning community
    • Souscription Red Hat Learning
    • Découvrir les formations
  • À la une

    • Examen Administrateur système certifié Red Hat
    • Administration système Red Hat I
    • Essai Red Hat Learning Subscription (gratuit)
    • Examen RHCE (Ingénieur certifié Red Hat)
    • Examen Administrateur OpenShift certifié Red Hat
  • Services

    • Consulting
    • Formations pour partenaires
    • Assistance pour les produits
    • Services pour l'IA
    • Gestion de compte technique
Se former
  • Développement des compétences

    • Documentation
    • Atelier interactif
    • Hybrid cloud learning hub
    • Expériences d'apprentissage interactives
    • Formation et certification
  • Autres ressources

    • Blog
    • Événements et webinaires
    • Podcasts et vidéos
    • Red Hat TV
    • Bibliothèque de ressources

Pour les développeurs

Découvrez les outils qui vous aideront à créer, distribuer et gérer vos applications et services cloud-native.

Partenaires
  • Pour nos clients

    • Nos partenaires
    • Red Hat Ecosystem Catalog
    • Rechercher un partenaire
  • Pour nos partenaires

    • Partner Connect
    • Devenir partenaire
    • Formation
    • Assistance
    • Accéder au portail des partenaires

Créez des solutions avec des partenaires de confiance

Trouvez les solutions issues de notre communauté de spécialistes et de nos technologies dans le Red Hat® Ecosystem Catalog.

Rechercher

Je souhaite :

  • Commencer un essai
  • Gestion des souscriptions
  • Offres d'emploi Red Hat
  • En savoir plus sur les technologies
  • Contacter le service commercial
  • Contactez notre service clientèle

Aidez-moi à trouver :

  • Documentation
  • Ressources développeurs
  • Évaluation des compétences
  • Architecture Center
  • Mises à jour de sécurité
  • Dossiers d'assistance

Je souhaite en savoir plus sur :

  • IA
  • Modernisation des applications
  • Automatisation
  • Applications cloud-native
  • Linux
  • Virtualisation
ConsoleDocumentationAssistanceNouveau Pour vous

Recommandation

Voici des ressources susceptibles de vous intéresser :

  • Testez nos produits
  • Cours et examens
  • Tous les produits
  • Thèmes
  • Bibliothèque de ressources
Connexion

Créez un compte Red Hat pour accéder à plus de contenu

  • Accès à la console
  • Inscription à l'événement
  • Formations et essais
  • Assistance de qualité

Certains services nécessitent une souscription.

Connexion ou inscription
Contact
  • Home
  • Ressources
  • Red Hat AI Inference Server

Red Hat AI Inference Server

29 septembre 2025•
Type de ressource : Fiche technique

Présentation

La véritable valeur de l'IA réside dans ses réponses rapides et précises à grande échelle. Red Hat® AI Inference Server offre cet avantage en optimisant les processus d'inférence, une étape cruciale qui permet aux applications d'IA de communiquer avec des grands modèles de langage (LLM) et de générer des réponses basées sur des données dans l'ensemble du cloud hybride. Le déploiement des modèles est ainsi plus rapide et rentable.

Tâches d'inférence rapides et rentables dans tous les environnements

Intégrée à l'offre Red Hat AI, la solution Red Hat AI Inference Server permet d'effectuer des tâches d'inférence rapides, cohérentes et rentables à grande échelle. Elle est en mesure d'exécuter tous les modèles d'IA générative sur tous les accélérateurs matériels et dans les environnements de datacenter, cloud et d'edge computing. Vous disposez ainsi des choix et de la flexibilité nécessaires pour répondre à vos besoins métiers. AI Inference Server met en œuvre des tâches d'inférence efficaces grâce à l'optimisation des modèles. Vous pouvez tirer parti de LLM Compressor afin de compresser à la fois les modèles de fondation et d'entraînement, ou d'un accès à un ensemble de modèles d'IA générative validés, optimisés et prêts pour un déploiement rapide. 

La solution Red Hat AI Inference Server est compatible avec un large éventail d'accélérateurs matériels et de modèles, et peut s'exécuter sur l'infrastructure et le système d'exploitation de votre choix, notamment les plateformes incluses dans Red Hat AI, Red Hat Enterprise Linux®, Red Hat OpenShift® et d'autres solutions ou distributions Linux ou Kubernetes spécifiques.

Tableau 1 : fonctions et avantages

Avantage

Description

Approche efficace des processus d'inférence des modèles à l'aide d'un grand modèle de langage virtuel

(vLLM)

AI Inference Server offre une approche efficace des processus d'inférence des modèles en optimisant l'utilisation de la mémoire des processeurs graphiques et la latence d'inférence avec le vLLM.

Exploitation simplifiée

AI Inference Server fournit une plateforme cohérente pour le déploiement et l'optimisation des modèles dans le cloud hybride. Cette solution propose une approche intuitive pour gérer les techniques avancées d'apprentissage automatique, notamment la quantification, et s'intègre à des outils d'observabilité comme Prometheus et Grafana.

Cloud hybride flexible

Basée sur le vLLM, la solution AI Inference Server permet aux entreprises d'exécuter des modèles d'IA là où elles en ont besoin, dans des datacenters, dans le cloud et à la périphérie du réseau. 

Caractéristiques techniques

  • Exécution de processus d'inférence dans le cloud hybride : basée sur un vLLM d'exécution d'inférence puissant et sophistiqué, la solution AI Inference Server offre aux entreprises une plateforme unifiée et hautes performances afin d'exécuter les modèles de leur choix sur différents accélérateurs ainsi que dans des environnements Kubernetes et Linux. Elle s'intègre également aux outils d'observabilité afin d'améliorer la surveillance et prend en charge les API de LLM, comme celles d'OpenAI, pour un déploiement flexible.
  • LLM Compressor : les équipes d'IA peuvent compresser les modèles de fondation et d'entraînement de toutes tailles afin d'économiser des ressources de calcul et de diminuer les coûts associés tout en préservant un haut niveau de précision dans les réponses. Nous pouvons également les assister dans leurs projets d'optimisation des modèles.
  • Référentiel de modèles optimisé : hébergée sur la page Red Hat AI sur Hugging Face, la solution AI Inference Server offre un accès instantané à une collection validée et optimisée de grands modèles d'IA prêts pour le déploiement de processus d'inférence, ce qui permet de multiplier par deux à quatre l'efficacité sans compromettre la précision du modèle.
  • Compatibilité avec tous nos produits : cette solution est incluse dans Red Hat OpenShift AI et Red Hat Enterprise Linux AI, et fonctionne également avec Red Hat OpenShift et Red Hat Enterprise Linux.
  • Déploiements sur des plateformes tierces : la solution AI Inference Server peut être déployée sur des plateformes Linux et Kubernetes tierces, et est couverte par notre politique d'assistance tierce. Dans ce cas, nous ne prenons en charge que le composant Inference Server. Le client est responsable des problèmes liés à sa plateforme sous-jacente s'ils ne peuvent pas être reproduits sur Red Hat Enterprise Linux ou Red Hat OpenShift.

Stratégie d'automatisation optimisée

Pour découvrir comment la solution Red Hat AI Inference Server assure des capacités d'inférence rapides, rentables et évolutives, consultez la page du produit.

Tags:AI inference, IA/ML

Red Hat logoLinkedInYouTubeFacebookX

Plateformes

  • Red Hat AI
  • Red Hat Enterprise Linux
  • Red Hat OpenShift
  • Red Hat Ansible Automation Platform
  • Voir tous les produits

Outils

  • Formation et certification
  • Mon compte
  • Assistance client
  • Ressources développeurs
  • Rechercher un partenaire
  • Red Hat Ecosystem Catalog
  • Documentation

Essayer, acheter et vendre

  • Testez nos produits
  • Red Hat Store
  • Acheter en ligne (Japon)
  • Console

Communication

  • Contacter le service commercial
  • Contactez notre service clientèle
  • Contacter le service de formation
  • Réseaux sociaux

About Red Hat

Leader dans le domaine cloud hybride ouvert, Red Hat fournit une base cohérente et complète pour les applications transformatives et d'IA dans les entreprises. Conseiller de confiance auprès des entreprises du Fortune 500, Red Hat propose des technologies de cloud, de développement, Linux, d'automatisation et de plateforme d'applications, ainsi que des services reconnus.

  • Notre entreprise
  • Notre modèle
  • Témoignages clients
  • Relations avec les analystes
  • Actualités
  • Notre engagement Open Source
  • L'engagement social de Red Hat
  • Offres d'emplois

Change page language

Red Hat legal and privacy links

  • À propos de Red Hat
  • Carrières
  • Événements
  • Bureaux
  • Contacter Red Hat
  • Lire le blog Red Hat
  • L'inclusion chez Red Hat
  • Cool Stuff Store
  • Red Hat Summit
© 2025 Red Hat

Red Hat legal and privacy links

  • Déclaration de confidentialité
  • Conditions d'utilisation
  • Politiques et règles d'utilisation
  • Accessibilité numérique