Skip to content IA
  • Visão geral

    • Novidades sobre IA
    • Blog técnico
    • Eventos de IA ao vivo
    • Entenda o que é inferência
    • Nossa abordagem para IA
  • Soluções

    • Red Hat AI Enterprise
    • Red Hat AI Inference
    • Red Hat Enterprise Linux AI
    • Red Hat OpenShift AI
    • Conheça o Red Hat AI
  • Participe e aprenda

    • Hub de conhecimento em IA
    • Tudo sobre IA
    • Parceiros de IA
    • Serviços para IA
Nuvem híbrida
  • Soluções de plataforma

    • Inteligência artificial

      Desenvolva, implante e monitore modelos e apps de IA.

    • Linux

      Garanta consistência em todos os ambientes.

    • Desenvolvimento de aplicações

      Desenvolva, implante e gerencie apps com mais facilidade.

    • Automação

      Escale a automação e una tecnologia, equipes e ambientes.

  • Casos de uso

    • Virtualização

      Modernize cargas de trabalho virtualizadas e em containers.

    • Soberania digital

      Controle e proteja sua infraestrutura crítica.

    • Segurança

      Desenvolva e monitore software com foco em segurança.

    • Edge computing

      Implante cargas de trabalho mais perto da origem com a edge computing.

  • Veja todas as soluções
  • Soluções por setor

    • Automotivo
    • Serviços financeiros
    • Saúde
    • Industrial
    • Mídia e entretenimento
    • Setor público (global)
    • Setor público (EUA)
    • Telecomunicações

Conheça tecnologias de nuvem

Aprenda a usar nossos produtos e soluções para a nuvem com o Red Hat® Hybrid Cloud Console.

Produtos
  • Plataforma

    • Red Hat AI iconartificial intelligence, Red Hat Enterprise Linux AI, Red Hat OpenShift AI, RHEL AI, machine learning38382025-03-12T19:43:40.963Zimage/svg+xmlRed Hat AI iconartificial intelligence, Red Hat Enterprise Linux AI, Red Hat OpenShift AI, RHEL AI, machine learningIconno2025-03-12T19:39:59.817ZTechnology iconStandardRed Hat AI

      Desenvolva e implante soluções de IA na nuvem híbrida.

    • Red Hat Enterprise Linux iconRHEL, Linux platforms, CentOS2024-03-01T15:26:42.958ZpendingTRA3b65dd25-844d-49bb-93c1-30f5b34684f1Icon2024-03-01T15:26:42.958Ztruepending2024-03-21T00:40:29.326Zrhcc-audience:internalnoTechnology iconDER3b65dd25-844d-49bb-93c1-30f5b34684f1Standardyesrhcc-product:red-hat-enterprise-linuxTechnology iconimage/svg+xml2024-05-10T14:11:29.114ZRed Hat Enterprise Linux iconRHEL, Linux platforms, CentOSActivateActivate2024-05-10T14:11:29.836Zworkflow-process-serviceActivateworkflow-process-servicefalse2024-05-10T14:11:29.836Zworkflow-process-service2024-05-10T14:11:29.836ZUse technology icons to represent Red Hat products and components. Do not remove the icon from the bounding shape.Red Hat Enterprise Linux

      Inove na nuvem híbrida com um sistema operacional flexível.

    • Red Hat OpenShift iconCloud, Containers, Kubernetes2024-03-01T15:26:53.684ZpendingTRA9ec76aa9-ef09-4c49-8816-01dd13970ca7Icon2024-03-01T15:26:53.684Ztruepending2024-03-21T00:39:44.126Zrhcc-audience:internalnoTechnology iconDER9ec76aa9-ef09-4c49-8816-01dd13970ca7Standardyesrhcc-product:red-hat-openshiftrhcc-product:red-hat-openshift-on-ibm-cloudrhcc-product:microsoft-azure-red-hat-openshiftrhcc-product:red-hat-openshift-service-on-awsrhcc-product:red-hat-openshift-container-platformrhcc-product:red-hat-openshift-platform-plusTechnology iconimage/svg+xml2024-05-10T14:18:23.703ZRed Hat OpenShift iconCloud, Containers, KubernetesActivateActivate2024-05-10T14:18:25.221Zworkflow-process-serviceActivateworkflow-process-servicefalse2024-05-10T14:18:25.221Zworkflow-process-service2024-05-10T14:18:25.221ZUse technology icons to represent Red Hat products and components. Do not remove the icon from the bounding shape.Red Hat OpenShift

      Desenvolva, modernize e implante aplicações em escala.

    • Red Hat Ansible Automation Platform iconManagement, edge2024-03-01T15:26:35.068ZpendingTRA759b57c4-760b-45a0-a939-821f47181964Icon2024-03-01T15:26:35.068Ztruepending2024-03-21T00:39:55.923Zrhcc-audience:internalnoTechnology iconDER759b57c4-760b-45a0-a939-821f47181964Standardyesrhcc-product:red-hat-ansible-automation-platformTechnology iconimage/svg+xml2024-05-10T14:04:00.014ZRed Hat Ansible Automation Platform iconManagement, edgeActivateActivate2024-05-10T14:04:01.784Zworkflow-process-serviceActivateworkflow-process-servicefalse2024-05-10T14:04:01.784Zworkflow-process-service2024-05-10T14:04:01.784ZUse technology icons to represent Red Hat products and components. Do not remove the icon from the bounding shape.Red Hat Ansible Automation Platform

      Implemente a automação em toda a empresa.

  • Em destaque

    • Red Hat AI Enterprise
    • Red Hat OpenShift Virtualization Engine
    • Red Hat Desktop
    • Conheça todas as soluções
  • Teste e compre

    • Central de testes de soluções
    • Compre online
    • Integração com provedores de nuvem
  • Serviços e Suporte

    • Consultoria
    • Suporte
    • Serviços para IA
    • Gestão técnica de contas
    • Veja todos os serviços e suporte
Treinamentos
  • Treinamento e certificação

    • Cursos e exames
    • Certificações
    • Avaliar meu conhecimento
    • Red Hat Academy
    • Learning subscription
    • Mais informações
  • Em destaque

    • Red Hat Certified System Administrator Exam
    • Red Hat System Administration I
    • Red Hat Learning Subscription - Versão de teste (Gratuito)
    • Red Hat Certified Engineer Exam
    • Red Hat Certified OpenShift Administrator Exam
  • Serviços

    • Consultoria
    • Treinamentos para parceiros
    • Suporte
    • Serviços para IA
    • Gestão técnica de contas
Explorar
  • Amplie seus conhecimentos

    • Documentação
    • Laboratórios hands-on
    • Nuvem híbrida - hub de aprendizagem
    • Demos interativas
    • Treinamento e certificação
  • Aprenda mais

    • Blog
    • Eventos e webinars
    • Podcasts e vídeos
    • Red Hat TV
    • Biblioteca de recursos

Para desenvolvedores

Recursos e ferramentas para criar, entregar e gerenciar apps e serviços nativos em nuvem.

Parceiros
  • Para clientes

    • Nossos parceiros
    • Red Hat Ecosystem Catalog
    • Encontre um parceiro
  • Para parceiros

    • Partner Connect
    • Torne-se um parceiro
    • Treinamento
    • Suporte
    • Accesse o portal de parceiros

Crie soluções com os parceiros de confiança da Red Hat

Soluções de nossa comunidade de especialistas e tecnologias inovadoras no Red Hat® Ecosystem Catalog.

ConsoleDocumentaçãoSuporte Pesquisar

Gostaria de:

  • Avaliação gratuita
  • Comprar uma Red Hat Learning Subscription
  • Gerenciar minhas subscrições
  • Contate o setor de vendas
  • Fale com o Atendimento ao Cliente
  • Pesquisar vagas na Red Hat

Quero encontrar:

  • Documentação
  • Recursos para desenvolvedores
  • Assuntos de tecnologia
  • Centro de arquitetura
  • Atualizações de segurança
  • Suporte ao cliente

Quero aprender sobre:

  • Inteligência Artificial (IA)
  • Modernização de aplicações
  • Automação
  • Aplicações nativas em nuvem
  • Linux
  • Virtualização
Novo Para você

Recomendado

Recomendaremos conteúdos relevantes enquanto você navega. Veja estas sugestões:

  • Central de avaliação de produtos
  • Cursos e exames
  • Veja todas as soluções
  • Assuntos de tecnologia
  • Biblioteca de recursos
Login

Acesse mais recursos com uma conta Red Hat

  • Acesso ao console
  • Eventos
  • Treinamentos e testes
  • Suporte de excelência

Alguns serviços podem exigir uma subscrição válida.

Faça login ou cadastre-se
Contato
Red Hat logo
  • Home
  • Recursos
  • Red Hat AI Inference Server

Red Hat AI Inference Server

29 de setembro de 2025•
Tipo de conteúdo: Datasheet
Print to PDF

Visão geral

O verdadeiro valor da IA está em oferecer respostas rápidas e precisas em grande escala. O Red Hat® AI Inference Server torna isso possível ao otimizar o processo de inferência na nuvem híbrida. Essa etapa é essencial para as aplicações de IA se comunicarem com Large Language Models (LLMs) e gerarem respostas baseadas em dados. Assim, a solução cria implantações de modelos mais rápidas e econômicas.

Inferência rápida e econômica em qualquer ambiente

Como parte da plataforma Red Hat AI, o Red Hat AI Inference Server oferece inferência consistente, rápida, econômica e em grande escala. O AI Inference Server permite executar modelos de IA generativa (gen IA) em diferentes aceleradores de hardware, seja em datacenter, na nuvem ou na edge, oferecendo a flexibilidade e a liberdade necessárias para atender aos requisitos do seu negócio. O AI Inference Server oferece recursos para tornar a inferência mais eficiente por meio da otimização de modelos. A solução utiliza o LLM Compressor para compactar modelos fundamentais ou previamente treinados, além de fornecer acesso a uma coleção de modelos de gen IA validados, otimizados e prontos para acelerar as implantações de inferência. 

O Red Hat AI Inference Server é compatível com uma grande variedade de modelos e aceleradores de hardware. Além disso, ele pode ser executado na infraestrutura e no sistema operacional que você escolher, como as plataformas do Red Hat AI, Red Hat Enterprise Linux®, Red Hat OpenShift® e distribuições Linux ou Kubernetes de terceiros. Assim, os clientes têm flexibilidade para se alinhar a qualquer arquitetura.

Tabela 1. Funcionalidades e benefícios

Benefício

Descrição

Abordagem eficiente para inferência de modelos com Large Language Model virtual (vLLM)

(vLLM)

O AI Inference Server oferece uma abordagem eficiente de inferência de modelos, otimizando o uso de memória pelas unidades de processamento gráfico (GPUs) e a latência da inferência com vLLM.

Menor complexidade operacional

O AI Inference Server oferece uma plataforma consistente para implantação e otimização de modelos na nuvem híbrida. A solução oferece uma abordagem simplificada para gerenciar técnicas avançadas de machine learning (ML), como a quantização,além de integração com ferramentas de observabilidade, como Prometheus e Grafana.

Flexibilidade da nuvem híbrida

Com o vLLM como base, o AI Inference Server proporciona às organizações a liberdade de executar modelos de IA onde for necessário: em data centers, ambientes de nuvem e na edge. 

Especificações técnicas

  • Runtime de inferência para a nuvem híbrida. Com base em um vLLM de runtime de inferência robusto e sofisticado, o AI Inference Server oferece às empresas uma plataforma unificada e de alto desempenho para executar os modelos que preferem em vários aceleradores, no Kubernetes e em ambientes Linux. Além disso, a solução se integra a ferramentas de observabilidade para oferecer monitoramento avançado e é compatível com APIs de LLM, como a do OpenAI, permitindo uma implantação mais flexível.
  • LLM Compressor. Equipes de IA podem compactar tanto modelos fundamentais quanto modelos já treinados, independentemente do tamanho, para reduzir o uso de recursos computacionais e os custos associados, mantendo alta precisão nas respostas. Além disso, podem contar com o suporte da Red Hat em suas iniciativas de otimização de modelos.
  • Repositório de modelos otimizado. Disponível na página da Red Hat AI no Hugging Face, o AI Inference Server oferece acesso imediato a uma coleção otimizada e validada de modelos de IA avançados, prontos para implantação de inferência, ajudando a acelerar a eficiência de 2 a 4 vezes sem comprometer a precisão.
  • Certificado para todas as soluções Red Hat. O AI Inference Server faz parte do Red Hat OpenShift AI e do Red Hat Enterprise Linux AI, além de ser compatível com o Red Hat OpenShift e o Red Hat Enterprise Linux.
  • Implantações em plataformas de terceiros. O AI Inference Server pode ser implantado em plataformas Linux e Kubernetes de terceiros e está coberto pela política de suporte de terceiros da Red Hat. Nesses casos, o suporte da Red Hat é apenas para o componente do Inference Server. Problemas relacionados à plataforma subjacente que não possam ser reproduzidos no Red Hat Enterprise Linux ou no Red Hat OpenShift são de responsabilidade do cliente.

Caminhe rumo à automação verdadeiramente otimizada

Para descobrir como o AI Inference Server viabiliza uma inferência rápida, econômica e escalável, acesse a página da solução Red Hat AI Inference Server.

Tags:AI inference, Inteligência artificial

Red Hat logo

About Red Hat

Red Hat is the open hybrid cloud technology leader, delivering a trusted, consistent and comprehensive foundation for transformative IT innovation and AI applications. Its portfolio of cloud, developer, AI, Linux, automation and application platform technologies enables any application, anywhere—from the datacenter to the edge. As the world's leading provider of enterprise open source software solutions, Red Hat invests in open ecosystems and communities to solve tomorrow's IT challenges. Collaborating with partners and customers, Red Hat helps them build, connect, automate, secure, and manage their IT environments, supported by consulting services and award-winning training and certification offerings.

  • North America
  • Asia Pacific
  • Latin America
  • Europe, Middle East, and Africa
  • 888-REDHAT1
  • +6564904200
  • +5443297300
  • +0080073342835
  • www.redhat.com
  • apace@redhat.com
  • info-latam@redhat.com
  • europe@redhat.com
  • @red-hat
  • @redhat
  • @redhat
  • @red_hat

Copyright © 2026 Red Hat. Red Hat, the Red Hat logo, Ansible, and OpenShift are trademarks or registered trademarks of Red Hat, LLC or its subsidiaries in the United States and other countries. Linux® is the registered trademark of Linus Torvalds in the U.S. and other countries. The OPENSTACK logo and word mark are trademarks or registered trademarks of OpenInfra Foundation, used under license. All other trademarks are the property of their respective owners.

Red Hat logoLinkedInYouTubeFacebookXInstagram

Plataformas

  • Red Hat AI
  • Red Hat Enterprise Linux
  • Red Hat OpenShift
  • Red Hat Ansible Automation Platform
  • Veja todos os produtos

Ferramentas

  • Treinamento e certificação
  • Minha conta
  • Suporte ao cliente
  • Recursos para desenvolvedores
  • Encontre um parceiro
  • Red Hat Ecosystem Catalog
  • Documentação

Experimente, compre e venda

  • Central de testes de soluções
  • Red Hat Store
  • Comprar online (Japão)
  • Console

Comunicação

  • Contate o setor de vendas
  • Contate o atendimento ao cliente
  • Contate o setor de treinamento
  • Redes sociais

Sobre a Red Hat

A Red Hat é líder em fornecer tecnologias de nuvem híbrida aberta que compõem uma base consistente para aplicações transformadoras de TI e inteligência artificial (IA). Parceira de confiança das empresas da Fortune 500, a Red Hat oferece tecnologias de nuvem, desenvolvimento, Linux, automação e plataforma de aplicações, além de serviços premiados.

  • Nossa empresa
  • Nosso modelo de trabalho
  • Casos de sucesso de clientes
  • Relações com analistas
  • Notícias
  • Compromisso com o open source
  • Nosso impacto social
  • Vagas disponíveis

Selecionar idioma

Red Hat legal and privacy links

  • Sobre a Red Hat
  • Oportunidades de emprego
  • Eventos
  • Escritórios
  • Fale com a Red Hat
  • Blog da Red Hat
  • Inclusão na Red Hat
  • Cool Stuff Store
  • Red Hat Summit
© 2026 Red Hat

Red Hat legal and privacy links

  • Declaração de privacidade
  • Termos de uso
  • Todas as políticas e diretrizes
  • Acessibilidade digital