Skip to contentRed Hat IA
  • Il nostro approccio

    • Novità e approfondimenti
    • Blog tecnico
    • Ricerca
    • Eventi live sull'IA
    • Scopri l'IA di Red Hat
  • Il nostro portfolio

    • Red Hat AI
    • Red Hat Enterprise Linux AI
    • Red Hat OpenShift AI
    • Red Hat AI Inference Server
  • Partecipazione e formazione

    • Learning hub per l'IA
    • Partner IA
    • Servizi per l'IA
Cloud ibrido
  • Piattaforme

    • Intelligenza artificiale

      Crea, distribuisci e monitora i modelli e le app di IA.

    • Standardizzazione di Linux

      Ottieni coerenza tra gli ambienti operativi.

    • Sviluppo di applicazioni

      Semplifica creazione, deployment e gestione delle app.

    • Automazione

      Estendi l'automazione e unisci tecnologia, team e ambienti.

  • Scenari di utilizzo

    • Virtualizzazione

      Rinnova le operazioni per carichi di lavoro virtualizzati e containerizzati.

    • Sovranità digitale

      Controlla e proteggi le infrastrutture critiche.

    • Sicurezza

      Sviluppa, crea, distribuisci e monitora il software di sicurezza.

    • Edge computing

      Distribuisci i carichi di lavoro vicino alla sorgente con l'edge.

  • Esplora le soluzioni
  • Soluzioni per settore

    • Automotive
    • Servizi finanziari
    • Sanità
    • Settore industriale
    • Media e intrattenimento
    • Settore pubblico (globale)
    • Settore pubblico (USA)
    • Telecomunicazioni

Scopri le tecnologie cloud

Scopri come utilizzare i prodotti e le soluzioni cloud secondo i tuoi ritmi nella Red Hat® Hybrid Cloud Console.

Prodotti
  • Piattaforme

    • Red Hat AI

      Sviluppa e distribuisci soluzioni di IA nel cloud ibrido.

      Nuova versione
    • Red Hat Enterprise Linux

      Supporta l'innovazione hybrid cloud con un sistema operativo adattabile.

    • Red Hat OpenShift

      Crea, modernizza e distribuisci app in modo scalabile.

    • Red Hat Ansible Automation Platform

      Estendi l'automazione a tutta l'azienda.

  • In primo piano

    • Red Hat OpenShift Virtualization Engine
    • Red Hat OpenShift Service on AWS
    • Microsoft Azure Red Hat OpenShift
    • Vedi tutti i prodotti
  • Prova e acquista

    • Inizia il periodo di prova
    • Acquista online
    • Scopri i provider cloud certificati
  • Servizi e supporto

    • Consulenza
    • Supporto per i prodotti
    • Servizi per l'IA
    • Technical Account Management
    • Esplora servizi e supporto
Formazione
  • Formazione & certificazione

    • Corsi ed esami
    • Certificazioni
    • Red Hat Academy
    • Learning community
    • Learning subscription
    • Vedi le offerte formative
  • In primo piano

    • Red Hat Certified System Administrator Exam
    • Red Hat System Administration I
    • Prova Red Hat Learning Subscription (Nessun costo)
    • Red Hat Certified Engineer Exam
    • Red Hat Certified OpenShift Administrator Exam
  • Servizi

    • Consulenza
    • Formazione per i partner
    • Supporto per i prodotti
    • Servizi per l'IA
    • Technical Account Management
Apprendimento
  • Sviluppa competenze

    • Documentazione
    • Laboratori pratici
    • Hybrid cloud learning hub
    • Apprendimento interattivo
    • Formazione e certificazioni
  • Contenuti per l'apprendimento

    • Blog
    • Eventi e webinar
    • Serie podcast e video
    • Red Hat TV
    • Libreria delle risorse

Per sviluppatori

Scopri le risorse e gli strumenti per creare, distribuire e gestire applicazioni e servizi cloud native.

Partner
  • Per i clienti

    • I nostri partner
    • Red Hat Ecosystem Catalog
    • Trova un partner
  • Per i partner

    • Partner Connect
    • Diventa partner
    • Training
    • Supporto
    • Accedi al portale dedicato ai partner

Crea soluzioni supportate da partner affidabili

Trova le soluzioni della nostra community collaborativa di esperti e tecnologie nel Red Hat® Ecosystem Catalog.

Cerca

Vorrei:

  • Inizia il periodo di prova
  • Gestire sottoscrizioni
  • Vedere le offerte di lavoro
  • Esplorare argomenti tecnici
  • Contatta l'ufficio vendite
  • Contatta l'assistenza clienti

Aiutami a trovare:

  • Documentazione
  • Risorse per sviluppatori
  • Valutazione delle competenze
  • Architecture center
  • Aggiornamenti di sicurezza
  • Richieste di supporto

Desidero informazioni su:

  • Intelligenza artificiale
  • Modernizzazione delle applicazioni
  • Automazione
  • Applicazioni cloud native
  • Linux
  • Virtualizzazione
ConsoleDocumentazioneSupportoNuovo Per te

Consigliati

Ti consiglieremo le risorse scelte per te durante la navigazione. Prova subito questi suggerimenti:

  • Prova i prodotti
  • Corsi ed esami
  • Tutti i prodotti
  • Articoli sulle tecnologie
  • Libreria delle risorse
Accedi

Ottieni di più con un account Red Hat

  • Accesso alla console
  • Registrazione all'evento
  • Corsi e prove prodotti
  • Supporto di prim'ordine

Alcuni servizi potrebbero richiedere una sottoscrizione.

Accedi o registrati
Contattaci
  • Home
  • Risorse
  • Red Hat AI Inference Server

Red Hat AI Inference Server

29 settembre 2025•
Risorsa: Scheda tecnica

Panoramica

Solo adottando un’IA reattiva, precisa e scalabile, si è in grado di sfruttarne i massimi benefici. Red Hat® AI Inference Server ottimizza il processo di inferenza, ovvero il passaggio indispensabile che consente alle applicazioni di IA di comunicare con i modelli linguistici di grandi dimensioni (LLM) e generare una risposta basata sui dati nel cloud ibrido. Attraverso questa ottimizzazione i processi di distribuzione avvengono più rapidamente e a un costo più vantaggioso.

Inferenza rapida e conveniente ovunque

Come parte della piattaforma Red Hat AI, Red Hat AI Inference Server offre un'inferenza coerente, rapida e conveniente in modo scalabile. AI Inference Server permette di eseguire qualsiasi modello di IA generativa (IA gen) su qualsiasi acceleratore hardware e in ambienti datacenter, cloud ed edge, offrendo la flessibilità e la possibilità di scelta necessarie per soddisfare le esigenze aziendali. AI Inference Server offre funzionalità per un'inferenza efficiente ottimizzando i modelli tramite LLM Compressor, per comprimere sia i modelli fondativi che quelli addestrati, o fornendo l'accesso a una raccolta di modelli di IA gen convalidati e ottimizzati pronti per i deployment inferenziali in meno tempo. 

Red Hat AI Inference Server interagisce con svariati modelli e acceleratori hardware e può essere eseguito sull'infrastruttura e sul sistema operativo di tua scelta, incluse le piattaforme Red Hat AI, Red Hat Enterprise Linux®, Red Hat OpenShift® e altri distribuzioni Linux o Kubernetes di terze parti, offrendo la flessibilità necessaria per integrarsi con qualsiasi architettura.

Tabella 1. Caratteristiche e vantaggi

Beneficio

Descrizione

Approccio efficiente all'inferenza dei modelli con un modello di linguaggio virtuale di grandi dimensioni

(vLLM)

AI Inference Server offre un approccio efficiente all'inferenza dei modelli ottimizzando l'utilizzo della memoria delle GPU e la latenza dell'inferenza con vLLM.

Complessità operativa mitigata

AI Inference Server offre una piattaforma coerente per il deployment e l'ottimizzazione dei modelli nel cloud ibrido. Si basa su un approccio intuitivo alla gestione delle tecniche di machine learning (ML) avanzate, inclusa la quantizzazione, e propone l'integrazione con strumenti di osservabilità come Prometheus e Grafana.

Flessibilità del cloud ibrido

Basato su vLLM, AI Inference Server offre alle organizzazioni la flessibilità di eseguire i modelli di IA ovunque sia necessario: nei datacenter, negli ambienti cloud e all'edge. 

Specifiche tecniche

  • Runtime di inferenza per il cloud ibrido. Dotato di un runtime di inferenza vLLM avanzato ed efficiente, AI Inference Server offre alle aziende una piattaforma unificata e ad alte prestazioni per eseguire i modelli scelti su vari acceleratori, Kubernetes e ambienti Linux. Inoltre, si integra con gli strumenti di osservabilità per migliorare il monitoraggio e supporta le API LLM, come OpenAI, per un deployment flessibile.
  • LLM Compressor. I team di IA possono comprimere modelli di base e modelli addestrati di qualsiasi dimensione per ridurre l'utilizzo delle risorse di elaborazione mitigandone i costi e mantenendo un'elevata precisione nella risposta dei modelli. Inoltre, possono collaborare con Red Hat per ricevere supporto per le iniziative di ottimizzazione dei modelli.
  • Repository ottimizzato dei modelli. AI Inference Server si trova nella pagina Red Hat AI su Hugging Face e offre l'accesso immediato a una raccolta convalidata e ottimizzata dei principali modelli di IA pronti per il deployment dell'inferenza, contribuendo a incrementare l'efficienza di 2-4 volte senza compromettere l'accuratezza del modello.
  • Certificato per tutti i prodotti Red Hat. AI Inference Server è incluso in Red Hat OpenShift AI e Red Hat Enterprise Linux AI ed è supportato anche su Red Hat OpenShift e Red Hat Enterprise Linux.
  • Deployment su piattaforme di terze parti. AI Inference Server può essere distribuito su piattaforme Linux e Kubernetes di terze parti ed è incluso nella policy di supporto per le terze parti di Red Hat. In questi casi, Red Hat supporta solo il componente Inference Server, mentre il cliente è responsabile dei problemi relativi alla piattaforma se questi non possono essere riprodotti su Red Hat Enterprise Linux o Red Hat OpenShift.

Ottieni un'automazione completamente ottimizzata

Per scoprire come AI Inference Server offre un'inferenza rapida, conveniente e scalabile, visita la pagina del prodotto Red Hat AI Inference Server.

Tag:AI inference, AI/ML

Red Hat logoLinkedInYouTubeFacebookX

Piattaforme

  • Red Hat AI
  • Red Hat Enterprise Linux
  • Red Hat OpenShift
  • Red Hat Ansible Automation Platform
  • Scopri tutti i prodotti

Strumenti

  • Formazione e certificazioni
  • Il mio account
  • Supporto clienti
  • Risorse per sviluppatori
  • Trova un partner
  • Red Hat Ecosystem Catalog
  • Documentazione

Prova, acquista, vendi

  • Prova i prodotti
  • Red Hat Store
  • Acquista online (Giappone)
  • Console

Comunica

  • Contatta l'ufficio vendite
  • Contatta l'assistenza clienti
  • Contatta un esperto della formazione
  • Social media

Informazioni su Red Hat

Red Hat, tra i leader delle tecnologie hybrid cloud open source, offre alle aziende una base coerente e completa per applicazioni IT trasformative e app di intelligenza artificiale (IA). Consulente di fiducia inserito nella classifica Fortune 500, Red Hat offre tecnologie cloud, Linux, per lo sviluppo, per l’automazione, piattaforme applicative e servizi pluripremiati.

  • La nostra azienda
  • Il nostro modello di business
  • Storie di successo
  • Relazioni con gli analisti
  • Comunicati stampa
  • L'impegno nell'open source
  • L’impegno nel sociale
  • Offerte di lavoro

Change page language

Red Hat legal and privacy links

  • Informazioni su Red Hat
  • Opportunità di lavoro
  • Eventi
  • Sedi
  • Contattaci
  • Blog di Red Hat
  • Red Hat come ambiente inclusivo
  • Cool Stuff Store
  • Red Hat Summit
© 2026 Red Hat

Red Hat legal and privacy links

  • Informativa sulla privacy
  • Termini di utilizzo
  • Tutte le informative e le linee guida
  • Accessibilità digitale