Red Hat AI Inference Server

Red Hat AI Inference Server ottimizza l'inferenza nel cloud ibrido per adozioni più rapide e a un costo più vantaggioso.

Prova la soluzione

Contatta un rappresentante di Red Hat

Cos'è un server di inferenza?

Un server di inferenza è il software che permette alle applicazioni di intelligenza artificiale (IA) di comunicare con modelli linguistici di grandi dimensioni (LLM) e generare una risposta in base ai dati. Questo processo viene chiamato inferenza. È dove si crea il valore di business e si ottiene il risultato finale.

Ma per funzionare in modo efficace, gli LLM necessitano di ampio spazio di storage, memoria e infrastrutture per l'inferenza su larga scala. Ed è per questo che possono assorbire la maggior parte del budget.

Sappiamo che l'hardware e il software che supportano le capacità di inferenza sono determinanti per il successo o il fallimento della strategia di IA. Red Hat AI Inference Server ottimizza l'inferenza per ridurre i costi e garantire la scalabilità dei team.

I vantaggi dell'inferenza IA

Inferenza IA veloce ed efficiente in termini economici con Red Hat AI Inference Server. Durata del video: 2:28

Screenshot di una demo interattiva che mostra un'interfaccia a riga di comando e un prompt che indica:

Introduzione a Red Hat AI Inference Server

Come funziona Red Hat AI Inference Server?

Red Hat AI Inference Server offre un'inferenza veloce e a costi contenuti in modo scalabile. La sua natura open source gli consente di supportare qualsiasi modello di IA generativa (IA gen), su qualsiasi acceleratore IA, in qualsiasi ambiente cloud.

Basato su vLLM, il server di inferenza massimizza l'utilizzo della GPU e accelera i tempi di risposta. In combinazione con le capacità di LLM Compressor, l'efficienza dell'inferenza aumenta senza compromettere le prestazioni. Con un'adattabilità multipiattaforma e una community di contributori in crescita, vLLM si sta affermando come il Linux® dell'inferenza dell'IA gen.

Scopri 3 scenari di utilizzo di vLLM reali

50%

Alcuni clienti che hanno utilizzato LLM Compressor hanno ottenuto un risparmio del 50% sui costi senza compromettere le prestazioni.*

*Zelenović, Saša. "Unleash the full potential of LLMs: Optimize for performance with vLLM." Blog di Red Hat Blog, 27 febbraio 2025.

Scegli liberamente i tuoi modelli

Red Hat AI Inference Server supporta tutti i principali modelli open source con portabilità flessibile sulle GPU. Puoi anche eseguire modelli che vanno oltre il testo e il codice, come i modelli geospaziali in grado di interpretare l'ambiente fisico.

Utilizza qualsiasi modello di IA gen o scegli nella nostra raccolta ottimizzata di modelli open source di terze parti, convalidati per essere eseguiti in modo efficiente sulla piattaforma Red Hat AI.

La convalida del modello di Red Hat AI si esegue tramite strumenti open source, quali GuideLLM, Language Model Evaluation Harness e vLLM, per assicurare la riproducibilità.

Dai un'occhiata al repository dei modelli su Hugging Face

Caratteristiche e vantaggi

Scarica la documentazione del prodotto | Scarica la scheda tecnica

vLLM

vLLM consente un uso efficiente della memoria e un maggiore utilizzo della GPU per offrire un'inferenza del modello efficiente. Ottimizza l'adozione di qualsiasi modello di IA gen, su qualsiasi acceleratore IA, grazie a vLLM.

LLM Compressor

Comprimi modelli di qualsiasi dimensione per ridurre l'utilizzo delle risorse e i relativi costi, mantenendo al contempo un'elevata accuratezza nelle risposte del modello.

Mixture of Experts (MoE) sparse

Esegui architetture MoE sparse per ridurre i costi di inferenza senza sacrificare le prestazioni con agenti a bassa latenza e modelli di ragionamento sofisticati.

Repository di Red Hat AI

Modelli convalidati e ottimizzati da terze parti sono pronti per l'adozione dell'inferenza, per aiutarti a ottenere un time to value più rapidamente e mantenere costi bassi.

Repository di Red Hat AI su Hugging Face

Flessibilità del cloud ibrido

Mantieni la portabilità tra diverse GPU ed esegui i modelli on premise, nel cloud o nell'edge.

Certificato per Red Hat

Red Hat AI Inference Server è certificato per tutti i prodotti Red Hat. In alternativa, può essere adottato su altre piattaforme Linux e Kubernetes con supporto vincolato all'informativa sul supporto di terze parti di Red Hat.

Supporto di Red Hat AI

Essendo tra i maggiori contributori commerciali a vLLM, abbiamo una profonda conoscenza della tecnologia. I nostri consulenti IA possiedono le competenze giuste su vLLM per aiutarti a raggiungere i tuoi obiettivi di IA per le aziende.

Ulteriori informazioni su Red Hat AI Consulting

Come acquistare la soluzione

Red Hat AI Inference Server è disponibile come prodotto standalone o come parte di Red Hat AI. È incluso sia in Red Hat Enterprise Linux® AI sia in Red Hat OpenShift® AI.

Contatta un rappresentante di Red Hat

Affidati ai nostri partner

Con le giuste tecnologie e il supporto degli esperti del settore, i nostri clienti potranno sfruttare al massimo il potenziale dell'IA. Scopri tutti i partner che collaborano con Red Hat per certificare la compatibilità dei propri prodotti con le nostre soluzioni.

Sfoglia partner di Red Hat AI

Storie dei clienti relative all'IA dall'evento Red Hat Summit e AnsibleFest 2025

Scopri i momenti salienti del Summit 2025

Turkish Airlines ha raddoppiato i tempi di deployment grazie all'accesso ai dati in tutta l'organizzazione.

JCCM ha migliorato i processi di valutazione di impatto ambientale (VIA) della regione utilizzando l'IA.

DenizBank ha accelerato i tempi di rilascio passando da pochi giorni a pochi minuti.

Hitachi ha reso operativa l'IA nell'intera azienda con Red Hat OpenShift AI.

Domande frequenti

Devo acquistare Red Hat Enterprise Linux AI o Red Hat OpenShift AI per usare Red Hat AI Inference Server?

No. Puoi acquistare Red Hat AI Inference Server come prodotto Red Hat standalone.

Devo acquistare Red Hat AI Inference Server per usare Red Hat Enterprise Linux AI?

No. Red Hat AI Inference Server è incluso con l'acquisto di Red Hat Enterprise Linux AI e di Red Hat OpenShift AI.

Come acquistare Red Hat Enterprise Linux AI

Red Hat AI Inference Server può essere eseguito su Red Hat Enterprise Linux o Red Hat OpenShift?

Sì. Può essere eseguito anche in ambienti Linux di terze parti in base al nostro accordo con terze parti.

Come viene calcolata la tariffa di Red Hat AI Inference Server?

La tariffa si calcola in base all'acceleratore.

Quando l'IA si adatta alle tue esigenze e alle tue condizioni.

IA generativa

Genera nuovi contenuti, come testi e codice software.

Red Hat AI ti consente di eseguire i modelli di IA generativa che preferisci, più velocemente, con meno risorse e costi di inferenza inferiori.

Scopri di più sull'IA generativa con Red Hat AI

IA predittiva

Collega i modelli e prevedi i risultati futuri.

Con Red Hat AI le organizzazioni possono creare, addestrare, distribuire e monitorare i modelli predittivi, mantenendo la coerenza nel cloud ibrido.

Scopri di più sull'IA predittiva con Red Hat AI

Gestione operativa dell'IA

Crea sistemi che supportino la manutenzione e il deployment dell'IA in modo scalabile.

Con Red Hat AI puoi gestire e monitorare il ciclo di vita delle applicazioni basate sull'IA, risparmiando sulle risorse e garantendo la conformità alle normative sulla privacy.

Scopri di più sulla gestione operativa dell'IA con Red Hat AI

Agentic AI

Crea flussi di lavoro che eseguono attività complesse con una supervisione limitata.

Red Hat AI offre un approccio flessibile e una base robusta per la creazione, la gestione e il deployment dei flussi di lavoro di Agentic AI all'interno delle applicazioni esistenti.

Scopri di più su Agentic AI con Red Hat AI

Red Hat AI Inference Server

Cos'è un server di inferenza?

Introduzione a Red Hat AI Inference Server

Come funziona Red Hat AI Inference Server?

Scegli liberamente i tuoi modelli

Caratteristiche e vantaggi

vLLM

LLM Compressor

Mixture of Experts (MoE) sparse

Repository di Red Hat AI

Flessibilità del cloud ibrido

Certificato per Red Hat

Supporto di Red Hat AI

Come acquistare la soluzione

Affidati ai nostri partner

Storie dei clienti relative all'IA dall'evento Red Hat Summit e AnsibleFest 2025

Devo acquistare Red Hat Enterprise Linux AI o Red Hat OpenShift AI per usare Red Hat AI Inference Server?

Devo acquistare Red Hat AI Inference Server per usare Red Hat Enterprise Linux AI?

Red Hat AI Inference Server può essere eseguito su Red Hat Enterprise Linux o Red Hat OpenShift?

Come viene calcolata la tariffa di Red Hat AI Inference Server?

Quando l'IA si adatta alle tue esigenze e alle tue condizioni.

IA generativa

IA predittiva

Gestione operativa dell'IA

Agentic AI

Scopri altre risorse di IA

Come implementare l'IA a livello aziendale

Muovere i primi passi con l'inferenza IA

Ottimizza l'innovazione IA con i modelli open source

Webinar: come migliorare le prestazioni e ottimizzare i costi

Contatta il team commerciale

Contattaci per sapere di più su Red Hat AI

Piattaforme

Strumenti

Prova, acquista, vendi

Comunica

Informazioni su Red Hat

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links