红帽 AI 推理服务器

红帽 AI 推理服务器

红帽® AI 推理服务器可优化混合云中的推理，实现更快、更具成本效益的模型部署。

探索最新版本

红帽推理服务器主图

什么是推理服务器？

推理服务器是一种软件，它使得人工智能（AI）应用能够与大语言模型（LLM）进行通信，并基于数据生成响应。这一过程称为推理。它是实现商业价值、交付最终结果的关键环节。

要实现高效运行，大型语言模型需要庞大的存储、内存和基础架构来支持进行大规模推理，而这往往会耗尽您的大部分预算。

作为红帽 AI 平台的一部分，红帽 AI 推理服务器对推理能力进行了优化，从而降低了传统模式下高昂的成本和对庞大基础架构的需求。

进一步了解 AI 推理

红帽 AI 推理服务器助力实现快速且经济高效的 AI 推理。视频时长：2:28

一个交互式演示的屏幕截图，其中显示了一个命令行界面和一个提示，内容为：“这些模型经过优化，可在红帽 AI 推理服务器上运行。您可以使用标准化 API 将它们部署在任意所需位置，无论是在红帽产品上，还是在非红帽的 Kubernetes 和 Linux 环境中。”

红帽 AI 推理服务器简介

红帽 AI 推理服务器的工作原理是什么？

红帽 AI 推理服务器可提供快速且经济高效的大规模推理。其开源特性使其能够在任意云环境中，支持任何 AI 加速器上的任意生成式 AI（Gen AI）模型。

推理服务器由 vLLM 提供支持，可最大限度提高 GPU 利用率，加快响应速度。结合 LLM Compressor 的功能，还可以在不影响性能的情况下进一步提升推理效率。凭借跨平台适应性以及不断壮大的贡献者社区，vLLM 正逐渐成为生成式 AI 推理领域的“Linux®”。

探索 3 个 vLLM 真实用例

50%

部分客户通过使用 LLM Compressor，在不牺牲性能的前提下实现了 50% 的成本节省。*

*Zelenović 和 Saša。“Unleash the full potential of LLMs: Optimize for performance with vLLM（释放大语言模型的全部潜能：借助 vLLM 优化性能）。” 红帽博客，2025 年 2 月 27 日。

模型选择，由您决定

红帽 AI 推理服务器支持所有主流开源模型，并具备灵活的 GPU 可移植性。您可以灵活选用任意生成式 AI 模型，也可从我们开源的第三方模型集合中挑选经过验证和优化的模型。

此外，作为红帽 AI 的一部分，红帽 AI 推理服务器已通过所有红帽产品的认证。它也可以部署到其他 Linux 和 Kubernetes 平台上，并根据红帽第三方支持政策享受相应支持。

查看 Hugging Face 上的模型存储库

功能和优势

获取产品文档 | 下载产品规格说明

借助 vLLM 提升效率

vLLM 通过优化内存使用与提升 GPU 利用率，实现高效模型推理。借助 vLLM，可以在任意 AI 加速器上优化任意生成式 AI 模型的部署。

LLM Compressor

可对任意规模的模型进行压缩，从而在保持高响应准确率的同时，降低计算资源消耗及相关成本。

混合云的灵活性

支持跨不同 GPU 灵活迁移，并且可在本地、云端或边缘端运行模型。

红帽 AI 存储库

提供经第三方验证的优化模型，可直接用于推理部署，助力更快地实现价值并控制成本。

Hugging Face 上的红帽 AI 存储库

红帽 AI 技术支持

作为 vLLM 最大的商业贡献者之一，我们对这项技术有着深入的理解。我们的 AI 顾问具备专业的 vLLM 技术能力，可助力您实现企业 AI 目标。

进一步了解红帽 AI 咨询

如何购买

红帽 AI 推理服务器既可作为独立产品购买，也可作为红帽 AI 的一部分获取。它已包含在红帽企业 Linux® AI 和红帽 OpenShift® AI 中。

与合作伙伴共同部署

红帽 AI 汇聚了众多专家和各种技术，让客户能够利用 AI 实现更多目标。了解与红帽携手同行的所有合作伙伴，以认证他们的产品能否与我们的解决方案无缝衔接。

浏览红帽 AI 合作伙伴

2025 年红帽全球峰会和 AnsibleFest 大会 AI 客户案例集锦

回顾 2025 年全球峰会亮点

土耳其航空公司通过实现企业范围内的数据访问，将部署速度提高了一倍。

JCCM 利用 AI 技术，改进了该地区的环境影响评估（EIA）流程。

Denizbank 将上市时间从数天缩短到数分钟。

Hitachi 借助红帽 OpenShift AI 在整个业务范围内实施了 AI。

常见问题

是否需要购买红帽企业 Linux AI 或红帽 OpenShift AI，才能使用红帽 AI 推理服务器？

不需要。红帽 AI 推理服务器可作为独立的红帽产品单独购买。

是否需要购买红帽 AI 推理服务器，才能使用红帽企业 Linux AI？

不需要。购买红帽企业 Linux AI 或红帽 OpenShift AI 时，红帽 AI 推理服务器已包含在内。

如何购买红帽企业 Linux AI

红帽 AI 推理服务器能否在红帽企业 Linux 或红帽 OpenShift 上运行？

可以。在遵循第三方协议的前提下，它还能在第三方 Linux 环境中运行。

红帽 AI 推理服务器如何定价？

按加速器数量定价。

能够满足您需求并按您意愿运行的 AI。

生成式 AI

生成式 AI

制作文本和软件代码等新内容。

借助红帽 AI，您可以更快地运行您选择的生成式 AI 模型，同时减少资源消耗并降低推理成本。

了解红帽 AI 的生成式 AI 技术

预测性 AI

预测性 AI

应用模式并预测未来结果。

借助红帽 AI，企业组织能够构建、训练、部署和监控预测模型，同时在混合云环境中始终保持一致性。

了解红帽 AI 的预测性 AI 技术

运营化 AI

运营化 AI

创建支持大规模维护和部署 AI 的系统。

借助红帽 AI，在节省资源并确保遵守隐私法规的同时，管理与监控支持 AI 的应用的生命周期。

了解红帽 AI 的运营化 AI 技术

代理式 AI

代理式 AI

构建在有限监督下执行复杂任务的工作流。

红帽 AI 为在现有应用中构建、管理和部署代理式 AI 工作流提供了灵活的方法和稳定的基础。

了解红帽 AI 的代理式 AI 技术

探索更多 AI 资源

如何在企业中开始采用 AI

如何开始采用 AI 推理

利用开源模型，释放 AI 创新潜力

网络培训课堂：如何提升性能并优化成本

联系销售代表

联系红帽，咨询红帽 AI 相关事宜

平台

工具

试用购买与出售

联系我们

关于红帽

红帽是开放混合云技术的领导者，为企业变革性 IT 和人工智能 (AI) 应用提供一致、全面的基础。作为深受《财富》500 强企业信赖的顾问，红帽提供云、开发人员、Linux、自动化和应用平台技术，以及屡获殊荣的服务。

© 2026 Red Hat | 京ICP备09066747号