Skip to contentRed Hat AI
  • 我们的方案

    • 资讯与见解
    • 技术博客
    • 研究
    • 现场 AI 活动
    • 与红帽一起探索 AI
  • 我们的产品组合

    • 红帽 AI
    • 红帽企业 Linux AI
    • 红帽 OpenShift AI
    • 红帽 AI 推理服务器
  • 参与和学习

    • AI 学习中心
    • AI 合作伙伴
    • AI 服务
混合云
  • 平台解决方案

    • 人工智能

      构建、部署和监控 AI 模型和应用。

    • Linux 标准化

      实现跨操作环境的一致性。

    • 应用开发

      简化您构建、部署和管理应用的方式。

    • 自动化

      扩展自动化,实现技术、团队和环境的统一。

  • 用例

    • 虚拟化

      实现虚拟化和容器化工作负载的运维现代化。

    • 数字主权

      控制和保护关键基础架构。

    • 安全防护

      编写、构建、部署和监控以安全为中心的软件。

    • 边缘计算

      利用边缘技术将工作负载部署到更靠近数据源的位置。

  • 浏览解决方案
  • 行业解决方案

    • 汽车行业
    • 金融服务
    • 医疗保健
    • 工业部门
    • 媒体娱乐
    • 公共部门(全球)
    • 公共部门(美国)
    • 电信行业

探索云技术

了解如何在红帽® 混合云控制台中根据自己的需要使用我们的云产品和解决方案。

产品
  • 平台产品

    • 红帽 AI

      跨混合云开发和部署 AI 解决方案。

      新版本
    • 红帽企业 Linux

      使用灵活的操作系统以支持混合云创新。

    • 红帽 OpenShift

      大规模构建和部署现代化应用。

    • 红帽 Ansible 自动化平台

      实施企业级自动化。

  • 特色产品

    • 红帽 OpenShift 虚拟化引擎
    • AWS 上的红帽 OpenShift 服务
    • 微软 Azure 红帽 OpenShift
    • 查看所有产品
  • 试用与购买

    • 开始试用
    • 在线购买
    • 与主要云提供商集成
  • 服务和支持

    • 咨询服务
    • 产品支持
    • AI 服务
    • 大客户技术经理
    • 了解服务与支持
培训
  • 培训和认证

    • 课程和考试
    • 认证
    • 红帽院校合作
    • 培训社区
    • 培训订阅服务
    • 了解更多培训内容
  • 特色产品

    • 红帽认证系统管理员考试
    • 红帽系统管理一
    • 红帽培训订阅试用(免费)
    • 红帽认证工程师(RHCE)考试
    • 红帽认证 OpenShift 管理员考试
  • 服务

    • 咨询服务
    • 合作伙伴培训
    • 产品支持
    • AI 服务
    • 大客户技术经理
学习
  • 培养技能

    • 文档
    • 实操练习
    • 混合云学习中心
    • 互动学习体验
    • 培训和认证
  • 更多学习方式

    • 博客
    • 活动和网络研讨会
    • 播客和视频系列
    • 红帽 TV
    • 资源库

面向开发人员

探索资源和工具,帮助您构建、交付和管理云原生应用和服务。

合作伙伴
  • 面向客户

    • 我们的合作伙伴
    • 红帽生态系统目录
    • 查找合作伙伴
  • 面向合作伙伴

    • Partner Connect
    • 成为合作伙伴
    • 培训
    • 服务支持
    • 访问合作伙伴门户

构建由可靠的合作伙伴提供支持的解决方案

在红帽® 生态系统目录中查找来自专家和技术协作社区的解决方案。

搜索

我想要:

  • 开始试用
  • 管理订阅
  • 查看红帽职位
  • 了解技术主题
  • 联系销售人员
  • 联系客户服务

帮我查找:

  • 文档
  • 开发者资源
  • 技能评估
  • 红帽架构中心
  • 安全更新
  • 支持案例

我想进一步了解:

  • AI
  • 应用现代化
  • 自动化
  • 云原生应用
  • Linux
  • 虚拟化
控制台文档服务支持新增 推荐

推荐

我们会在您浏览时推荐您可能喜欢的资源。现在可以尝试以下推荐:

  • 产品试用中心
  • 课程和考试
  • 所有产品
  • 技术话题
  • 资源库
登录

使用红帽帐户,获取更多资源。

  • 控制台访问
  • 活动报名
  • 培训和试用
  • 世界一流的支持

某些服务可能需要订阅。

登录或注册
联系我们
  • Home
  • 资源
  • 红帽 AI 推理服务器

红帽 AI 推理服务器

2025 年 9 月 29 日•
资源类型: 产品规格表

概述

AI 的真正价值,在于能够大规模做出快速且精准的响应。红帽® AI 推理服务器通过优化混合云中的推理过程,直接实现了这种响应。优化推理这一步非常关键,它使 AI 应用能够与大语言模型(LLM)通信,并基于数据生成响应,从而实现更快、更具成本效益的模型部署。

随时随地进行快速且经济高效的推理

作为红帽 AI 平台的一部分,红帽 AI 推理服务器可大规模提供一致、快速且经济高效的推理。AI 推理服务器支持在任何硬件加速器和各种环境(数据中心、云和边缘)中运行各类生成式 AI 模型,提供满足业务需求的灵活性和多样化选择。AI 推理服务器通过两种方式提供高效推理功能:一,使用 LLM Compressor 压缩基础模型和经过训练的模型,进行模型优化;二,提供经过验证和优化的生成式 AI 模型库的访问权限,这些模型已准备就绪,可在更短的时间内实现推理部署。 

红帽 AI 推理服务器可与各种硬件加速器和模型配合使用,并可在您选择的基础架构和操作系统(OS)上运行,包括红帽 AI 平台、红帽企业 Linux®、红帽 OpenShift® 以及第三方 Linux 或 Kubernetes 发行版,为客户提供契合任何架构的灵活性。

表 1.功能和优势

优势

说明

利用虚拟大语言模型

(vLLM)提供高效的模型推理方法

AI 推理服务器通过使用 vLLM 优化图形处理单元(GPU)内存使用率和推理延迟,提供高效的模型推理方法。

降低运维复杂性

AI 推理服务器为跨混合云部署和优化模型提供了一致的平台。它提供一种用户友好的方法来管理包括量化在内的高级机器学习(ML)技术,并支持与 Prometheus 和 Grafana 等可观测性工具集成。

提供混合云的灵活性

AI 推理服务器以 vLLM 为核心,让企业组织能够自由地在数据中心、云环境和边缘环境等任何所需位置运行 AI 模型。 

技术规格

  • 适用于混合云的推理运行时。 AI 推理服务器以成熟且强大的推理运行时 vLLM 为核心,为企业提供了一个统一的高性能平台,支持在各种加速器、Kubernetes 和 Linux 环境中运行他们选择的模型。它还集成了可观测性工具以增强监控功能,并支持 LLM API(如 OpenAI 的 API)以实现灵活部署。
  • LLM Compressor。 AI 团队可以压缩各种规模的基础模型和经过训练的模型,在保持模型高精度响应能力的同时,显著降低计算资源消耗及相关成本。此外,他们可与红帽合作,获取模型优化计划方面的支持。
  • 经过优化的模型存储库。 AI 推理服务器托管在 Hugging Face 上的红帽 AI 页面,提供经过验证和优化的领先 AI 模型库的即时访问权限,这些模型已准备就绪,可随时进行推理部署,在不降低模型准确度的前提下,可将效率提升 2-4 倍。
  • 经认证适用于所有红帽产品。 AI 推理服务器包含在红帽 OpenShift AI 和红帽企业 Linux AI 中,也受红帽 OpenShift 和红帽企业 Linux 支持。
  • 第三方平台部署。AI 推理服务器可以跨第三方 Linux 和 Kubernetes 平台进行部署,并享受红帽第三方支持政策的保障。在此类部署场景中,红帽仅对推理服务器组件提供支持。如果出现与底层平台相关的问题,且问题无法在红帽企业 Linux 或红帽 OpenShift 上重现,则由客户自行负责处理。

探索全面优化的自动化之路

如需了解 AI 推理服务器如何帮助实现快速、经济高效且可扩展的推理,请访问红帽 AI 推理服务器产品页面。

标签:AI inference, AI/ML

Red Hat logoLinkedInYouTubeFacebookX

平台

  • 红帽 AI
  • 红帽企业 Linux
  • 红帽 OpenShift
  • 红帽 Ansible 自动化平台
  • 查看所有产品

工具

  • 培训和认证
  • 我的帐户
  • 客户支持
  • 开发者资源
  • 查找合作伙伴
  • 红帽生态系统目录
  • 文档

试用购买与出售

  • 产品试用中心
  • 红帽商店
  • 在线购买(日本)
  • 控制台

联系我们

  • 联系销售人员
  • 联系客户服务
  • 联系培训部门
  • 社交媒体

关于红帽

红帽是开放混合云技术的领导者,为企业变革性 IT 和人工智能 (AI) 应用提供一致、全面的基础。作为深受《财富》500 强企业信赖的顾问,红帽提供云、开发人员、Linux、自动化和应用平台技术,以及屡获殊荣的服务。

  • 公司介绍
  • 企业文化
  • 客户成功案例
  • 行业分析师关系
  • 新闻中心
  • 开源承诺
  • 社会责任
  • 加入红帽

Change page language

Red Hat legal and privacy links

  • 关于红帽
  • 加入红帽
  • 活动
  • 全球办事处
  • 联系红帽
  • 红帽博客
  • 红帽的包容性
  • 红帽周边产品
  • 红帽全球峰会
© 2025 Red Hat    |    京ICP备09066747号

Red Hat legal and privacy links

  • 隐私声明
  • 使用条款
  • 方针政策概览
  • 数字可访问性声明