Skip to contentRed Hat AI
  • 概述

    • AI 新闻
    • 技术博客
    • 现场 AI 活动
    • 了解 AI 推理
    • 了解我们的方案
  • 产品

    • 红帽 AI Enterprise
    • 红帽 AI 推理服务器
    • 红帽企业 Linux AI
    • 红帽 OpenShift AI
    • 探索红帽 AI
  • 参与和学习

    • 学习中心
    • AI 主题
    • AI 合作伙伴
    • AI 服务
混合云
  • 平台解决方案

    • 人工智能

      构建、部署和监控 AI 模型和应用。

    • Linux 标准化

      实现跨操作环境的一致性。

    • 应用开发

      简化您构建、部署和管理应用的方式。

    • 自动化

      扩展自动化,实现技术、团队和环境的统一。

  • 用例

    • 虚拟化

      实现虚拟化和容器化工作负载的运维现代化。

    • 数字主权

      控制和保护关键基础架构。

    • 安全防护

      编写、构建、部署和监控以安全为中心的软件。

    • 边缘计算

      利用边缘技术将工作负载部署到更靠近数据源的位置。

  • 浏览解决方案
  • 行业解决方案

    • 汽车行业
    • 金融服务
    • 医疗保健
    • 工业部门
    • 媒体娱乐
    • 公共部门(全球)
    • 公共部门(美国)
    • 电信行业

探索云技术

了解如何在红帽® 混合云控制台中根据自己的需要使用我们的云产品和解决方案。

产品
  • 平台产品

    • 红帽 AI

      跨混合云开发和部署 AI 解决方案。

    • 红帽企业 Linux

      使用灵活的操作系统以支持混合云创新。

    • 红帽 OpenShift

      大规模构建和部署现代化应用。

    • 红帽 Ansible 自动化平台

      实施企业级自动化。

  • 特色产品

    • 红帽 OpenShift 虚拟化引擎
    • AWS 上的红帽 OpenShift 服务
    • 微软 Azure 红帽 OpenShift
    • 查看所有产品
  • 试用与购买

    • 开始试用
    • 在线购买
    • 与主要云提供商集成
  • 服务和支持

    • 咨询服务
    • 产品支持
    • AI 服务
    • 大客户技术经理
    • 了解服务与支持
培训
  • 培训和认证

    • 课程和考试
    • 认证
    • 技能评估
    • Red Hat Academy
    • 购买培训订阅
    • 了解更多培训内容
  • 特色产品

    • 红帽认证系统管理员考试
    • 红帽系统管理一
    • 红帽培训订阅试用(免费)
    • 红帽认证工程师(RHCE)考试
    • 红帽认证 OpenShift 管理员考试
  • 服务

    • 咨询服务
    • 合作伙伴培训
    • 产品支持
    • AI 服务
    • 大客户技术经理
学习
  • 培养技能

    • 文档
    • 实操练习
    • 混合云学习中心
    • 交互式演示
    • 培训和认证
  • 更多学习方式

    • 博客
    • 活动和网络研讨会
    • 播客和视频系列
    • 红帽 TV
    • 资源库

面向开发人员

探索资源和工具,帮助您构建、交付和管理云原生应用和服务。

合作伙伴
  • 面向客户

    • 我们的合作伙伴
    • 红帽生态系统目录
    • 查找合作伙伴
  • 面向合作伙伴

    • Partner Connect
    • 成为合作伙伴
    • 培训
    • 服务支持
    • 访问合作伙伴门户

构建由可靠的合作伙伴提供支持的解决方案

在红帽® 生态系统目录中查找来自专家和技术协作社区的解决方案。

搜索

我想要:

  • 开始试用
  • 购买培训订阅
  • 管理订阅
  • 联系销售人员
  • 联系客户服务
  • 查看红帽职位

帮我查找:

  • 文档
  • 开发者资源
  • 技术主题
  • 红帽架构中心
  • 安全更新
  • 客户支持

我想进一步了解:

  • AI
  • 应用现代化
  • 自动化
  • 云原生应用
  • Linux
  • 虚拟化
控制台文档服务支持新增 推荐

推荐

我们会在您浏览时推荐您可能喜欢的资源。现在可以尝试以下推荐:

  • 产品试用中心
  • 课程和考试
  • 所有产品
  • 技术话题
  • 资源库
登录

使用红帽帐户,获取更多资源。

  • 控制台访问
  • 活动报名
  • 培训和试用
  • 世界一流的支持

某些服务可能需要订阅。

登录或注册
联系我们
Red Hat logo
  • Home
  • 资源
  • 红帽 AI 推理服务器

红帽 AI 推理服务器

2025 年 9 月 29 日•
资源类型: 产品规格表

概述

AI 的真正价值,在于能够大规模做出快速且精准的响应。红帽® AI 推理服务器通过优化混合云中的推理过程,直接实现了这种响应。优化推理这一步非常关键,它使 AI 应用能够与大语言模型(LLM)通信,并基于数据生成响应,从而实现更快、更具成本效益的模型部署。

随时随地进行快速且经济高效的推理

作为红帽 AI 平台的一部分,红帽 AI 推理服务器可大规模提供一致、快速且经济高效的推理。AI 推理服务器支持在任何硬件加速器和各种环境(数据中心、云和边缘)中运行各类生成式 AI 模型,提供满足业务需求的灵活性和多样化选择。AI 推理服务器通过两种方式提供高效推理功能:一,使用 LLM Compressor 压缩基础模型和经过训练的模型,进行模型优化;二,提供经过验证和优化的生成式 AI 模型库的访问权限,这些模型已准备就绪,可在更短的时间内实现推理部署。 

红帽 AI 推理服务器可与各种硬件加速器和模型配合使用,并可在您选择的基础架构和操作系统(OS)上运行,包括红帽 AI 平台、红帽企业 Linux®、红帽 OpenShift® 以及第三方 Linux 或 Kubernetes 发行版,为客户提供契合任何架构的灵活性。

表 1.功能和优势

优势

说明

利用虚拟大语言模型

(vLLM)提供高效的模型推理方法

AI 推理服务器通过使用 vLLM 优化图形处理单元(GPU)内存使用率和推理延迟,提供高效的模型推理方法。

降低运维复杂性

AI 推理服务器为跨混合云部署和优化模型提供了一致的平台。它提供一种用户友好的方法来管理包括量化在内的高级机器学习(ML)技术,并支持与 Prometheus 和 Grafana 等可观测性工具集成。

提供混合云的灵活性

AI 推理服务器以 vLLM 为核心,让企业组织能够自由地在数据中心、云环境和边缘环境等任何所需位置运行 AI 模型。 

技术规格

  • 适用于混合云的推理运行时。 AI 推理服务器以成熟且强大的推理运行时 vLLM 为核心,为企业提供了一个统一的高性能平台,支持在各种加速器、Kubernetes 和 Linux 环境中运行他们选择的模型。它还集成了可观测性工具以增强监控功能,并支持 LLM API(如 OpenAI 的 API)以实现灵活部署。
  • LLM Compressor。 AI 团队可以压缩各种规模的基础模型和经过训练的模型,在保持模型高精度响应能力的同时,显著降低计算资源消耗及相关成本。此外,他们可与红帽合作,获取模型优化计划方面的支持。
  • 经过优化的模型存储库。 AI 推理服务器托管在 Hugging Face 上的红帽 AI 页面,提供经过验证和优化的领先 AI 模型库的即时访问权限,这些模型已准备就绪,可随时进行推理部署,在不降低模型准确度的前提下,可将效率提升 2-4 倍。
  • 经认证适用于所有红帽产品。 AI 推理服务器包含在红帽 OpenShift AI 和红帽企业 Linux AI 中,也受红帽 OpenShift 和红帽企业 Linux 支持。
  • 第三方平台部署。AI 推理服务器可以跨第三方 Linux 和 Kubernetes 平台进行部署,并享受红帽第三方支持政策的保障。在此类部署场景中,红帽仅对推理服务器组件提供支持。如果出现与底层平台相关的问题,且问题无法在红帽企业 Linux 或红帽 OpenShift 上重现,则由客户自行负责处理。

探索全面优化的自动化之路

如需了解 AI 推理服务器如何帮助实现快速、经济高效且可扩展的推理,请访问红帽 AI 推理服务器产品页面。

标签:AI inference, AI/ML

Red Hat logo

About Red Hat

Red Hat is the open hybrid cloud technology leader, delivering a trusted, consistent and comprehensive foundation for transformative IT innovation and AI applications. Its portfolio of cloud, developer, AI, Linux, automation and application platform technologies enables any application, anywhere—from the datacenter to the edge. As the world's leading provider of enterprise open source software solutions, Red Hat invests in open ecosystems and communities to solve tomorrow's IT challenges. Collaborating with partners and customers, Red Hat helps them build, connect, automate, secure, and manage their IT environments, supported by consulting services and award-winning training and certification offerings.

  • North America
  • Asia Pacific
  • Latin America
  • Europe, Middle East, and Africa
  • 888-REDHAT1
  • +6564904200
  • +5443297300
  • +0080073342835
  • www.redhat.com
  • apace@redhat.com
  • info-latam@redhat.com
  • europe@redhat.com
  • @red-hat
  • @redhat
  • @redhat
  • @red_hat

Copyright © 2026 Red Hat. Red Hat, the Red Hat logo, Ansible, and OpenShift are trademarks or registered trademarks of Red Hat, LLC or its subsidiaries in the United States and other countries. Linux® is the registered trademark of Linus Torvalds in the U.S. and other countries. The OPENSTACK logo and word mark are trademarks or registered trademarks of OpenInfra Foundation, used under license. All other trademarks are the property of their respective owners.

Red Hat logoLinkedInYouTubeFacebookXInstagram

平台

  • 红帽 AI
  • 红帽企业 Linux
  • 红帽 OpenShift
  • 红帽 Ansible 自动化平台
  • 查看所有产品

工具

  • 培训和认证
  • 我的帐户
  • 客户支持
  • 开发者资源
  • 查找合作伙伴
  • 红帽生态系统目录
  • 文档

试用购买与出售

  • 产品试用中心
  • 红帽商店
  • 在线购买(日本)
  • 控制台

联系我们

  • 联系销售人员
  • 联系客户服务
  • 联系培训部门
  • 社交媒体

关于红帽

红帽是开放混合云技术的领导者,为企业变革性 IT 和人工智能 (AI) 应用提供一致、全面的基础。作为深受《财富》500 强企业信赖的顾问,红帽提供云、开发人员、Linux、自动化和应用平台技术,以及屡获殊荣的服务。

  • 公司介绍
  • 企业文化
  • 客户成功案例
  • 行业分析师关系
  • 新闻中心
  • 开源承诺
  • 社会责任
  • 加入红帽

Change page language

Red Hat legal and privacy links

  • 关于红帽
  • 加入红帽
  • 活动
  • 全球办事处
  • 联系红帽
  • 红帽博客
  • 红帽的包容性
  • 红帽周边产品
  • 红帽全球峰会
© 2026 Red Hat    |    京ICP备09066747号

Red Hat legal and privacy links

  • 隐私声明
  • 使用条款
  • 方针政策概览
  • 数字可访问性声明