模型即服务：AI 重在实践，而非空谈

2025 年 5 月 7 日Karl Eklund5 分钟阅读

Artificial intelligence

开发和评估新的人工智能（AI）技术对于在技术方面实现长期成功至关重要，但这并非全部。在红帽，我们还致力于创建可重复使用的模式，并优化 AI 模型的应用方式。这一切的努力，都是为了让红帽和客户都能更自信地采用 AI 技术。

我们同样关注 AI 实践落地过程中的现实挑战。例如，如何在尽可能降低成本的同时，为每个人提供对 AI 模型的私有访问权限？如何利用“下一代颠覆性技术”的价值与规模效应？

关键答案便是：模型即服务（MaaS）。

并非人人都想成为 AI 专家，坦白说，也没有哪个企业组织需要全员构建自己的模型。现阶段的目标，应该是让尽可能多的人能够利用现有的 AI 技术，而这正是模型即服务的价值所在。

模型即服务详解

我们最终选择模型即服务解决方案的考量过程如下。我们的用户通常分为两类：

AI 爱好者——那些对 AI 感兴趣的 AI 构建者、开发人员、业余爱好者和专业人士
其他用户——那些只想使用 AI 而不愿深究技术细节的人

模型即服务是一种将 AI 模型作为可消费资源，以 API 端点形式提供给企业组织的方法。它由您的 IT 团队或 AI 平台工程师负责，将模型部署在 API 网关后方，从而赋能开发人员，进而让所有用户都能在日常任务中使用 AI 技术。

不妨这样想：AI 巨头不会向您提供硬件访问权限，而是提供其应用或 API 端点的访问权限。他们本质上提供的就是模型即服务。唯一不同的是，在此情境下，您无需租用他们的服务，而是可以运行自己的模型即服务解决方案，以掌控成本、访问权限及创新速度。

听起来很棒，对吧？

确实如此！我们在红帽内部运行模型即服务已近一年。以下是我们的观察发现：

以更低成本获得更多创新成果

每当有新模型发布，数百名红帽员工都希望立即部署它。借助模型即服务，我们能够一次性部署模型并节省预算！过去每当 10 人、20 人乃至 50 多人想要试用新模型，便需相应配置数十张 GPU 的时代一去不复返。

这是一种双赢的局面。我们的开发人员既能尝试新模型，专注于构建新工具，又无需花费大量资金。

加速创新

我们能够按照自己的节奏测试任何新上市的模型。还记得 DeepSeek 如何颠覆 AI 市场吗？DeepSeek R1 发布后不久，我们便将该模型投入运行并面向所有人开放。Granite、Llama 4、Phi 等模型也是如此，您懂的。

隐私和安全性

敏感数据需要全面且审慎的管控。借助模型即服务，您可成为自己的私有 AI 提供商，严密守护数字资产。您无需使用面向公众的 API 端点。事实上，许多客户选择在完全物理隔离的数据中心中运行自己的模型。

企业级应用

为模型即服务提供支持的 API 网关可为您提供：所需的可扩展性，以覆盖每位员工；所需的灵活性，以跟上创新步伐；以及增强的安全性和可观测性工具，使您能够按照自己的节奏高效部署 AI 模型。

进一步降低成本

模型即服务通过直接采用共享资源模型来降低成本。您会发现，实现相同效果所需的 GPU 数量减少，且 GPU 利用率指标也将提升。随着模型持续优化和精简，资源占用量也会减少，而您能够从中受益。您甚至可以使用开源大型语言模型（LLM）压缩工具，在模型性能与规模之间取得平衡，以满足自身需求。简而言之，模型即服务可帮助您优化资源占用和模型配置，以实现效益最大化。

模型即服务旨在奠定可靠的基础，同时面向未来做好准备。以 AI 代理为例。代理并非一次性问答应用。只要获得授权，它们将持续搜寻答案。这意味着什么呢？消耗词元，并且是海量的词元。如果您希望实现可扩展性并更准确地预测成本，建议考虑在内部运行模型即服务。

AI 已成必然趋势，现在是时候务实考量成本、创新速度和隐私保护了。模型即服务是一种极具潜力的解决方案，也是红帽公司致力于推进的方向。如果这些也是您的优先事项，那么模型即服务值得认真考虑。

来看看这个互动演示案例：虚构的保险公司 Parasol 利用模型即服务解决方案，为三款 AI 应用提供支持！对于 AI 爱好者来说，我们提供了模型即服务 Github 存储库。最后，如果您今年参加红帽全球峰会，请务必注册报名参加“How to become the hero of your artificial intelligence story”（如何成为企业人工智能转型的赋能者）和“LLM-as-a-Service for enterprise: Building a customer large language model platform”（面向企业的大语言模型即服务：构建客户大语言模型平台）课程，以了解更多信息。

关于作者

Karl Eklund

Principal Architect

Karl Eklund is a Principal Architect aligning customer goals to solutions provided by the open source community and commercial vendors within the Red Hat OpenShift Data Science platform. Prior to joining Red Hat, Karl advised technology leaders on enterprise data and technology strategies and built machine learning models across multiple academic disciplines.

Read full bio

了解更多

按频道浏览

探索所有频道

模型即服务：AI 重在实践，而非空谈

以更低成本获得更多创新成果

加速创新

隐私和安全性

企业级应用

进一步降低成本

开启企业 AI 之旅：新手指南

关于作者

Karl Eklund

更多此类内容

了解更多

按频道浏览

平台

工具

试用购买与出售

联系我们

关于红帽

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links