什么是模型上下文协议(MCP)?

复制 URL

模型上下文协议(MCP)是一种开源协议,可实现 AI 应用与外部服务之间的双向连接和标准化通信。开源协议(或一组指令)就像代码配方,任何人都可以自由使用并参与贡献。

MCP 使 AI 系统能够以简单且可靠的方式虚拟地“接入”不同的数据源和工具。您可以将 MCP 视为一种 USB-C 数据线,它能将设备与各类配件相连接,并实现数据传输功能。 

探索红帽 AI

在 MCP 出现之前,开发人员必须为特定用例创建自定义应用编程接口(API)集成。这意味着他们需要以略微不同的方式反复编写功能相似的集成代码。每个 AI 应用和外部服务之间的连接都需要单独定制,这使整个过程非常耗时。

借助 MCP,开发人员可以使用单一标准化协议,将 AI 应用连接至外部服务。MCP 不会取代 API,而是会基于 API 实现通信标准化。这使得利用大语言模型(LLM)构建复杂的 AI 工作流变得更加容易,并能将其与真实的数据相连接。

MCP 是对检索增强生成(RAG)等传统方法的补充,并提供企业组织在现有系统和工作流中部署代理式 AI 所需的安全控制和接口。 

实施 AI 技术的 4 个关键注意事项

MCP 基于客户端-主机-服务器模型(也称为“客户端-服务器模型“),该模型包含以下组件:

  • MCP 客户端:请求访问外部数据或资源的 AI 应用或系统。
  • MCP 主机:管理客户端和服务器之间通信的基础架构(虚拟机、容器或无服务器功能)。
  • MCP 服务器:为客户端提供特定工具、资源和功能的组件。

在 MCP 协议运作时,第一步是握手协议。这种初始交互(也称为能力发现)用于确认 MCP 客户端与 MCP 服务器能够相互通信。 

在握手协议期间,MCP 客户端与 MCP 服务器交换关键信息以确保它们兼容。客户端会分享它具有的功能以及它支持的 MCP 版本。相应地,服务器会将它支持的功能以及可提供的工具和资源分享给客户端。

完成初始交互后,双方即可建立工作关系。 

理解上下文

如果“M”指的是语言模型,“P”指的是标准化通信协议,那么我们来探讨下 MCP 中的“C”:上下文。

在 MCP 领域,上下文是指模型能够访问的特定于任务的相关信息。上下文窗口则指模型生成响应时可访问的信息量。 

在 MCP 出现之前,AI 应用需在其上下文窗口中存储海量信息。其中部分信息不相关且会占用上下文窗口中的空间,导致模型产生幻觉。借助 MCP,应用能更高效地与工具及服务通信,精准获取所需信息,而非保留不相关的信息。 

当具备相关且充分的上下文信息时,模型能够记住对话的先前部分,提供更精准的结果,并更好地关联信息片段。MCP 允许客户端在其内存中存储相关数据,以帮助完成请求。该过程被称为“动态发现”。 

动态发现发生在功能发现阶段之后,使客户端和服务器能够协同为用户解决问题。具备这种共享和分析相关数据的能力,可为模型提供上下文,使 AI 应用能够灵活、独立地运作。

什么是混合专家模型?它如何大规模加快 LLM 推理速度?

在向 MCP 客户端提供上下文方面,MCP 服务器发挥着重要作用。了解不同类型的 MCP 服务器,有助于您掌握可实现的集成方案并了解如何规划 AI 工作流的架构。

本地数据源。这些服务器会连接到存储在您计算机上的信息,包括文件、本地数据库或应用。 

远程服务。这些服务器通过互联网连接到外部服务,包括云数据库和基于网络的工具。 

官方集成。企业组织预先构建这些服务器,以便提供与常用服务的连接,并且这些连接具备有保障的质量和技术支持。 

社区服务器。开发人员构建这些服务器,并在开发人员社区中公开分享。 

参考服务器。这些服务器通过展示最佳实践,充当模板和学习工具。

探索红帽的 MCP 服务器集合

MCP 与 AI 推理并非直接关联,但根据所用 AI 工具的复杂程度,二者可形成相互依赖的流程。

如前所述,MCP 的核心功能是将 AI 与工具、数据和外部资源连接起来,从而完成任务。推理则是指模型处理提示词并生成令牌,以提供预期的输出。MCP 可在推理过程中用于为模型提供信息支持,但它不会提高推理效率,也不会影响模型的架构。

正因为如此,推理环节的重要性不容忽视。简单来说,没有推理就没有 AI。当需要大型模型来执行企业级战略时,情况就会变得复杂。因此,支持推理功能的硬件和软件,关系到 AI 战略的成败。

为什么要关注 AI 推理

MCP 服务器使获取数据和信息变得比以往任何时候都更加便捷。但这引发了一个问题:如何确保 MCP 服务器上的数据安全无虞?

权限和安全防护策略规定了 MCP 服务器可以访问的内容以及可以执行的操作。MCP 提供内置的安全功能,如 OAuth(用于验证用户访问权限),并在客户端与服务器之间建立加密连接。

但是,开发人员也应实施自己的安全措施。最佳实践包括:

  • 仅向 MCP 服务器提供其正常运作所需的最低访问权限,这也称为最小特权原则(PoLP)。这一网络安全概念旨在减少未经授权的用户、错误或攻击造成的潜在损害。
  • 定期检查每台服务器可以访问的内容,确保没有任何服务器拥有不必要或过度的权限。
  • 了解(作为用户)您在授权 MCP 连接时所授予的访问权限。
  • 仅使用您信任的 MCP 服务器。

详细了解 MCP 安全风险和控制措施

代理式 AI 是一种软件系统,能够以尽可能少的人工干预实现与数据和工具的交互。代理式 AI 强调目标导向行为,可以通过创建一系列步骤并自主执行这些步骤来完成任务。

MCP 和代理式 AI 相辅相成,共同打造智能 AI 系统。借助 MCP,AI 系统可以与更广泛的数字生态系统交互,为用户完成任务。如果没有 MCP,代理式 AI 可以进行思考和规划(生成式 AI 的所有特征),但无法与任何外部系统交互。 

了解有关代理式 AI 的更多信息 

红帽® AI 旨在通过 vLLM 驱动的服务器实现快速、灵活且高效的推理。它将模型与数据进行可靠连接,在单个平台上统一实现专业代理的自定义和开发工作。我们的产品建立在开源基础之上,让您能够端到端全方位掌控任意规模的 AI 工作流。 

红帽 AI 产品组合包含红帽 AI Enterprise:这是一个用于在任何基础架构上部署、管理和扩展 AI 推理、代理式 AI 工作流和 AI 赋能应用的平台。

探索红帽 AI

博客

Artificial Intelligence (AI)

See how our platforms free customers to run AI workloads and models anywhere

携手红帽探索 AI 之旅:为您的 AI 之旅提供专业知识、培训和支持服务

探索红帽独特的 AI 产品组合。红帽 AI 可以通过人工智能(AI)帮助您实现业务和 IT 目标。

扩展阅读

What is Mixture of Experts (MoE)?

混合专家模型(MoE)是一种模型架构技术,通过将任务路由至模型中最适配的模块,来提升 AI 推理速度。

What is AgentOps?

AgentOps(代理运维)是一套工具框架,用于实时监控 AI 在制定决策时的“大脑”运行情况。

What is sovereign AI?

主权 AI 意味着拥有 AI 技术,将数据保留在本地,并确保您的系统能够体现您的独特价值观和法律要求。

AI/ML 相关资源

特色产品

  • 红帽 AI

    灵活的解决方案,可加快 AI 解决方案在混合云环境中的开发和部署。