什么是代理式 AI？

Published 2024 年 11 月 6 日•11 分钟阅读

代理式 AI 是一种软件系统，旨在以尽可能少的人工干预实现与数据和工具的交互。代理式 AI 强调目标导向行为，可以通过创建一系列步骤并自主执行这些步骤来完成任务。

您可以将代理式 AI 视作自动化与大语言模型（LLM）的创造力相结合的产物。想要将代理式 AI 投入实际应用，您需要创建一个系统，为 LLM 提供访问外部工具的权限，并通过算法来提供指令，指示 AI 代理应该如何使用这些工具。

代理式 AI 与工具的交互方式涉及编排，具体采用流程还是图表形式，取决于所使用的框架。这种方法支持 LLM 进行“推理”，并确定回答问题的最佳方式，例如判断查询是否可通过现有信息解答，或是否需要执行外部搜索。

为何选择红帽实现代理式 AI？

您可以将 AI 代理看作一种顶层实体，相当于运维和管理其他软件工具的“管理员”。代理式 AI 可以是一种物理结构、一个软件程序，或二者的结合体。

机器人系统中的 AI 代理可能会使用摄像头、传感器和监控器来收集周围环境的数据，并与软件一同运行这些信息，以决定下一步行动。这一过程称为“传感器融合”。

此外，软件环境中的代理式 AI 还会从其他来源（例如 API、在线搜索、文本提示和数据库）收集数据，帮助 AI 代理形成认知感和情境意识。

下面我们深入探讨代理式 AI 的部分专属功能与特性：

代理式 AI 具备适应性与动态性

代理式 AI 能够从过往模式和数据中学习。这意味着代理式 AI 可以根据其接收到的全新或不断变化的信息实时更改策略。传统的工作流只会向前推进，而代理式 AI 的工作流不仅能够前后移动，其间还可以回溯和修正错误。也就是说，代理式 AI 可以主动预测需求，并反思其工作。

例如，自动驾驶汽车可能会使用代理式 AI 来提高其分辨能力，判断路面上的物体是垃圾还是松鼠。通过持续监控并分析自身行为，代理式 AI 能够优化行动结果。

代理式 AI 可独立管理并完成任务

代理式 AI 有时也被称为自主式 AI。这是因为它能够代表人类用户或另一 AI 代理与其他 AI 系统和数字基础架构进行通信与协作。

例如，您可以告诉 AI 代理，今天晚餐您想做意大利面。AI 代理随后可完成一系列必要步骤：查找食谱、拟定食材清单，并向当地杂货店下单，安排食材配送到家。

代理式 AI 具备“链式思维”能力

这意味着这类 AI 系统能够执行一系列操作来响应单个请求。例如，如果您让 AI 代理“创建一个网站”，它可以执行完成这项任务所需的所有步骤。这意味着在收到这一个提示后，AI 代理便会完成一连串任务：编写结构代码、用内容填充页面、设计视觉效果，以及测试网页的响应速度。

代理式 AI 对于需要持续监控或快速决策的任务最为有用。代理式 AI 的优势包括：

提高生产力 - 将许多任务委托给 AI 代理，可让团队更专注于能为企业组织创造价值的核心项目。它就像一位全天候无休的实习生，持续高效工作。

降低成本 - 代理式 AI 可减少人为失误，从而消除因效率低下、疏忽遗漏和错误而产生的相关成本。

助力明智决策 - 代理式 AI 利用机器学习来筛选和处理海量实时数据，其处理的数据量远超人类所能处理的规模。从更大量的优质数据中获取洞察信息，能够得出更好的预测结果和策略。

改善用户体验 - 传统上，创建自动化工作流程需要具备工程和编码方面的专业知识。而有了代理式 AI，用户可以使用通俗易懂的语言与之交互，就像我们与 ChatGPT 等平台的交互方式。

同时，推理环节的重要性不容忽视。推理功能以及支持这些功能的硬件和软件，关系到 AI 战略的成败。要获得代理式 AI 的优势，也必须在推理方面实现成功。

为什么要关注 AI 推理

凭借这些独特的功能，代理式 AI 可用于多种用途。下面我们来看看代理式 AI 在各行业场景中的应用方式：

在业务运营方面，企业可以使用 AI 代理来管理供应链、优化库存水平、预测需求以及规划物流。
在医疗保健领域，AI 代理可以与患者互动、监测需求、执行治疗计划以及提供个性化支持。
在软件开发中，可以使用代理式 AI 自动生成调试代码、管理开发生命周期和设计系统架构，从而提高开发效率。
在软件运维方面，代理式 AI 可用于实现网络及其他 IT 基础架构或服务的自主运维。
在网络安全领域，代理式 AI 可帮助实时监测网络流量、发现问题并响应威胁，从而提升网络安全。
在科研领域，研究人员可以使用代理式 AI 来设计并开展实验、分析数据、提出新假设，以及通过比单个研究人员（或研究团队）更快的工作速度来加快创新步伐。
在金融和贸易领域，代理式 AI 能够不断分析市场趋势、做出交易决策，并根据其可获取的实时数据流调整策略，从而促进金融和贸易的发展。

探索生成式 AI 用例
探索预测性 AI 用例

代理式 AI 使我们朝着创建能够独立运行、有效协作并从与数据的交互中学习的智能系统更近了一步。代理式 AI 之所以有效，是因为它采用了一个称为代理式工作流的过程。

代理式工作流是由 AI 代理管理和完成的一系列结构化行动。当 AI 代理被指派了一个要完成的目标时，它会通过将任务分解为更小的单个步骤来开始工作流，然后执行这些步骤。

为了执行这一系列步骤，一个 AI 代理会创建自身的多个版本，从而形成一个多代理系统（MAS）。在该工作流中，主代理（也称为元代理、编排者或监督者）会将任务委派给其他代理，分配相应的值，并在反馈循环中与记忆进行交互。这些代理组成的委员会将并行工作，直到整体目标完成。

在这个 MAS 内，每个代理都拥有一个内部结构，使其既能在系统中独立运作，又能协同工作。这种协作依赖于共享的记忆存储，其中提供了有关个体知识、过往经验以及信念状态的背景信息。

代理式工作流有助于创造性地解决问题，但这种创造性需要加以管控，以避免系统出现失控行为。AgentOps（代理运维）是一套工具框架，用于在 AI 的“大脑”做出决策时对其进行实时监控。

代理的行为具有非确定性，即其行为由一系列随机概率分布决定，无法被精准预判。这种不可预测性让代理能够探索创新性路径来解决问题。但在生产环境中，缺乏可解释性的自主行为会带来潜在风险。

可以将 AgentOps 理解为，一种为自主式 AI“员工”管理和设置参数的方式。它有助于确保代理在接受任务后，能够高效、安全地完成工作，且不会超出设定的预算。

进一步了解 AgentOps

如果说生成式 AI 侧重于创造，那么代理式 AI 则侧重于执行。生成式 AI 会利用预测性建模和线性回归来创作新内容。代理式 AI 则使用数学系统基于预测性建模做出决策，但它还会更进一步，代表用户执行一个或一系列行动。

生成式 AI 依据我们输入的提示来生成输出内容。代理式 AI 与传统 AI 的不同之处在于，它有能力主动发起行动。例如，AI 代理能够基于其可获取的信息自行创建额外的提示及输出内容。

代理式 AI 与生成式 AI：有何区别

检索增强生成（RAG）是一种通过将 LLM 关联到替代指令提示或外部资源，从而从生成式 AI 应用中获取更好答案的方法。代理式 RAG 在传统 RAG 的基础上更进一步，它使 LLM 能够主动调查，而不仅仅是检索。

虽然 RAG 能够检索答案，并从其可获取的文档和数据集中提供一些上下文信息，但它依赖于手动提示词工程。传统 RAG 的上下文感知能力也较为有限，并且完全依赖于初始查询来检索相关信息。

相对而言，代理式 RAG 更加复杂且更具动态性。它能够自行提出问题，依据自身的记忆构建语境，并且在未被明确要求的情况下执行额外的任务。这种超越传统 RAG 的特点，使得代理式 RAG 具备了在无需您手动干预的情况下，代表你做出更明智决策的能力。

例如，使用传统 RAG，您可以向聊天机器人查询某公司的退货政策。而使用代理式 RAG 时，您的查询不仅可以告知退货政策，还可以提示您发起退货的选项。在此之后，AI 代理可以负责处理填写退货表单的相关事宜，包括填入您的订单号、验证您的信用卡信息以便退款，并代表您完成整个交易。

当代理式 AI 系统需连接外部资源时，可采用模型上下文协议（MCP）。MCP 是一项开源协议，可实现 AI 应用与外部服务之间的双向连接和标准化通信。

MCP 使 AI 系统能够以简单且可靠的方式虚拟“接入”不同的数据源和工具。它就如同 USB-C 线缆，可将设备与配件相连接并实现数据传输。

MCP 和代理式 AI 相辅相成，共同打造智能 AI 系统。借助 MCP，AI 系统可以与更广泛的数字生态系统交互，为用户完成任务。如果没有 MCP，代理式 AI 可以进行思考和规划（生成式 AI 的所有特征），但无法与任何外部系统进行交互。

探索红帽的 MCP 服务器集合

代理式 AI 为我们众多系统带来了创新和效率提升的可能性。然而，目前仍有一些道德规范和技术问题有待解决。例如，我们如何确保代理式系统与我们的价值观相符？当代理式 AI 出现失误时，应由谁来负责？在某些情况下，我们会遇到透明度方面的挑战，因为我们无法确切知道代理是如何得出它所提供的输出结论的（这也被称为“黑箱”问题）。

从隐私和安全的角度来看，我们必须谨慎且周全地对待我们构建或使用的任何 AI 模型。也就是说，要确保在构建架构时设置好安全参数，以保护数据的流转。

如果您为 AI 开放信息访问权限以提供上下文支持，就需要对这类信息严格保密，尤其是在计划实施主权 AI实践的情况下。要在主权 AI 系统内运行代理式 AI，代理、知识图谱和后端系统的训练与认证均应在该代理管辖的物理空间内进行。

同样值得注意的是，代理式 AI 需要大量的计算资源，包括很强的处理能力和极大的存储需求。为应对这些繁重的工作负载，开发人员可以使用 vLLM 等推理库。vLLM 能够同时处理多个代理请求，加快输出速度。它还能运用分布式推理等技术将工作负载扩展到多个 GPU，这有助于降低每个代理的硬件成本。

最后，就像任何新兴技术一样，这里也存在一个学习曲线。实施和管理 LLM 的代理式工作流需要具备专业技能，在企业层面尤其如此。

进一步了解主权 AI

红帽® AI 旨在通过 vLLM 驱动的服务器实现快速、灵活且高效的推理。它将模型与数据进行可靠连接，在单个平台上统一实现专业代理的自定义和开发工作。我们的产品建立在开源基础之上，让您能够端到端全方位掌控任意规模的 AI 工作流。

红帽 AI 产品组合包含红帽 AI Enterprise：这是一个用于在任何基础架构上部署、管理和扩展 AI 推理、代理式 AI 工作流和 AI 赋能应用的平台。

探索红帽 AI

扩展阅读

What is Mixture of Experts (MoE)?

混合专家模型（MoE）是一种模型架构技术，通过将任务路由至模型中最适配的模块，来提升 AI 推理速度。

What is AgentOps?

AgentOps（代理运维）是一套工具框架，用于实时监控 AI 在制定决策时的“大脑”运行情况。

What is sovereign AI?

主权 AI 意味着拥有 AI 技术，将数据保留在本地，并确保您的系统能够体现您的独特价值观和法律要求。

什么是代理式 AI？

红帽资源

释放代理式 AI 的力量

自适应企业：AI 就绪，从容应对颠覆性挑战

扩展阅读

What is Mixture of Experts (MoE)?

What is AgentOps?

What is sovereign AI?

AI/ML 相关资源

平台

工具

试用购买与出售

联系我们

关于红帽

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links