什么是代理式 AI?
代理式 AI 是一种软件系统,旨在以尽可能少的人工干预实现与数据和工具的交互。代理式 AI 强调目标导向行为,可以通过创建一系列步骤并自主执行这些步骤来完成任务。
您可以将代理式 AI 视作自动化与大语言模型(LLM)的创造力相结合的产物。想要将代理式 AI 投入实际应用,您需要创建一个系统,为 LLM 提供访问外部工具的权限,并通过算法来提供指令,指示 AI 代理应该如何使用这些工具。
代理式 AI 与工具的交互方式涉及编排,具体采用流程还是图表形式,取决于所使用的框架。这种方法支持 LLM 进行“推理”,并确定回答问题的最佳方式,例如判断查询是否可通过现有信息解答,或是否需要执行外部搜索。
代理式 AI 有哪些功能?
您可以将 AI 代理看作一种顶层实体,相当于运维和管理其他软件工具的“管理员”。代理式 AI 可以是一种物理结构、一个软件程序,或二者的结合体。
机器人系统中的 AI 代理可能会使用摄像头、传感器和监控器来收集周围环境的数据,并与软件一同运行这些信息,以决定下一步行动。这一过程称为“传感器融合”。
此外,软件环境中的代理式 AI 还会从其他来源(例如 API、在线搜索、文本提示和数据库)收集数据,帮助 AI 代理形成认知感和情境意识。
下面我们深入探讨代理式 AI 的部分专属功能与特性:
代理式 AI 具备适应性与动态性
代理式 AI 能够从过往模式和数据中学习。这意味着代理式 AI 可以根据其接收到的全新或不断变化的信息实时更改策略。传统的工作流只会向前推进,而代理式 AI 的工作流不仅能够前后移动,其间还可以回溯和修正错误。也就是说,代理式 AI 可以主动预测需求,并反思其工作。
例如,自动驾驶汽车可能会使用代理式 AI 来提高其分辨能力,判断路面上的物体是垃圾还是松鼠。通过持续监控并分析自身行为,代理式 AI 能够优化行动结果。
代理式 AI 可独立管理并完成任务
代理式 AI 有时也被称为自主式 AI。这是因为它能够代表人类用户或另一 AI 代理与其他 AI 系统和数字基础架构进行通信与协作。
例如,您可以告诉 AI 代理,今天晚餐您想做意大利面。AI 代理随后可完成一系列必要步骤:查找食谱、拟定食材清单,并向当地杂货店下单,安排食材配送到家。
代理式 AI 具备“链式思维”能力
这意味着这类 AI 系统能够执行一系列操作来响应单个请求。例如,如果您让 AI 代理“创建一个网站”,它可以执行完成这项任务所需的所有步骤。这意味着在收到这一个提示后,AI 代理便会完成一连串任务:编写结构代码、用内容填充页面、设计视觉效果,以及测试网页的响应速度。
红帽资源
代理式 AI 的优势
代理式 AI 对于需要持续监控或快速决策的任务最为有用。代理式 AI 的优势包括:
提高生产力 - 将许多任务委托给 AI 代理,可让团队更专注于能为企业组织创造价值的核心项目。它就像一位全天候无休的实习生,持续高效工作。
降低成本 - 代理式 AI 可减少人为失误,从而消除因效率低下、疏忽遗漏和错误而产生的相关成本。
助力明智决策 - 代理式 AI 利用机器学习来筛选和处理海量实时数据,其处理的数据量远超人类所能处理的规模。从更大量的优质数据中获取洞察信息,能够得出更好的预测结果和策略。
改善用户体验 - 传统上,创建自动化工作流程需要具备工程和编码方面的专业知识。而有了代理式 AI,用户可以使用通俗易懂的语言与之交互,就像我们与 ChatGPT 等平台的交互方式。
代理式 AI 用例
凭借这些独特的功能,代理式 AI 可用于多种用途。下面我们来看看代理式 AI 在各行业场景中的应用方式:
- 在业务运营方面,企业可以使用 AI 代理来管理供应链、优化库存水平、预测需求以及规划物流。
- 在医疗保健领域,AI 代理可以与患者互动、监测需求、执行治疗计划以及提供个性化支持。
- 在软件开发中,可以使用代理式 AI 自动生成调试代码、管理开发生命周期和设计系统架构,从而提高开发效率。
- 在软件运维方面,代理式 AI 可用于实现网络及其他 IT 基础架构或服务的自主运维。
- 在网络安全领域,代理式 AI 可帮助实时监测网络流量、发现问题并响应威胁,从而提升网络安全。
- 在科研领域,研究人员可以使用代理式 AI 来设计并开展实验、分析数据、提出新假设,以及通过比单个研究人员(或研究团队)更快的工作速度来加快创新步伐。
- 在金融和贸易领域,代理式 AI 能够不断分析市场趋势、做出交易决策,并根据其可获取的实时数据流调整策略,从而促进金融和贸易的发展。
什么是代理式工作流?
代理式 AI 使我们朝着创建能够独立运行、有效协作并从与数据的交互中学习的智能系统更近了一步。代理式 AI 之所以有效,是因为它采用了一个称为代理式工作流的过程。
代理式工作流是由 AI 代理管理和完成的一系列结构化行动。当 AI 代理被指派了一个要完成的目标时,它会通过将任务分解为更小的单个步骤来开始工作流,然后执行这些步骤。
为了执行这一系列步骤,一个 AI 代理会创建自身的多个版本,从而形成一个多代理系统(MAS)。在该工作流中,主代理(也称为元代理、编排者或监督者)会将任务委派给其他代理,分配相应的值,并在反馈循环中与记忆进行交互。这些代理组成的委员会将并行工作,直到整体目标完成。
在这个 MAS 内,每个代理都拥有一个内部结构,使其既能在系统中独立运作,又能协同工作。这种协作依赖于共享的记忆存储,其中提供了有关个体知识、过往经验以及信念状态的背景信息。
代理式 AI 和生成式 AI
如果说生成式 AI 侧重于创造,那么代理式 AI 则侧重于执行。生成式 AI 会利用预测性建模和线性回归来创作新内容。代理式 AI 则使用数学系统基于预测性建模做出决策,但它还会更进一步,代表用户执行一个或一系列行动。
生成式 AI 依据我们输入的提示来生成输出内容。代理式 AI 与传统 AI 的不同之处在于,它有能力主动发起行动。例如,AI 代理能够基于其可获取的信息自行创建额外的提示及输出内容。
什么是代理式 RAG?
检索增强生成(RAG)是一种通过将 LLM 关联到替代指令提示或外部资源,从而从生成式 AI 应用中获取更好答案的方法。代理式 RAG 在传统 RAG 的基础上更进一步,它使 LLM 能够主动调查,而不仅仅是检索。
虽然 RAG 能够检索答案,并从其可获取的文档和数据集中提供一些上下文信息,但它依赖于手动提示词工程。传统 RAG 的上下文感知能力也较为有限,并且完全依赖于初始查询来检索相关信息。
相对而言,代理式 RAG 更加复杂且更具动态性。它能够自行提出问题,依据自身的记忆构建语境,并且在未被明确要求的情况下执行额外的任务。这种超越传统 RAG 的特点,使得代理式 RAG 具备了在无需您手动干预的情况下,代表你做出更明智决策的能力。
例如,使用传统 RAG,您可以向聊天机器人查询某公司的退货政策。而使用代理式 RAG 时,您的查询不仅可以告知退货政策,还可以提示您发起退货的选项。在此之后,AI 代理可以负责处理填写退货表单的相关事宜,包括填入您的订单号、验证您的信用卡信息以便退款,并代表您完成整个交易。
代理式 AI 和模型上下文协议(MCP)
当代理式 AI 系统需连接外部资源时,可采用模型上下文协议(MCP)。MCP 是一项开源协议,可实现 AI 应用与外部服务之间的双向连接和标准化通信。
MCP 使 AI 系统能够以简单且可靠的方式虚拟“接入”不同的数据源和工具。它就如同 USB-C 线缆,可将设备与配件相连接并实现数据传输。
MCP 和代理式 AI 相辅相成,共同打造智能 AI 系统。借助 MCP,AI 系统可以与更广泛的数字生态系统交互,为用户完成任务。如果没有 MCP,代理式 AI 可以进行思考和规划(生成式 AI 的所有特征),但无法与任何外部系统进行交互。
代理式 AI 的限制和注意事项
代理式 AI 为我们众多系统带来了创新和效率提升的可能性。然而,目前仍有一些道德规范和技术问题有待解决。例如,我们如何确保代理式系统与我们的价值观相符?当代理式 AI 出现失误时,应由谁来负责?在某些情况下,我们会遇到透明度方面的挑战,因为我们无法确切知道代理是如何得出它所提供的输出结论的(这也被称为“黑箱”问题)。
从隐私和安全的角度来看,我们必须谨慎且周全地对待我们构建或使用的任何 AI 模型。也就是说,要确保在构建架构时设置好安全参数,以保护数据的流转。
同样值得注意的是,代理式 AI 需要大量的计算资源,包括很强的处理能力和极大的存储需求。其环境影响也不容忽视。
最后,就像任何新兴技术一样,这里也存在一个学习曲线。实施和管理 LLM 的代理式工作流需要具备专业技能,在企业层面尤其如此。
红帽能如何提供帮助?
对于仍处于探索阶段、试图发掘生成式 AI 优势的企业组织而言,AI 代理可能是发现切实商业价值的关键所在。红帽® AI 以及我们的 AI 合作伙伴生态系统可以帮助您设计用于构建代理式工作流以及扩展 AI 代理的框架。
红帽 OpenShift® AI 提供了一个用于创建多代理系统的统一平台。此外,AI 代理所运用的自适应学习与推理可通过 OpenShift 的 MLOps 功能来进行控制。
开启企业 AI 之旅:新手指南
此新手指南介绍了红帽 OpenShift AI 和红帽企业 Linux AI 如何加快您的 AI 采用之旅。