代理式 AI 与生成式 AI:有何区别
代理式 AI 和生成式 AI(gen AI)均能通过协助、增强和优化任务及流程来提高生产力。它们都依托于大语言模型(LLM),属于人工智能的不同形式。
二者的显著区别在于:代理式 AI 为主动型,而生成式 AI 为被动型。
- 代理式 AI 是一种无需过多人工监督,便能主动设定并完成目标的系统。若实现目标的部分环节涉及内容创作,则生成式 AI 工具可以胜任这项任务。此时,代理式 AI 便成为用户和/或系统的代理执行者。
- 生成式 AI 则是一种根据提示创作新内容的工具。它可作为代理式系统的一个组成部分,但无法自行完成任务。它不具备代理自主性。
代理式 AI 和生成式 AI 实为协同工作的关系。代理式 AI 系统可以使用生成式 AI 与用户展开对话、自主创作内容以助力实现更大目标,或是与外部工具进行通信。换言之,生成式 AI 是代理式 AI“认知”过程中至关重要的一环。
代理式 AI 与生成式 AI 有何区别?
代理式 AI 与生成式 AI 之间的界限可能并不明确,因为二者都以用户输入的提示(prompt)开始,也通常都以类似聊天机器人的形式呈现。此外,许多原本纯粹属于生成式 AI 的应用,如今都融入了代理元素,而且这一趋势未来很可能持续深化。
例如,当下许多热门的聊天机器人平台(ChatGPT、Gemini、Claude 等)都会自动启动 Web 搜索、解析数据,并将结果作为对话内容的一部分返回给用户。这便是代理式 AI 的一种初级形态。
代理式 AI 与生成式 AI 的差异:自主行动与工具协作能力
为更清晰地阐释这两种技术的差异,我们来探讨一个假设用例:
一位销售代表希望借助 AI 撰写一封跟进电子邮件,发送给潜在销售客户。
若使用生成式 AI,销售代表需要打开生成式 AI 界面,输入类似这样的提示:“就我们的提案,撰写一封礼貌而专业的跟进电子邮件给 Maria Wang。”生成式 AI 会立即生成一份电子邮件草稿,至此其任务便已完成。接下来,销售代表需复制文本,将其粘贴到电子邮件中,输入收件人电子邮件地址,然后点击发送。
现在,让我们来探究一下代理式 AI 如何处理类似的任务。
在代理式系统中,销售代表可在其客户关系管理(CRM)系统中设置一条规则或指令。例如:“对于所有标记为‘需要跟进’的销售线索,等待两个工作日后发送一封跟进电子邮件。”
当销售代表将 Maria Wang 标记为“需要跟进”后,代理式工作流随即启动。系统会根据既定指令(初始提示)并在外部工具的协助下,自主制定并执行计划。具体计划可能如下所示:
1) 两个工作日后,系统向代理式工作流发送请求。
2) 系统从 CRM 中检索 Maria 的详细资料。
3) 另一工具提取关于 Maria 的更多信息(客户历史记录、个性化详细信息、公司信息等),为跟进电子邮件提示提供背景信息。
4) 系统创建生成跟进电子邮件的提示,并将其提供给集成的生成式 AI 模型,由该模型编写电子邮件文本。
5) 系统向销售代表提供跟进电子邮件的草稿,供其审核通过或退回要求重新撰写。
6) 如果销售代表批准该邮件,系统将通过应用编程接口(API)调用 Maria 的电子邮件服务。
7) 系统向 Maria 发送电子邮件。
8) 系统更新 CRM 系统,显示电子邮件已发送。
代理式 AI 与生成式 AI 的差异:适应能力
这两种类型的 AI 都具有适应性,但方式不同。生成式 AI 的适应性体现在,能针对不同场景、以多种风格生成内容;代理式 AI 则能根据环境条件的变化或新获取的信息,灵活调整自身的计划与策略。
代理式 AI 为原本被归类为机器人流程自动化(RPA)的工作负载提供了新的框架。AI 的融入使代理能够更好地适应运行时环境的变化。例如,屏幕抓取机器人难以应对目标站点的细微变化,而代理式 AI 可以适应这些变化并调整其收集数据的方法。因此,AI 赋能的代理能够在以往需要人工干预的层面上自主运行。
上下文理解
代理式 AI 根据上下文来采取行动。代理式系统可以访问:
- 初始提示。
- 数字或物理环境的状态或条件。
- 可用工具(API 访问、生成式 AI 应用等)。
- 记忆信息及过往行动记录。
结合所有这些信息,再利用有助于分析数据的数学公式,代理式系统便能形成对上下文的理解。在此基础上,系统便能够进行“推理”并采取行动。
与此同时,生成式 AI 则利用上下文进行创作。由于生成式 AI 的目标是生成新内容,生成式应用可获取以下信息:
- 提示。
- 历史对话记录。
- 训练所用的数据。
实施 AI 技术的 4 个关键注意事项
什么是代理式 AI?
代理式 AI 是一种软件系统,旨在以尽可能少的人工干预实现与数据和工具的交互。该系统以“目标导向行为”为核心特点,能够通过自主制定步骤并执行来完成任务。代理式 AI 可以自主设定目标,将任务分配给其他 AI 代理或外部工具,并能适应未曾接受训练的新场景或非结构化条件。
AI 代理(又称为 AI 智能体)是代理式系统的组成部分。您可以将 AI 代理看作一种顶层实体,相当于运维和管理其他软件工具的“管理员”。代理式 AI 可以是一种物理结构、一个软件程序,或二者的结合体。
机器人系统中的 AI 代理可能会使用摄像头、传感器和监控器来收集周围环境的数据,并与软件一同运行这些信息,以决定下一步行动。举个典型例子:自动驾驶车辆在道路上遇到障碍物时,会自主判断是需要刹车还是继续前行。
此外,软件环境中的代理式 AI 还会从其他来源(例如 API、在线搜索、文本提示和数据库)收集数据,帮助 AI 代理形成认知感和情境意识。以我们之前提到的员工为例,该员工希望实现一项多步骤任务的自动化,即在与潜在客户会面后自动发送个性化的跟进电子邮件,而代理式 AI 便能满足此类需求。
代理式 AI 是如何运作的?
代理式 AI 可以通过三个步骤来解决问题:感知、规划和行动。它拥有“链式处理”能力,这意味着它能够执行一系列操作来回应单个请求或提示。
例如,如果您让 AI 代理创建一个网站,它能完成所有必要步骤。也就是说,仅需一个提示,AI 代理便能够编写结构代码、填充页面内容、设计视觉效果,以及测试网站的响应速度。
因此,代理式 AI 既是“执行者”,又是“项目经理”。它能够克服遇到的任何障碍并主动采取行动,比如自行生成提示以帮助解答出现的问题。
什么是代理式工作流?
代理式 AI 之所以有效,是因为它采用了一个称为“代理式工作流”的过程。代理式工作流可由代理、机器人和人员协同编排构成,是一套为达成特定目标而设计的端到端流程。它在衔接数字世界与物理世界的同时,也融入了人类监督环节。
代理式工作流是由 AI 代理管理并完成的一系列结构化操作,有时会加入人工干预。当 AI 代理接到待完成目标后,便会启动工作流,先将任务拆解为更小的步骤,然后依次执行这些步骤。
为执行这些步骤,一个 AI 代理会创建自身的多个版本,从而形成一个多代理系统(MAS)。在该工作流中,主代理(也称为元代理、编排者或监督者)可能会创建新代理,并将任务委派给它们,分配相应的值,并在反馈循环中与记忆进行交互。这些代理并行工作,直至达成整体目标。
在这个 MAS 内,每个代理都拥有一个内部结构,使其既能在系统中独立运作,又能协同工作。这种协作依赖于共享的记忆存储,其中提供了有关个体知识、过往经验以及信念状态的背景信息。
代理式 AI 用例
代理式 AI 擅长动态解决问题和制定决策。以下是其在特定行业中的部分用例:
制造业:代理式工作流可帮助管理供应链、优化库存水平、预测需求以及规划物流。
医疗保健:代理式 AI 可以与患者展开互动,包括监测需求、执行治疗方案及提供个性化支持。
软件开发:代理式 AI 可以自动生成调试代码、管理开发生命周期和设计系统架构。
员工个性化支持:代理式 AI 可以根据情况变化调整方法,并提供量身定制的主动支持。例如,它可协助完成日程安排、解答疑问、员工入职培训等任务。
金融风险管理:在金融和贸易领域,代理式 AI 能够分析市场趋势、做出交易决策,并根据实时数据流调整策略,从而促进发展。
什么是生成式 AI?
生成式 AI 是一种能够生成文本、视频、音频和软件代码等新内容的人工智能技术。它借助深度学习来计算词语之间的统计关联,并基于训练数据、模式识别及概率算法来生成输出内容。
生成式 AI 是被动响应式的,这意味着它必须接收到特定的查询提示后,才会生成响应内容。它无法自行设定目标、委派任务,也不能适应未经过训练的新场景或非结构化环境。
生成式 AI 应用的内容创作能力受限于其训练所用的数据。但是,您可以使用检索增强生成(RAG)等技术来整合外部数据源,从而提升生成式 AI 模型输出内容的准确性。
生成式 AI 用例
生成式 AI 主要通过提供信息与方案来辅助人类决策,而用户可选择采纳或舍弃。其常见用例包括:
文本创作:生成式 AI 工具几乎能针对任何主题的写作提示生成书面内容。这些工具还可根据不同的长度和文风要求,调整自己撰写的内容。
生成图像与视频:生成式 AI 图像工具可创作高质量图片,还能为现有作品添加新元素。许多生成式 AI 应用还提供短视频生成功能,只需输入提示即可快速生成短片。
生成语音与音乐:AI 智能声乐工具可以使用书面文本和人声样本音频,创建模仿真人声音的叙述或歌声。还有些工具可以根据用户提示或样本创作人工合成音乐。
生成和补全代码:一些生成式 AI 工具可以接受书面提示,应要求输出计算机代码来协助软件开发人员。
增强数据:当使用真实数据不可行或不可取时,生成式 AI 可以创建大量合成数据。例如,如果要训练一个模型来理解机密数据,但不能包含任何个人身份信息,那么合成数据就很有用。此外,您也可以使用这些数据来把较小或不全的数据集扩展为较大的合成数据集,然后用于训练或测试。
治理、安全与信任方面的考量因素
在探讨代理式 AI 时,人们最常见的担忧或许是:当一个自主系统出错时,责任应由谁承担?换言之,该如何平衡自主性与监督管理?
人机协作
在实施代理式系统之前,务必要构建一个涵盖问责制、透明度和控制权的框架。
以我们之前提到的销售代表为例:该员工使用 AI 向潜在客户发送电子邮件,但多半会想要在发送电子邮件前先检查下邮件内容。
代理式 AI 可以独立做出决策,且只需极少的人工干预。但这也意味着,在提升效率的同时,会舍去对过程的全面监督。解决方案之一是将资源集中投入到测试与验证环节。这意味着要保持“人机协同”的思维模式,对系统行动进行监控,防止出现判断失误。
在实施生成式 AI 系统时,同样需考量信任与安全因素。生成式 AI 最显著的风险在于,其可能制造错误信息或虚假信息。这既包括固化有害偏见和刻板印象的情况,也包括出于恶意目的制作深度伪造图像的行为。此外,用户还务必要警惕“幻觉”(即看似真实却并不准确的输出内容),应对答案进行事实核查,切忌轻信。
隐私和安全
代理式 AI 具备访问外部数据库的能力,这使其面临更多安全与隐私风险。因此,您需要构建安全框架来保护工作流中进出数据的安全。
生成式 AI 同样可能带来安全风险。一方面,用户可能会在缺乏安全防护的应用中输入敏感信息;另一方面,生成式 AI 可能会复制受版权保护的材料,或未经同意擅自使用他人的声音或身份,进而引发法律风险。
红帽能如何提供帮助?
红帽® AI 是我们专门针对企业组织需求而构建的 AI 产品组合,它筑基于深受客户信赖的红帽解决方案。有了这种稳健的基础,我们的产品就能始终可靠、灵活且可扩展。
红帽 AI 可以助力企业组织:
- 采用 AI 并进行创新。
- 拆解交付 AI 解决方案的复杂流程。
- 随时随地部署。
立足坚实基石,就能拥抱开放,选择无限
红帽 AI 解决方案同时支持生成式 AI 和预测性 AI 的能力。凭借自带模型的灵活性,红帽支持您专门针对自己的业务用例训练和微调基础模型。
建议从红帽企业 Linux® AI 入手,它是一个基础模型平台,可帮助您针对企业应用开发、测试并运行 LLM 和 SLM。这个 AI 平台可为开发人员提供可快速启用的单个服务器环境,内置 LLM 与 AI 工具链,涵盖模型调优与生成式 AI 应用构建所需的一切要素。
在此基础上,您还可进一步了解红帽 OpenShift® AI,它为创建多代理系统提供了一个统一的平台。此外,您可以借助红帽 OpenShift 的 MLOps 能力来控制 AI 代理所运用的自适应学习与推理。
此外,我们的 AI 合作伙伴生态系统也在不断壮大。各种技术合作伙伴与红帽携手合作,以认证他们的产品能否与红帽 AI 产品无缝衔接。这样,您就可以有更多的选择。
开启企业 AI 之旅:新手指南
此新手指南介绍了红帽 OpenShift AI 和红帽企业 Linux AI 如何加快您的 AI 采用之旅。