エージェント型 AI と生成 AI

URL をコピー

エージェント型 AI生成 AI はいずれも、タスクとプロセスの支援、補強、最適化により、生産性にメリットをもたらします。どちらも大規模言語モデル (LLM) を使用する人工知能の一形態です。 

この 2 つを比較する場合、エージェント型 AI はプロアクティブ、生成 AI はリアクティブと捉えることができます。 

  • エージェント型 AI は、人間の監視を最小限に抑えながら、プロアクティブに目標を設定して達成できるシステムです。目標達成のためにコンテンツの作成が必要な場合は、生成 AI ツールがそのタスクを処理します。エージェント型 AI は、ユーザーやシステムのエージェントとなります。
  • 生成 AI は、プロンプトに反応して新しいコンテンツを作成するツールです。エージェント型システムのコンポーネントとして使用できますが、単独でタスクを完了することはありません。生成 AI はエージェントではありません

エージェント型 AI と生成 AI は、連携して動作します。エージェント型 AI システムは、ユーザーと会話したり、より大きな目標の一部としてコンテンツを自立的に作成したり、外部ツールとコミュニケーションしたりするために生成 AI を使用することがあります。言い換えれば、生成 AI はエージェント型 AI の「認知」プロセスにおける重要な部分です。 

エージェント型 AI のユースケースを見る

エージェント型 AI と生成 AI の境界線は曖昧に感じることがあります。どちらもユーザーからのプロンプトで始まり、通常はチャットボットのような形式で存在するからです。さらに、かつては純粋な生成 AI だった多くのアプリケーションにエージェント型要素が組み込まれるようになっており、この傾向は今後も続く見込みです。 

たとえば、人気のチャットボット・プラットフォーム (ChatGPT、Gemini、Claude など) の多くは、自動的に Web 検索を開始し、データを解析し、それを会話の一部として返します。これはエージェント型 AI の初期のかたちです。  

エージェント型 AI と生成 AI の違いは、独立して動作し、外部ツールと連携する能力にある

これら 2 つのテクノロジーの違いをより適切に説明するために、仮定のユースケースを見てみましょう。 

ある営業担当者が、AI を使用してセールスリードにフォローアップのメールを作成したいと考えています。 

生成 AI では、営業担当者が生成 AI のインタフェースを開き、「私たちの提案について、Maria Wan さんへの丁寧でプロフェッショナルなフォローアップメールを作成してください」といったプロンプトを入力します。生成 AI は即座にメールの下書きを生成し、その目的を果たします。このテキストをコピーしてメールに貼り付け、受信者のメールアドレスを入力し、クリックして送信するのは、営業担当者の責任になります。

では、エージェント型 AI が同様のタスクをどのように処理するかを見てみましょう。 

エージェント型システムでは、営業担当者が顧客関係管理 (CRM) システムにルールやコマンドを設定します。たとえば、「「フォローアップが必要」とマークしているセールスリードには、2 営業日待ってからフォローアップのメールを送信してください」といったものになります。

営業担当者が Maria Wang さんに「フォローアップが必要」というマークを付けると、エージェント型ワークフローがトリガーされます。システムには指示 (最初のプロンプト) があり、外部ツールを利用して実行に移す計画を独立して作成します。計画は次のようになります。 

1) 2 営業日後、システムがエージェント型ワークフローにリクエストを送信します。

2) システムが CRM から Maria さんの詳細情報を取得します。

3) 別のツールで、Maria さんに関する追加情報 (顧客履歴、パーソナライゼーションの詳細、企業情報など) を取得します。これらはフォローアップメールのプロンプトのコンテキストとなります。

4) システムがフォローアップメールのプロンプトを作成し、統合された生成 AI モデルに提供することで、メールのテキストが作成されます。

5) システムがフォローアップメールの原稿を営業担当者に提供し、営業担当者はそのメールを承認するか、改訂するよう差し戻します。

6) 営業担当者がメールを承認すると、システムは Maria さんのメールサービスに対してアプリケーション・プログラミング・インタフェース (API) 呼び出しを実行します。

7) システムがメールを Maria さんに送信します。 

8) システムが CRM を更新し、メールが送信されたことが示されます。 

エージェント型 AI と生成 AI の適応能力の違い 

どちらのタイプの AI も、それぞれに適応性があります。生成 AI には、異なるコンテキストに従ってさまざまなスタイルでコンテンツを生成するという適応性があります。エージェント型 AI には、環境条件や新しい情報の変化に応じて計画と戦略を調整するという適応性があります。  

エージェント型 AI は、これまではロボティック・プロセス・オートメーション (RPA) として分類されていたワークロードのフレームワークを提供します。AI を実装することで、エージェントはランタイム環境の変化に対する適応性が大幅に向上します。たとえば、スクリーンスクレイピング・ボットではターゲットサイト上の変化が小さなものであっても対応するのが困難ですが、エージェント型 AI は変化に適応し、データ収集のアプローチを調整することができます。したがって、AI 搭載エージェントは、これまで人間が入力しなければならなかったようなレベルで動作できます。

コンテキストの理解

エージェント型 AI は、コンテキストを使用してアクションを実行します。エージェント型システムは以下にアクセスできます。

  • 最初のプロンプト
  • デジタル環境または物理環境の状態または条件
  • 利用可能なツール (API アクセス、生成 AI アプリケーションなど)
  • メモリーと過去のアクション

エージェント型システムはこれらすべての情報に加えて、データのナビゲートを支援する数式を使用することでコンテキストを理解できます。これにより、「推論」を行い、アクションを実行することができます。 

一方、生成 AI はコンテキストを使用して作成を行います。生成 AI の目的は新しいコンテンツを生成することであるため、生成アプリケーションは次のものにアクセスできます。

  • プロンプト
  • 会話履歴
  • トレーニングに使用されたデータ

生成 AI はこれらの情報に加えて、機械学習手法とディープラーニング・アルゴリズムを使用して、情報を引き出し、つながりを作り、出力を生成できます。 

AI テクノロジーの導入に関する 4 つのキーポイント

実際のアプリケーションで機能するには、エージェント型 AI モデルも生成 AI モデルも推論を実行する必要があります。推論では、LLM がライブデータを処理し、リアルタイムの予測を行います。 

生成 AI は通常、推論を 1 回実行してコンテンツ (1 つの画像や段落など) を作成しますが、エージェント型 AI は多くの場合、推論ループを繰り返し実行します。これは、エージェント型 AI がより複雑なマルチステップのタスクを解決するからであり、そのために、基盤となる LLM により多くのことを要求します。このようなリソースの需要に対応するには処理能力が必要であるため、推論サーバーが重要になります。

クラウド・インフラストラクチャ内で稼働する推論サーバーは、ハードウェアとユーザー向けアプリケーションの間の橋渡し役として機能します。その役割は、リソース要求を管理し、処理が可能な限り迅速に行われるようにすることによって、モデルを最適化することです。 

この分野を牽引するツールが vLLM です。vLLM は、メモリー効率の高い推論サーバー兼エンジンであり、ハイブリッドクラウド環境における大規模言語モデルのスピードと処理能力を向上させるように設計されています。

vLLM の詳細はこちら

エージェント型 AI は、人間の介入を最小限に抑えながらデータやツールと対話するように設計されたソフトウェアシステムです。エージェント型 AI では目標指向の動作に重点が置かれており、手順を作成してそれを自律的に実行することでタスクを達成します。エージェント型 AI は、独自の目標を設定し、タスクを他の AI エージェントや外部ツールに委任し、トレーニングされていない新しい状況や構造化されていない状況に適応できます。  

AI エージェントは、エージェントシステム内のコンポーネントです。AI エージェントは、他のソフトウェアツールの上に配置され、それらを操作するエンティティと捉えることができます。エージェント型 AI は、物理的な構造の中で、または、ソフトウェアプログラムとして提供され、その 2 つの組み合わせたものもあります。

ロボットシステムの AI エージェントは、カメラ、センサー、モニターを使用して環境に関するデータを収集し、その情報をソフトウェアと並行して実行して、次のステップを決定します。わかりやすい例を挙げると、自律走行車が道路上のゴミに遭遇し、ブレーキをかけるか、そのまま進み続けるかを判断するようなものです。 

一方、ソフトウェア環境におけるエージェント型 AI は、API、オンライン検索、テキストプロンプト、データベースなど、エージェントが知覚や文脈を認識するのに役立つ他のソースからデータを収集します。前述の例、つまり見込み客とのミーティング後に、パーソナライズされたフォローアップメールを送信するという多段階のタスクを自動化したいと考えている従業員のケースを思い出してください。 

エージェント型 AI の仕組み

エージェント型 AI は、認識、計画、実行という 3 つのステップを踏むことで問題を解決できます。「チェーン」機能があり、1 つのリクエストやプロンプトに応答して一連のアクションを実行できます。 

たとえば、AI エージェントに Web サイトの作成を依頼すると、必要な手順をすべて実行できます。つまり、AI エージェントは 1 つのプロンプトから、サイト構築のためのコード作成、ページへのコンテンツの追加、ビジュアルのデザイン、応答性のテストを実行できます。

このように、エージェント型 AI は「実行者」や「プロジェクトマネージャー」と捉えることができます。遭遇する質問への回答に役立つ独自のプロンプトを作成するなど、あらゆる課題を乗り越えてアクションを開始できます。 

エージェント型ワークフローとは

エージェント型 AI は、エージェント型ワークフローと呼ばれるプロセスによって機能します。エージェント型ワークフローは、エージェント、ロボット、および人間のオーケストレーションで構成されます。それは特定の目標を達成するために設計されたエンドツーエンドのプロセスです。人間による監視を統合し、デジタル世界と物理世界の間のギャップを解消します。 

エージェント型ワークフローは、AI エージェントが管理して完了する構造化された一連のアクションであり、時には人間が関与することもあります。完了すべき目標が与えられると、AI エージェントは 1 つのタスクを小さな手順に分割し、それらの手順を実行することでワークフローを開始します。

それらの手順を実行するために、AI エージェントは自身のバージョンを他にも複数起動し、マルチエージェント・システム (MAS) を作成します。このワークフローでは、メインエージェント (メタエージェント、オーケストレーター、スーパーバイザーとも呼ばれる) が新しいエージェントを作成し、そのエージェントにタスクの権限を委任し、値を割り当てて、フィードバックループ内でメモリーと対話します。エージェントは、全体的な目標に到達するまで並行して動作します。

この MAS 内では、各エージェントは、システム内で独立して機能することも協調して機能することもできる内部構造で構成されています。このコラボレーションは、個人の知識、過去の経験、信念の状態に関するコンテキストを提供する共有メモリーストアに依存します。

エージェント型 AI と MCP

モデルコンテキストプロトコル (MCP) は、AI アプリケーションと外部サービス間の双方向接続と標準化された通信を可能にするオープンソース・プロトコルです。MCP は、AI システムがさまざまなデータソースやツールに仮想的に「プラグイン」するためのシンプルで信頼性の高い方法を提供します。MCP は、デバイスをアクセサリーに接続してデータを転送できる USB-C ケーブルのようなものです。

MCP とエージェント型 AI は相互に補完し合い、インテリジェントな AI システムの構築を可能にします。MCP により、AI システムはより広範なデジタルエコシステムと連携して、ユーザーのタスクを実行することができます。MCP がなくてもエージェント型 AI は思考して計画を立てることはできますが (生成 AI の特性として)、外部システムと対話することはできません。

エージェント型 AI のユースケース

エージェント型 AI は、動的な問題解決と意思決定に優れています。エージェント型 AI の業界固有のユースケースには、次のようなものがあります。

製造:エージェント型ワークフローは、サプライチェーンの管理、在庫レベルの最適化、需要の予測、物流の計画に役立ちます。 

医療:エージェント型 AI は、ニーズの監視、治療計画の実施、個人向けサポートの提供により、患者と関わることができます。 

ソフトウェア開発:エージェント型 AI は、デバッグコードの自動生成、開発ライフサイクルの管理、システム・アーキテクチャの設計を実行できます。 

従業員への個別サポート:エージェント型 AI は、状況の変化に応じてアプローチを適応させ、カスタマイズされたプロアクティブなサポートを提供できます。つまり、スケジューリング、質問への回答、オンボーディングなどのタスクの完了を支援します。 

財務リスク管理:エージェント型 AI は、リアルタイムのデータストリームに基づいて市場動向を分析し、取引の決定を下し、戦略を調整する機能により、金融および貿易を支援できます。 

エージェント型 AI のユースケースを見る 

生成 AI は人工知能の一種であり、テキスト、動画、音声、ソフトウェアコードなどの新しいコンテンツを生成できます。生成 AI はディープラーニングを使用して単語間の統計的な関係性を計算し、トレーニングデータ、パターン認識、確率に基づいて出力を作成します。 

生成 AI はリアクティブです。つまり、具体的な要求 (プロンプト) が与えられることで、応答を生成します。独自の目標を設定したり、タスクを委任したり、新しい状況や構造化されていない状況に適応したりすることはできません。 

生成 AI アプリケーションが作成できるコンテンツは、トレーニングに使用されたデータに限定されます。ただし、外部データソースを組み込んだ検索拡張生成 (RAG) などの手法を使用して、生成 AI モデルの出力の精度を向上させることができます。

生成 AI のユースケース

生成 AI は主に、ユーザーが利用できる情報や選択肢を提供することで、人間の意思決定をサポートします。生成 AI のユースケースには、次のようなものがあります。

文章の記述:生成 AI ツールはほぼすべてのトピックにおいて、文章作成のプロンプトに対応することができます。これらのツールは、さまざまな長さや文体に対応できます。

画像と動画の生成:生成 AI 画像ツールは、高品質画像の作成や、既存の作品への新しい要素の追加が可能です。多くの生成 AI アプリケーションは、プロンプトに応じて短い動画を生成できるツールも提供しています。 

音声と音楽の生成:生成 AI ボーカルツールは、記述されたテキストと人の声のサンプル音声を使って、本物の人間の声を模倣したナレーションや歌声を作ることができます。プロンプトやサンプルから人工的な音楽を作れるツールもあります。

コード生成および補完:生成 AI ツールの一部では、ソフトウェア開発者を支援するために、書かれたプロンプトから要求に応じてコンピュータコードを出力することができます。

データの拡張:生成 AI は、実データを使用することが不可能または好ましくない場合に、大量の合成データを作成することができます。たとえば、個人を特定できるような情報を含まずに、機密データを理解するモデルをトレーニングしたい場合、合成データは有用です。また、トレーニングやテストの目的で、小規模なデータセットや不完全なデータセットをより大きな合成データセットに引き伸ばすために使用することもできます。

生成 AI のユースケースを見る

エージェント型 AI を検討する際の最も一般的な懸念事項は、自律システムがミスを犯した場合、誰が責任を負うのかということです。つまり、自律性と監視のバランスをどのように取るのかを考える必要があります。

人間と AI のコラボレーション

エージェント型システムを実装する前に、説明責任、透明性、および制御のためのフレームワークを作成することが重要です。 

前述の例で、営業担当者が AI を使用して見込み客にメールを送信した例を考えてみましょう。従業員は送信前にそのメールを確認したいと考えるはずです。

エージェント型 AI は、人間の介入を最小限に抑えながら、独立して意思決定を行うことができます。しかし、それは完全な監視と引き換えに、効率性を優先することを意味します。この解決策の 1 つは、テストと検証にリソースを集中させることです。つまり、人間が常に関与するという考え方に基づいて、アクションを監視し、誤った判断を防ぎます。 

信頼性と安全性については、生成 AI システムを実装する際にも同様の考慮事項が当てはまります。おそらく、生成 AI がもたらす最も明白なリスクは、誤情報または偽情報を作り出すことができるということでしょう。これには、有害な偏見やステレオタイプを永続化させるだけでなく、悪意のある目的でディープフェイクイメージを作成することも含まれます。「ハルシネーション」(事実として提示される不正確な出力) に注意し、答えをそのまま受け取るのではなく、ファクトチェックを実施することが重要です。 

プライバシーとセキュリティ

エージェント型 AI には外部のデータベースを活用する機能があるため、セキュリティやプライバシーに関連するリスクが高まる可能性があります。つまり、ワークフローから出入りするデータを保護するセキュリティ・フレームワークが必要です。 

生成 AI もセキュリティリスクをもたらす可能性があります。セキュリティを備えていないアプリケーションにユーザーが機密情報を入力することがあります。また、生成 AI は、著作権で保護された素材を複製したり、人物の声やアイデンティティを本人の同意なしに流用したりすることで、法的リスクをもたらす可能性があります。 

エージェント型 AI と生成 AI はどちらも、分散推論が提供するプライバシー (および効率性) によるメリットを得られます。分散推論は、物理サーバーやクラウドサーバーなどからなる多数のハードウェアにリクエストを分割する仕組みをサポートします。分割後、各推論サーバーは割り当てられた部分を並行して処理し、出力を作成します。これにより、AI を活用した一貫性のあるスケーラブルなサービスを提供する、回復力と可観測性のあるシステムが実現します。

分散推論はデータをローカルで処理し、データの機密性のない部分のみを中央サーバーに送信することで、プライバシー規制に準拠しています。個人データが特定の地理的範囲内に保持され、データ主権が維持されます。

Red Hat® AI は、Red Hat のお客様の信頼を得ているソリューションに基づいて構築された AI 製品のポートフォリオです。これを基盤として、当社製品の信頼性、柔軟性、拡張性が維持されます。

Red Hat AI のサポートによって以下のことが可能になります。

  • AI を導入してイノベーションを実現する
  • AI ソリューションの提供における複雑さを解消できる
  • どこにでもデプロイできる

Red Hat AI の詳細

選択肢を常にオープンに保つための基盤

Red Hat AI ソリューションは、生成 AI 機能と予測型 AI 機能の両方をサポートできます。Red Hat は、組織独自のモデルを持ち込むことができる柔軟性を備えており、組織のビジネスユースケースに特化した基盤モデルのトレーニングとファインチューニングに対応します。

まずは Red Hat Enterprise Linux® AI から始めましょう。これは、エンタープライズ・アプリケーション向けの LLM および SLM を開発、テスト、実行するために役立つ基盤モデル・プラットフォームです。この AI プラットフォームにより、開発者は LLM と AI のツールを備えた単一サーバー環境にすばやくアクセスできます。また、モデルを調整して生成 AI アプリケーションを構築するために必要なものがすべて揃っています。 

Red Hat Enterprise Linux AI の詳細

次に、マルチエージェント・システムを作成するための統合プラットフォームとなる Red Hat OpenShift® AI をご確認ください。また、Red Hat OpenShift の MLOps 機能を通じて、AI エージェントが使用するアダプティブラーニングと推論を制御することもできます。

Red Hat OpenShift AI の詳細を見る

さらに、当社の AI パートナーエコシステムは成長しています。さまざまなテクノロジーパートナーが Red Hat と連携し、Red Hat AI の運用能力に関する認定を受けています。これにより、選択肢を常にオープンに保つことができます。

Red Hat のパートナーの詳細

リソース

エンタープライズ AI を始める:初心者向けガイド

この初心者向けガイドでは、Red Hat OpenShift AI と Red Hat Enterprise Linux AI によって AI 導入をどのように加速できるのかについて説明します。

Red Hat で AI をナビゲート:AI 導入に役立つ専門知識、トレーニング、サポート

Red Hat の独自の AI ポートフォリオをご覧ください。Red Hat AI は、人工知能 (AI) を活用してお客様のビジネスおよび IT の目標を達成するお手伝いをします。

関連情報

AI の基盤モデルとは

基盤モデルは、さまざまなタスクを実行するように訓練された機械学習 (ML) モデルの一種です。

vLLM とは

vLLM は、言語モデルがより効率的に計算を行うのに役立つオープンソースコードの集合です。

説明可能な AI とは

説明可能な AI (XAI) は機械学習 (ML) ライフサイクル中に適用される技法で、AI による出力を人間にとってより理解しやすく透明性の高いものにします。

AI/MLリソース

注目の製品

  • Red Hat AI

    ハイブリッドクラウド環境全体で AI ソリューションの開発とデプロイメントを加速させる柔軟なソリューション。

関連記事