Stephen Watt(スティーブン・ワット) | 2026年5月11日
周知の事実ではありますが、テクノロジー業界では、ビジネスプロセスを完全に自律的なエージェント型ワークフローへと変換するために、エージェント型ソフトウェアの開発が急速に進んでいます。こうしたツールの威力は疑いようのないものですが、現在の利用モデルには課題があります。これらソリューションの多くは Model-as-a-Service というアプローチで提供されており、これが AI 版クラウド・パラドックス、すなわちエージェント型のパラドックスを引き起こす恐れがあるのです。
このパラドックスは単純明快です。ビジネスプロセスの速度を向上させる最も手っ取り早い方法は、最先端の強力なモデルを活用することです。しかし、導入規模が拡大するにつれ、この戦略は持続不可能になります。トークンのコストが利益率を圧迫し、予測不可能なレイテンシーがパフォーマンスを低下させ、機密データをパブリック API にルーティングすることは、機密性、データ主権、および規制要件に抵触する恐れがあります。このような矛盾を解消するためには、企業は単純な利用形態から脱却し、選択肢を重視するハイブリッドなアーキテクチャ戦略へと移行する必要があります。
イノベーションのコスト
すでに明らかな課題が浮上しています。一部のレポートによると、企業は第2四半期半ばまでにクラウド予算の全額をトークンに使い果たしているケースもあるということです。私たちは、コスト、パフォーマンス、データに対するコントロールを取り戻すために、モデル推論に対する新たなアプローチが必要になるという、重大な局面に差し掛かっているのです。
過去のイノベーションに対する支払いが将来的にも発生してしまう場合、組織はどのように対応するのでしょうか。私たちは、単にモデルを利用するだけの時代を脱しつつあり、モデルを支えるシステムを設計する必要があります。導入については、ハイブリッド型になる可能性が高いでしょう。トークン消費の一部はマネージドモデルを使用することになり、他の部分はパブリッククラウドや企業のデータセンターで自己管理されることになるでしょう。
システム中心の考え方
Red Hat の研究および新興技術グループにおける活動の多くは、インテリジェンス層とインフラストラクチャ層の関係に焦点を当てており、その結果、最近構築された AI エージェント向けの堅牢なイメージベースの基盤のような、革新的なオープンソース・コミュニティ・プロジェクトが生み出されています。オープンソースは、AI ワークロードを従来のエンタープライズ・ソフトウェアと同程度の厳格さで扱うことで、本番環境に必要な安定性を提供します。
アーキテクチャの転換によって、組織はモデル中心の視点から離れ、システム中心の考え方に移行できるようになります。このモデルでは、単一のプロバイダーの API ではなく、スタック全体の信頼性に価値が見出されます。
最適なメカニズム
企業が財務基盤の回復を図り、ハイブリッドな制御と一貫性の基盤を確立しようとする場合、初期段階では通常、推論プロキシまたはルーターが採用されます。これは、既存のエージェント型実装において、アーキテクチャの変更を最小限に抑えつつ推論コストを削減するための、最も影響が少ないアプローチです。推論エンドポイントの一貫性を維持することで、組織はより優れた価値を提供するサービスプロバイダーや自社管理モデルへと切り替えることが可能になります。
このことが、Red Hat が vLLM Semantic Router や llm-d といったプロジェクトを立ち上げた理由です。これらは、人工知能における斬新なアイデアを探求するためのものであり、特に vLLM Semantic Router については、推論ルーティングやトークン・エコノミクスを研究することを目的としています。このような先駆的な研究開発こそが、最終的に Red Hat のプラットフォームを形作る基盤となります。vLLM Semantic Router のようなプロジェクトは、マルチモーダル環境を運用するために必要な、インテリジェントかつ効率的なルーティングを提供します。このルーティング・インテリジェンス層を自社で保有することで、組織はあらゆるインフラストラクチャにわたるワークロードをコントロールできるようになります。
ハイブリッドな現実
組織にとっての、推論ルーティングの次のステップは、自己管理型ソリューションの検討です。これは、自社のインフラ上でホストされる vLLM のような高性能な推論プラットフォームが提供する、最新のオープンウェイトモデルを活用することを意味します。
そこで重要な課題が浮上します。組織は Model-as-a-Service を通じて開発された強力なエージェント主導のビジネスプロセスを、どのようにオープンウェイトモデルに置き換えるべきでしょうか?企業は Model-as-a-Service のパターンをどのように再現し、単なるサービスの利用者から AI プロバイダーへと転身できるのでしょうか?このような移行過程では、どのようなトレードオフに直面するのでしょうか?また、効果を損なうことなく成功させるにはどうすればよいのでしょうか?
どの企業も長年にわたり独自のデータを保有していますが、パブリックドメインでトレーニングされたモデルには、企業特有の文脈やトレーニングが欠けています。ローカルで実行されるオープンウェイトモデルを、こうしたプライベートなデータソースと組み合わせることで、エージェントの精度と機能を安全に向上させることができます。一部のオープンウェイトモデルはそのまま代替として機能しますが、その他のモデルについては、ファインチューニング、知識蒸留、強化学習を通じて、パフォーマンスのギャップを解消するための作業が必要です。強化学習が市場に浸透するにつれ、モデルの精度と、その結果として得られるエージェントのワークロードの品質はさらに向上するでしょう。このような流れは最終的にハイブリッド・アーキテクチャへとつながります。一部のモデルはコアワークロード向けに自社管理のまま維持され、他のモデルはサードパーティが管理するサービス・インターフェースを通じて利用されることになります。
Red Hat はハイブリッド・ソリューションを専門としています。Red Hat Enterprise Linux や Red Hat OpenShift でクラウド利用のためのハイブリッド・プラットフォームを提供したのと同様に、Red Hat AI Enterprise は使用するモデルやホスト環境に関わらず、エージェントのデプロイと推論のためのハイブリッド・プラットフォームを提供し、オープンソースを通じて選択肢がもたらされることを実証します。AI の未来はハイブリッドであり、Red Hat にはその未来を構築するためのプラットフォームがあります。
Red Hat Summit の基調講演では、Red Hat のエグゼクティブ、顧客、パートナーによる最新情報をご覧いただけます。
- プラットフォームを選択 — 5月12日(火) 米国東部夏時間 8:30~10:00(YouTube)
- AI 対応企業が登場 — 5月13日(水) 米国東部夏時間 9:00~10:00(YouTube)
Red Hat Summit の詳細については、Red Hat Summit newsroom で今週の Red Hat の発表をご覧いただけます。X の @RedHatSummit または #RHSummit でイベントごとの最新情報をフォローしてください。
執筆者紹介
Steve Watt is a Distinguished Engineer and vice president of the Office of the CTO, which includes Red Hat Research and Emerging Technologies. Prior to joining Red Hat, Steve was the founder of the Hadoop Business and Hadoop Chief Technologist at HP and a Software Architect and Master Inventor at IBM Emerging Technologies. Prior to IBM, Steve worked for a number of consumer facing software startups in the USA and his native South Africa.
類似検索
過去を管理するのをやめて、IT の未来を構築しましょう
推論からエージェントへ:Red Hat AI 3.4 でエンタープライズ AI を拡張
Technically Speaking | Inside open source AI strategy
Technically Speaking | Build a production-ready AI toolbox
チャンネル別に見る
自動化
テクノロジー、チームおよび環境に関する IT 自動化の最新情報
AI (人工知能)
お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート
オープン・ハイブリッドクラウド
ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。
セキュリティ
環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報
エッジコンピューティング
エッジでの運用を単純化するプラットフォームのアップデート
インフラストラクチャ
世界有数のエンタープライズ向け Linux プラットフォームの最新情報
アプリケーション
アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細
仮想化
オンプレミスまたは複数クラウドでのワークロードに対応するエンタープライズ仮想化の将来についてご覧ください