推論からエージェントへ：Red Hat AI 3.4 でエンタープライズ AI を拡張

2026 年 5 月 12 日Jennifer Vargas, Carlos Condado, Younes Ben Brahim, Will McGrath15 分 (読了時間の目安)

エンタープライズ AI は、単純なチャットボットからエージェント型AIへと移行しつつあります。これらのシステムは、独立した推論とマルチステップの計画立案を用いて、複雑なタスクを自律的に遂行します。このような AI 対応アプリケーションを構築するために、AI エンジニアとエージェント開発者は、高性能ワークロードとして実行されている信頼できる API エンドポイントを介して、モデルに即座にアクセスできる必要があります。

自律型エージェントは、その設計上、リソースを大量に消費します。これらは 24 時間年中無休で大規模に運用され、1 つのタスクを解決するためにインフラストラクチャに数十回アクセスすることもあり、継続的な負荷とコンピューティング需要の急増の両方を引き起こします。専用の基盤がなければパフォーマンスは低下し、コストは上昇します。機密性の高いエンタープライズデータのセキュリティとガバナンスの要求と相まって、これらの圧力は本番環境導入における深刻な障壁となります。

Red Hat AI は、AI ソリューションのデプロイを単純化する、統合されたメタルからエージェントまでを包含するプラットフォームを提供することで、こうした課題の解決を支援します。Red Hat は、ビルダーとオペレーターの両方に一貫したフレームワークを提供することで、組織がトークンの利用者からプロバイダーへと移行できるよう支援します。この移行により、エンタープライズは自律的なシステムを拡張できるようになり、AI の実験を本番対応可能な資産に変えるために必要なハードウェアの効率とコンピューティングコストの管理を維持できます。

静的な提供から高精度なオーケストレーションまで：推論コストの削減

あらゆる AI 対応アプリケーションの基盤は推論エンジンです。効果的なエージェントを構築するために、開発者は思考連鎖 (Chain of Thought) 推論をサポートするために低レイテンシーと高スループットを必要とします。Red Hat AI 3.4 は、経済的な持続可能性を維持しながらこのパフォーマンスを提供するツールを導入しています。

エンタープライズ向け Model-as-a-Service (MaaS)：この新しいリリースでは、MaaS はプラットフォームエンジニアにユーザーインターフェース [一般提供開始] を提供し、ロールベースの管理 [一般提供開始]、使用状況の追跡とショーバック [テクニカルプレビュー] のためのセルフサービスのトークンキー管理を可能にし、セルフホスト型 [一般提供開始] とクラウドベースのモデル [[テクニカルプレビュー] の両方を使用しながらセキュリティ標準を適用します。
llm-d による分散推論：このリリースにより、分散推論の運用が容易になり、大規模環境でのコスト効率が向上します。ユーザーインターフェース (UI) を介してモデルをデプロイするユーザーは、自らの namespace で使用可能な Gateway を検出してデプロイメント用に 1 つ以上を選択できるようになり、クラスタ全体の単一のデフォルトへの依存が解消されます [テクノロジープレビュー]。組み込みの YAML エディターにより、ユーザーは基盤となるリソースを検査して編集できます [テクノロジープレビュー]。リクエストの優先順位付け [テクノロジープレビュー] により、llm-d は同じエンドポイント上のインタラクティブなトラフィックとバックグラウンド・トラフィックを区別し、レイテンシーによる影響を受けやすいリクエストを優先的に処理して、飽和状態にある優先度の低いワークロードを破棄できます。自動スケーリング [テクノロジープレビュー] は、アクティブなリクエストの数、キューの深さ、および GPU 使用率に基づいてレプリカを自動的に調整します。OpenAI 互換のバッチ推論 [開発者プレビュー、DP] は、ドキュメントの分類やログ分析などの大量のワークロード向けに、永続的な「実行して放置」可能なパスを追加します。
パフォーマンス向上のための投機的デコーディング [一般利用]：Red Hat AI プラットフォームは vLLM 推論サーバーを統合していますが、これに投機的デコーディングのサポートが含まれるようになりました。非常に効率的なドラフトモデルを使用して処理を高速化することで、この手法は品質を損なうことなく応答速度を 2 - 3 倍に向上させ、インタラクションあたりのコストを直接削減できます。
GPU、CPU、NPU 間でのハードウェアの柔軟性：Red Hat AI 3.4 は、AMD Instinct MI355X GPU のサポート、AMD Instinct MI350P PCIe のプレビューサポート、AMD EPYC プロセッサーでの vLLM CPU サービングの一般提供など、GPU と CPU の両方における新しい AMD サポートにより、エンタープライズ推論のアクセラレーターの選択肢を拡大します。このリリースには、Intel Xeon プロセッサーでの vLLM CPU サービングの一般提供、および ATOM NPU 向けの認定 Rebellions コンテナも含まれています。これにより、組織は各ワークロードを適切なコンピュート層により柔軟に適合させることができます。要求の厳しい推論ワークロード向けの GPU、軽量で常時稼働の推論向けの CPU、そして電力効率に優れた高スループットのサービング向けの NPU。これらの機能を組み合わせることで、インタラクションあたりのコストを削減し、インフラストラクチャの利用率を向上させ、異種アクセラレーターの環境全体で一貫した Red Hat AI エクスペリエンスを提供します。

vLLM のエンタープライズサポートと、Red Hat が検証および最適化したモデルへのアクセスを提供する Red Hat AI Inference は、Red Hat OpenShift とサードパーティの Kubernetes ディストリビューションの両方で llm-d を使用した分散推論機能を追加しました [テクノロジープレビュー]。初回リリースでは、CoreWeave および Azure のマネージド Kubernetes サービスでの利用が可能です。組織は、プロバイダーごとに再構築することなく、環境全体で同じ推論スタックを実行できるようになります。これは、基盤となるハードウェアやクラウドプロバイダーに関係なく、AI 運用の一貫性を維持し、同じ高性能でオープンな基盤を使用することを意味します。

評価駆動型開発によるモデルの整合性の検証

モデルの効果は、その根拠となるデータによって異なります。Red Hat AI 3.4 は評価駆動型開発 (EDD) に重点を置いており、主観的なテストを具体的なデータとベンチマークに置き換えて、モデルとエージェントが実稼働環境向けに完全に準備されていることを検証します。

MLflow による実験追跡 [一般利用]：MLflow 統合は、メトリクス、パラメーター、アーティファクトを自動的に記録するバックボーンとして機能し、再現性を可能にするとともに、予測ワークロードと生成ワークロードの両方で結果の比較を容易にします。これには、プロンプトをバージョン管理およびガバナンス対象の企業資産として扱うプロンプト管理が含まれます。
自動化されたエクスペリエンス [テクノロジープレビュー]：AutoRAG や AutoML などのツールは複雑な AI タスクを自動化し、コストのかかる推測や手動の試行錯誤を削減します。AutoRAG は、検索拡張生成 (RAG) の埋め込みモデルとチャンク化戦略の選択を自動化し、チームが生データから高性能なパイプラインへとより迅速に移行できるよう支援します。同様に、AutoML は特徴量エンジニアリングと予測分析のモデル選択を処理するため、開発者はデータ準備ではなくビジネス成果に集中できます。
評価ハブ [テクノロジープレビュー] ：Red Hat AI 3.4 は、大規模言語モデル (LLM)、AI アプリケーション、およびエージェントを評価するための、フレームワークに依存しない統合 AI 評価コントロールプレーンである評価ハブ (eval hub) を導入しました。これは、厳選されたカスタム評価コレクション、MLflow を組み込んだダッシュボード、コマンドライン・インターフェース (CLI) およびソフトウェア開発キット (SDK) へのアクセスを提供することで、統合 REST API と Kubernetes コントローラーを使用して、断片化されたテスト手法を置き換えます。ガバナンスに Open Container Initiative (OCI) モデルカードを、エージェントが検出可能な評価に Model Context Protocol (MCP) サーバーを使用することで、実務者がラップトップから実稼働パイプラインまで再現可能なベンチマークを拡張できるクラスタネイティブな環境を提供します。

エージェント型企業のリスク軽減：成熟度とトレーサビリティ

自律型エージェントが規定の運用境界内に留まるためには、高度な可視性、トレーサビリティ、およびツールへの管理されたアクセスが必要です。Red Hat AI は AgentOps フレームワークを提供し、これらのシステムを観測可能かつ保護された状態にします。

管理されたプロンプト管理 [テクノロジープレビュー] ：MLflow 統合は、gen AI studio プレイグラウンド内の新しいプロンプト管理機能も強化します。これは、開発者が複数のツール間を移動することなく、プロンプトのプロトタイプ作成、モデルの比較、セキュリティの確認を行える一元化された環境です。これにより、開発者は管理された資産として、エージェントプロンプトをバージョン管理し、テストし、改良できます。プロンプトをコードとして管理することで、組織は一貫性を維持しながら価値実現までの時間を短縮できます。
ID 管理 [開発者プレビュー]：Red Hat AI は、暗号化エージェントの ID 用に SPIFFE/SPIRE を実装しており、有効期間の短いトークンを使用してハードコーディングされた鍵を排除します。これによりゼロトラストセキュリティが実現し、プロダクション環境においてエージェントが最小権限の原則に基づいて動作することが可能になります。
Kagenti [開発者プレビュー] によるライフサイクル管理：進化するエージェント型資産を管理する組織向けに、このプラットフォームには Kagenti が導入されています。これは、基盤となるコードを変更することなく、チームがエージェントをデプロイ、スケーリング、管理できるようにするライフサイクル管理ツールです。Kagenti は、ライフサイクル全体にわたってエージェントの検出とオンボーディングを可能にし、開発からプロダクションへの移行をサポートします。
MLflow によるエージェントのトレーサビリティ [一般利用]：MLflow は、エンドツーエンドのエージェントのトレーサビリティを提供します。システムは、すべての LLM 呼び出し、すべてのツールの実行、すべての意思決定ステップを追跡します。これは、自律的なシステムのデバッグ、監査、評価のための基本的な要件です。
エンタープライズ MCP 管理 [開発者プレビュー/テクノロジープレビュー]：Red Hat AI は、MCP ベースのツールアクセスを管理するためのプラットフォームアプローチを導入しています。MCP カタログ [開発者プレビュー] により、チームは Red Hat とテクノロジーパートナーが提供する信頼できる MCP サーバーを見つけてデプロイすることができます。MCP lifecycle operator [開発者プレビュー] は、これらを Kubernetes ネイティブのワークロードとして管理します。MCP ゲートウェイ [テクノロジープレビュー] は、一元化された認証、ツールレベルのアクセス制御、可観測性を提供するため、エージェントは許可されたツールのみにアクセスできます。

基盤の拡張：安全性と可観測性

AI を持続可能なものにするためには、安定した透明性のある基盤で実行する必要があります。Red Hat AI 3.4 は包括的な運用ハブとして機能し、MLOps、GenAIOps、AgentOps を単一のプラットフォームに統合します。

プロンプトラボとレジストリとの統合オーサリング [一般利用]：このプラットフォームは、プロンプトを構築および管理するための統合ツールを提供するため、エージェントの動作を導くロジックが中央レジストリに保存され、開発者と管理者の両方に信頼できる唯一の情報源が提供されます。
AI の安全性とレッドチーム [テクノロジープレビュー] ：Red Hat AI 3.4 は、自動化された敵対的攻撃スキャンを開発ライフサイクルに直接統合します。Chatterbox Labs の買収で得られたテクノロジーを活用したこのプラットフォームは、Garak を使用して、モデルやエージェント型システムをスクリーニングし、ジェイルブレイク (jailbreak)、プロンプト注入、バイアスなどのリスクがないかを確認します。この機能は高度なリスク分析を提供し、ランタイム時ではなく開発フェーズでモデルロジックのセキュリティ上の欠陥を発見します。脆弱性を早期に特定して軽減することで、チームは AI アプリケーションの整合性を評価し、本番環境でのデプロイメントにより安全に移行できます。
一元化されたメトリクスと可観測性 [テクノロジープレビュー]：このリリースでは、ネイティブの基盤ダッシュボードを備えた、構成不要で統合された Prometheus インスタンスを提供します。クラスタ管理者は、単一のコンソールからハードウェア使用率と MaaS メトリクス [テクノロジープレビュー] を監視できます。また、エージェントの段階的な実行トレース、推論チェーン、ツール呼び出し、LLM のインタラクションをコンソールで直接確認できるようになります [開発者プレビュー]。このプラットフォームは、これらのメトリクスを既存のサードパーティの可観測性シンクにルーティングできる柔軟性を維持します。

クラウドマーケットプレイスでの Red Hat AI

Red Hat AI Enterprise は、AWS Marketplace、Microsoft Azure Marketplace、および Google Cloud Marketplace を通じてまもなく直接調達できるようになる予定です。これにより、エンタープライズ組織は、好みのクラウドに AI インフラストラクチャをデプロイするための、より迅速で柔軟なパスを得ることができます。組織は、既存の Enterprise Discount Programs (EDPs) および確約済みのクラウド支出を Red Hat AI サブスクリプションに適用できるようになり、財務および調達プロセスが単純化されます。

この提供開始は、既存の Red Hat AI クラウドオプションが拡張されることを意味します。Red Hat は、Red Hat Enterprise Linux イメージモードでの LLM の実行に注力する組織向けに、3 つの主要なマーケットプレイスのすべてにおいて Red Hat Enterprise Linux AI をすでに提供しています。

Red Hat AI Inference on IBM Cloud

IBM Cloud との連携により、Red Hat は、クライアントがプロダクショングレードの AI モデルを実行できるフルマネージド推論サービスである Red Hat AI Inference on IBM Cloud の提供開始も発表します。これは、エンタープライズグレードのアクセス制御、監査、使用ガバナンスなどの組み込みガバナンスを備えた、基盤となるオープンソースモデルへの迅速かつコスト効率の高いアクセスを提供します。現在のモデルカタログの例には、Granite 4.0 H Small (IBM)、Mistral-Small-3.2-24B-Instruct、Llama 3.3 70B Instruct、および GPT-OSS-120B が含まれます。

終わりに

Red Hat AI 3.4 は、実験的なチャットボットから完全に実現されたエージェント型エンタープライズへと移行するために必要な機能を拡張します。分散推論、自動化されたデータパイプライン、フレームワークに依存しない AgentOps、およびプロアクティブな AI セーフティを統合することで、Red Hat はハイブリッドクラウドのための包括的な基盤を提供します。このリリースは、あらゆる環境で予測可能であり、かつセキュリティを重視しており、経済的に持続可能な自律的なシステムを構築するためのツールを拡張します。エージェント時代の包括的なプラットフォームとして、Red Hat AI は、組織が AI 資産に対する完全な制御を維持しながらイノベーションを拡張できるよう支援します。

Red Hat AI の詳細を確認し、お客様の世界に合わせて AI を構築する方法を確認してください。 Red Hat AI 3.4 は今月後半に利用可能になる予定です。

執筆者紹介

Jennifer Vargas

Principal Product Marketing Manager

Jennifer Vargas is a marketer — with previous experience in consulting and sales — who enjoys solving business and technical challenges that seem disconnected at first. In the last five years, she has been working in Red Hat as a product marketing manager supporting the launch of a new set of cloud services. Her areas of expertise are AI/ML, IoT, Integration and Mobile Solutions.

Read full bio

Carlos Condado

Sr. Product Marketing Manager

Carlos Condado is a Senior Product Marketing Manager for Red Hat AI. He helps organizations navigate the path from AI experimentation to enterprise-scale deployment by guiding the adoption of MLOps practices and integration of AI models into existing hybrid cloud infrastructures. As part of the Red Hat AI team, he works across engineering, product, and go-to-market functions to help shape strategy, messaging, and customer enablement around Red Hat’s open, flexible, and consistent AI portfolio.

With a diverse background spanning data analytics, integration, cybersecurity, and AI, Carlos brings a cross-functional perspective to emerging technologies. He is passionate about technological innovations and helping enterprises unlock the value of their data and gain a competitive advantage through scalable, production-ready AI solutions.

Read full bio

Younes Ben Brahim

Principal Product Marketing Manager

Younes Ben Brahim is a Principal Product Marketing Manager at Red Hat, focusing on the strategic positioning and market adoption of Red Hat's AI platform offerings. Younes has spent over 15 years in the IT industry leading product marketing initiatives, managing product lifecycles for HPC & AI, and delivering consulting services.
Prior to Red Hat, he has worked with companies like NetApp, Dimension Data, and Cisco Systems, providing technical solutions and product strategy for enterprise infrastructure and software projects.

Read full bio

Will McGrath

Senior Principal Product Marketing Manager

Will McGrath is a Senior Principal Product Marketing Manager at Red Hat. He is responsible for marketing strategy, developing content, and driving marketing initiatives for Red Hat OpenShift AI. He has more than 30 years of experience in the IT industry. Before Red Hat, Will worked for 12 years as strategic alliances manager for media and entertainment technology partners.

Read full bio

類似検索

ブログ投稿

さらに調べる

チャンネル別に見る

すべてのチャンネルを見る

推論からエージェントへ：Red Hat AI 3.4 でエンタープライズ AI を拡張

静的な提供から高精度なオーケストレーションまで：推論コストの削減

評価駆動型開発によるモデルの整合性の検証

エージェント型企業のリスク軽減：成熟度とトレーサビリティ

基盤の拡張：安全性と可観測性

クラウドマーケットプレイスでの Red Hat AI

Red Hat AI Inference on IBM Cloud

終わりに

適応力のある企業：AI への対応力が破壊的革新への対応力となる理由

執筆者紹介

Jennifer Vargas

Carlos Condado

Younes Ben Brahim

Will McGrath

類似検索

さらに調べる

チャンネル別に見る

プラットフォーム

ツール

試用、購入、販売

コミュニケーション

Red Hat について

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links