AI 業界は、この 3 年間、規模の拡張がに注力してきました。私たちは、「より大きい」ことだけが「よりスマート」になるための唯一の道であると信じて、パラメータ数を数兆単位にまで増やすことに注力してきました。しかし、状況が落ち着くにつれ、企業には新たな現実が浮き彫りになっています。重要な指標は規模ではなく、信頼性が高く、確定的な結果を出せるかどうかなのです。

Red Hat では、最も強力なテクノロジーとは、分散型でオープンであり、目的に適したものであると常に考えてきました。小規模言語モデル (SLM) は、まさにその転換を象徴しています。SLM と 大規模言語モデル (LLM) の違いは、そのモデルが果たすアーキテクチャ上の役割に比べれば重要ではありません。重要なのは、小規模モデルがもたらす機能的な自律性です。

私たちは、巨大なブラックボックスモデルに質問を投げかける対話型 AI の世界から脱却し、専門家されたモデル群がビジネスの実務を実行するエージェント型 AI の時代へと移行しつつあります。

すべての企業が AI エージェントを運用する

私たちは今、Web への移行と同じくらい根本的な転換点に立っています。

ビジネスのアイデンティティの変遷を振り返ってみましょう。1995 年、業界は「なぜ E メールアドレスが必要なのか」と問いかけました。2005 年には、Web サイトが注目を集め、2015 年には、ソーシャルメディアがこれに続きました。2026 年には、「稼働中のエージェントはいくつあるか」が一般的に問われるようになっています。

私たちは、人間よりも AI エージェントの数が多くなる世界に向かっています。あらゆる企業が、次のようなエージェント群を保有することになります。

  • 単に質問に答えるだけでなく、複雑なロジスティクスの問題を解決する顧客対応エージェント
  • 部門間の目に見えない「つなぎ役」を自動化するワークフローエージェント
  • バックグラウンドで API 呼び出しを静かに実行し、在庫調整や支払い処理を行うヘッドレスエージェント

しかし、他社が補助金を支給しているクラウドトークンだけでは、持続可能でコスト効率の高いエージェント群を構築することはできません。ここで、SLM はエンタープライズのユースケースを実現し、拡張していくために必須のツールとなります。 

SLM がエージェント型バックエンドを制御する理由

最先端の LLM は高スループットのエンジニアリングの傑作ですが、機敏に動くデジタル従業員の役割を担うには、しばしば負荷が重すぎることがあります。エージェント型ワークフローでは、単なる処理能力だけでなく、低レイテンシーでの実行が必要です。SLM を活用することで、ビジネスクリティカルな自動化に求められる 1 秒未満の応答時間と、確定的な信頼性を提供することが可能になります。

1.専門化の力 (効率性 > 規模)

4,000 億パラメータのモデルのファインチューニングを検討する組織はほとんどありませんが、30 億や 70 億のモデルは、管理しやすく極めて効果的なエントリーポイントとなります。アーキテクチャの制御は、ここから始まります。 2025 年後半の調査によると、高品質の合成データでファインチューニングされた 350M パラメーターのモデルでも、特定のツール呼び出しや API オーケストレーションの領域では、汎用的な最先端モデルを上回る性能を発揮できることが示されています。堅牢なエージェント型バックエンドの場合、目標は広範で詩的な言語能力ではなく、高精度の専門化です。

2.決定論と「信頼性の数学

エンタープライズ AI の最大のハードルの 1 つは、不確定性、つまりエージェントが一度は応答を正しく構成できても、次は失敗する可能性があることです。LLM は完全に決定論的な数学関数ではありませんが、SLM を使用すると、これまでははるかに困難だったアーキテクチャ上の制御を強化することが可能になります。JSON スキーマや文脈自由文法 (CFG) などの制約のあるデコード技術を使用することで、モデルのトークン探索空間をプルーニングし、モデルが無効な次の文字を選択することを物理的に不可能にできます。これにより、焦点は「自由度の高い魔法」から「スキーマに制約された正確性」へと移行します。ローカル実行および特化型のファインチューニングと組み合わせることで、SLM は構造化されたタスクで 98% 以上の有効性を達成でき、機密性の高いエージェント・ワークフローに求められる予測可能な信頼性を提供します。

3.データ主権は任意ではない

データは、貴社にとって最も貴重な資産です。エージェント型の環境では、これらのモデルは顧客関係管理 (CRM)、独自のコード、および社内戦略を扱うことになります。「インテリジェンス・アズ・ア・サービス」と引き換えに、そのデータをサードパーティのクラウドプロバイダーに委ねることは、戦略的な誤りです。

SLM をオンプレミスまたは自社のハイブリッドクラウド環境内で実行することは、IP の所有権を自社が保持し続けることを意味します。これにより、機密データが組織の境界を越えることがない「ゼロトラスト」AI アーキテクチャが実現し、医療、金融、行政などの業界で共通する厳格な規制要件を満たすことができます。

まとめ

会話とコンテンツを生成する生成 AI (gen AI) の世界から、私たちの代わりにアクションを実行するエージェント型 AI の世界へと移行しつつあります。この新しい時代では、もはやどのモデルが最大であるかではなく、どのインフラストラクチャが最も信頼性が高く、保護されているかが重要になります。ビジネスの運営が専門化されたデジタルエージェント群に依存するようになれば、「ブラックボックス」型のクラウドモデルではもはや十分ではありません。必要なのは、主権、スピード、そして精度になります。

Red Hat は、エージェントの未来への道は開かれていると考えています。Red Hat AI ポートフォリオでファインチューニング、提供、オーケストレーションが可能な、厳選された小規模言語モデルを活用することで、企業は AI を研究室からビジネスロジックの中核へと移行させることができます。

この分野は目まぐるしく変化していますが、目標は明確です。巨人を追いかけるのをやめて、バックボーンの構築を始めることです。AI の未来は、小型で高速、そしてオープンなハイブリッドクラウドの上に構築されます。 

詳細はこちら

製品

Red Hat AI

Red Hat AI は、ハイブリッドクラウド環境全体にわたって AI ソリューションの開発とデプロイメントを加速する、柔軟でコスト効率に優れたソリューションを提供します。

執筆者紹介

Catherine Weeks is an Engineering Director in Red Hat AI, where she leads the teams building software with the latest generative AI innovations.

With a background in software design, Catherine is a leader who excels at translating complex customer needs into practical engineering solutions. She is known for her ability to work at every level—from high-level strategy down to the hands-on work of getting it done. This approach helps her balance the fast-moving world of AI innovation with the need to build the reliable, high-quality products customers depend on, all while fostering a supportive team culture.

With over 20 years in the software industry, Catherine has a proven record of mentoring strong teams and has always been a champion for the end-user.
 

Ricardo is a Principal Software Engineer working at the Red Hat's Office of the CTO in the Emerging Technologies organization as Initiative lead. Ricardo is currently focused on the different kinds of architectures in the AI space like SLMs and multimodality. He has been part of the MicroShift and Edge Manager projects since its inception.
He is a former member of the Akraino Technical Steering Committee and Project Technical Lead of the Kubernetes-Native-Infrastructure blueprint family. He's been doing R&D related to OpenStack, as well as, contributing to OpenDaylight project and OPNFV. He is passionate about new technologies and everything related to the Open Source world. Ricardo holds a MSc Degree in Telecommunications from Technical University of Madrid (UPM). He loves music, photography and outdoor sports.

UI_Icon-Red_Hat-Close-A-Black-RGB

チャンネル別に見る

automation icon

自動化

テクノロジー、チームおよび環境に関する IT 自動化の最新情報

AI icon

AI (人工知能)

お客様が AI ワークロードをどこでも自由に実行することを可能にするプラットフォームについてのアップデート

open hybrid cloud icon

オープン・ハイブリッドクラウド

ハイブリッドクラウドで柔軟に未来を築く方法をご確認ください。

security icon

セキュリティ

環境やテクノロジー全体に及ぶリスクを軽減する方法に関する最新情報

edge icon

エッジコンピューティング

エッジでの運用を単純化するプラットフォームのアップデート

Infrastructure icon

インフラストラクチャ

世界有数のエンタープライズ向け Linux プラットフォームの最新情報

application development icon

アプリケーション

アプリケーションの最も困難な課題に対する Red Hat ソリューションの詳細

Virtualization icon

仮想化

オンプレミスまたは複数クラウドでのワークロードに対応するエンタープライズ仮想化の将来についてご覧ください