Skip to contentRed Hat AI
  • Red Hat のアプローチ

    • ニュース & インサイト
    • 技術ブログ
    • 調査
    • ライブ AI イベント
    • Red Hat の AI について
  • Red Hat のポートフォリオ

    • Red Hat AI
    • Red Hat Enterprise Linux AI
    • Red Hat OpenShift AI
    • Red Hat AI Inference Server
  • 参加 & 学習

    • AI ラーニングハブ
    • AI パートナー
    • AI サービス
ハイブリッドクラウド
  • プラットフォーム・ソリューション

    • 人工知能

      AI モデルとアプリケーションを構築、デプロイ、監視します。

    • Linux 標準化

      運用環境全体で一貫性を確保します。

    • アプリケーション開発

      アプリケーションの構築、デプロイ、管理方法を単純化します。

    • 自動化

      自動化を拡張して、テクノロジー、チーム、環境を統合します。

  • ユースケース

    • 仮想化

      仮想化およびコンテナ化されたワークロードの運用をモダナイズします。

    • デジタル主権

      クリティカルなインフラストラクチャをコントロールし、保護します。

    • セキュリティ

      セキュリティ重視のソフトウェアをコーディング、構築、デプロイ、監視します。

    • エッジコンピューティング

      エッジ・テクノロジーを活用し、ワークロードをデータの発生源近くにデプロイします。

  • Red Hat のソリューションについて
  • 業種別ソリューション

    • 自動車
    • 金融サービス
    • 医療
    • 産業部門
    • メディアおよびエンターテイメント
    • 公共部門 (グローバル)
    • 公共部門 (米国)
    • 通信

クラウド・テクノロジーを見る

Red Hat® Hybrid Cloud Console を活用して、当社のクラウド製品とソリューションの使い方を自分のペースで学ぶことができます。

製品
  • プラットフォーム製品

    • Red Hat AI

      ハイブリッドクラウド全体で AI ソリューションを開発し、デプロイします。

      新バージョン
    • Red Hat Enterprise Linux

      柔軟なオペレーティングシステムで、ハイブリッドクラウドのイノベーションを支えます。

    • Red Hat OpenShift

      アプリケーションを大規模に構築、モダナイズ、デプロイします。

    • Red Hat Ansible Automation Platform

      エンタープライズ全体で自動化を実装できます。

  • 注目のコースと認定

    • Red Hat OpenShift Virtualization Engine
    • Red Hat OpenShift Service on AWS
    • Microsoft Azure Red Hat OpenShift
    • すべての Red Hat 製品を見る
  • 試す & 買う

    • トライアルを開始する
    • オンラインでのご購入
    • 主要なクラウドプロバイダーとの統合
  • サービス & サポート

    • コンサルティング
    • 製品サポート
    • AI サービス
    • テクニカルアカウントマネージメント (TAM)
    • サービス & サポートについて
トレーニング
  • トレーニング & 認定

    • コースと試験
    • 認定資格
    • Red Hat Academy
    • ラーニングコミュニティ
    • ラーニングサブスクリプション
    • トレーニングの詳細
  • 注目のコースと認定

    • Red Hat 認定システム管理者 認定試験
    • Red Hat システム管理 I
    • Red Hat ラーニングサブスクリプションのトライアル (無料)
    • RHCE 認定試験
    • Red Hat 認定 OpenShift 管理者試験
  • コンサルティング

    • コンサルティング
    • パートナー向けトレーニング
    • 製品サポート
    • AI サービス
    • テクニカルアカウントマネージメント (TAM)
学ぶ
  • スキルを構築する

    • 製品ドキュメント
    • ハンズオンラボ
    • Hybrid Cloud ラーニングハブ
    • インタラクティブな学習体験
    • トレーニング & 認定
  • その他の学習方法

    • ブログ
    • イベント & Web セミナー
    • ポッドキャストとビデオシリーズ
    • Red Hat TV
    • リソースライブラリ

開発者向け

クラウドネイティブなアプリケーションとサービスの構築、提供、管理に役立つリソースとツールをご覧ください。

パートナー
  • お客様向け

    • Red Hat パートナー企業
    • Red Hat Ecosystem Catalog
    • Red Hat パートナーを探す
  • パートナー向け

    • Partner Connect
    • パートナーになる
    • トレーニング
    • サポート
    • パートナーポータルにアクセスする

信頼できるパートナーを活用してソリューションを構築する

Red Hat® Ecosystem Catalog で、エキスパートとテクノロジーからなるコラボレーション型コミ​ュニティが提供する各種ソリューションを見つけることができます。

検索

トピックを探す

  • トライアルを開始する
  • サブスクリプションを管理する
  • Red Hat の採用情報を見る
  • テクノロジーの一覧を見る
  • Red Hat に問い合わせる
  • カスタマーサービスに問い合わせる

情報を見つける

  • 製品ドキュメント
  • 開発者向けリソース
  • スキルチェック
  • Architecture Center
  • セキュリティの更新
  • サポートケース

詳しく知る

  • AI
  • アプリケーションのモダナイゼーション
  • 自動化
  • クラウドネイティブ・アプリケーション
  • Linux
  • 仮想化
コンソール製品ドキュメントサポート新規 おすすめのリソース

おすすめのコンテンツ

閲覧される際に、おすすめのリソースが表示されます。

  • Red Hat 製品のトライアル
  • コースと試験
  • すべての製品
  • 技術トピック
  • リソースライブラリ
ログイン

Red Hat アカウントをさらに有効活用

  • コンソールへのアクセス
  • イベント登録
  • トレーニングとトライアル
  • 世界最高レベルのサポート

一部のサービスではサブスクリプションが必要な場合があります。

ログインまたは登録する
お問い合わせ
  • ホーム
  • リソース
  • Red Hat AI Inference Server

Red Hat AI Inference Server

2025 年 9 月 29 日•
リソースタイプ: データシート

概要

AI の真の価値は、迅速で正確な回答を大規模に得られることにあります。Red Hat® AI Inference Server は、ハイブリッドクラウド全体で推論プロセスを最適化することでこれを直接実現します。推論プロセスは、AI アプリケーションが大規模言語モデル (LLM) とやり取りし、データに基づいて応答を生成できるようにする重要なステップです。これにより、より迅速でコスト効率の高いモデルのデプロイメントが可能になります。

高速でコスト効率の高い推論をどこでも実行

Red Hat AI プラットフォームに含まれる Red Hat AI Inference Server は、一貫性があり高速でコスト効率の高い推論を大規模に実行します。AI Inference Server を使用すると、あらゆるハードウェア・アクセラレーターやデータセンター、クラウド、エッジ環境であらゆる生成 AI モデルを実行できるので、ビジネス要件を満たすために必要な柔軟性と選択肢を得ることができます。AI Inference Server は、基盤モデルとトレーニング済みモデルの両方を圧縮する LLM Compressor を使用したモデル最適化を通じて、または、より短時間で推論をデプロイできる、検証済みで最適化された生成 AI モデルのコレクションへのアクセスを提供して、効率的な推論を実現する機能を提供します。 

Red Hat AI Inference Server は、幅広いハードウェア・アクセラレーターおよびモデルと連携し、任意のインフラストラクチャおよびオペレーティングシステム (OS) 上で実行できます。Red Hat AI プラットフォーム、Red Hat Enterprise Linux®、Red Hat OpenShift®、およびサードパーティの Linux または Kubernetes ディストリビューションに対応しており、お客様は任意のアーキテクチャに柔軟に対応できます。

表 1.特長とメリット

メリット

説明

仮想大規模言語モデル (vLLM) によるモデル推論への効率的なアプローチ

 

AI Inference Server は、vLLM を使用してグラフィックス・プロセッシング・ユニット (GPU) のメモリー使用量と推論のレイテンシーを最適化することで、モデル推論への効率的なアプローチを提供します。

運用の複雑さを軽減

AI Inference Server は、ハイブリッドクラウドでのモデルのデプロイと最適化のための一貫したプラットフォームを提供します。量子化などの高度な機械学習 (ML) 技術を管理するためのユーザーフレンドリーなアプローチを提供し、Prometheus や Grafana などの可観測性ツールとの統合が可能です。

ハイブリッドクラウドの柔軟性

vLLM を中核とする AI Inference Server により、データセンター、クラウド環境、エッジなど、必要なあらゆる場所で AI モデルを自由に実行できます。 

技術仕様

  • ハイブリッドクラウド用の推論ランタイム: 洗練された強力な推論ランタイム vLLM を中核に据えた AI Inference Server は、企業が選択したモデルをさまざまなアクセラレーター、Kubernetes、Linux 環境にわたって実行するための統一された高性能プラットフォームを提供します。また、可観測性ツールと統合して監視を強化できるほか、OpenAI などの LLM API をサポートしているので柔軟なデプロイが可能です。
  • LLM Compressor: AI チームは、あらゆるサイズの基盤モデルおよびトレーニング済みモデルの両方を圧縮でき、高いモデル応答精度を維持しながら、コンピューティングの使用量と関連コストを削減できます。また、Red Hat と連携してモデル最適化の取り組みについてサポートを受けることができます。
  • 最適化されたモデルリポジトリ: AI Inference Server は Hugging Face の Red Hat AI ページでホストされており、推論デプロイメントに対応できる主要な AI モデルの検証済みで最適化されたコレクションに即座にアクセスできるので、モデルの精度を損なうことなく効率を 2 - 4 倍高速化します。
  • すべての Red Hat 製品で認定済み: AI Inference Server は、Red Hat OpenShift AI および Red Hat Enterprise Linux AI の一部として含まれており、Red Hat OpenShift および Red Hat Enterprise Linux でもサポートされています。
  • サードパーティ・プラットフォームへのデプロイ:AI Inference Server はサードパーティの Linux プラットフォームおよび Kubernetes プラットフォームにデプロイでき、Red Hat のサードパーティ・サポート・ポリシーでカバーされます。このような場合、Red Hat は Inference Server コンポーネントのみをサポートします。基盤となるプラットフォーム関連の問題は、Red Hat Enterprise Linux または Red Hat OpenShift で再現できない場合、お客様が責任を負います。

完全に最適化された自動化を達成するプロセスを探る

AI Inference Server を使用して高速でコスト効率に優れたスケーラブルな推論を行う方法について、Red Hat AI Inference Server の製品ページをご覧ください。

タグ:AI inference, AI/ML

Red Hat logoLinkedInYouTubeFacebookX

プラットフォーム

  • Red Hat AI
  • Red Hat Enterprise Linux
  • Red Hat OpenShift
  • Red Hat Ansible Automation Platform
  • すべての製品を見る

ツール

  • トレーニングと認定
  • マイアカウント
  • カスタマーサポート
  • 開発者向けリソース
  • Red Hat パートナーを探す
  • Red Hat Ecosystem Catalog
  • 製品ドキュメント

試用、購入、販売

  • Red Hat 製品のトライアル
  • ご購入について (グローバル/英語)
  • ご購入について (日本)
  • コンソール

コミュニケーション

  • 営業へのお問い合わせ
  • カスタマーサービスへのお問い合わせ
  • トレーニングに関するお問い合わせ
  • ソーシャルメディア

Red Hat について

Red Hat は、オープン・ハイブリッドクラウド・テクノロジーのリーダーであり、エンタープライズにおける革新的な IT および人工知能 (AI) アプリケーションのための一貫性のある包括的な基盤を提供しています。フォーチュン 500 企業に信頼されるアドバイザーとして、Red Hat はクラウド、開発者向け、Linux、自動化、アプリケーション・プラットフォームといったテクノロジーと、受賞歴のあるさまざまなサービスを提供しています。

  • Red Hat について
  • Red Hat の企業文化
  • お客様事例
  • アナリスト向け情報
  • ニュース
  • オープンソースの取り組み
  • 社会的な取り組み
  • 採用情報

Change page language

Red Hat legal and privacy links

  • Red Hat について
  • 採用情報
  • イベント
  • 各国のオフィス
  • Red Hat へのお問い合わせ
  • Red Hat ブログ
  • Red Hat におけるインクルージョン
  • Cool Stuff Store
  • Red Hat Summit
© 2025 Red Hat

Red Hat legal and privacy links

  • プライバシーステートメント
  • ご利用条件
  • すべてのポリシーとガイドライン
  • デジタル・アクセシビリティ