Skip to contentRed Hat AI
  • Red Hat의 접근 방식

    • 뉴스 & 인사이트
    • 기술 블로그
    • 리서치
    • 라이브 AI 이벤트
    • Red Hat의 AI 살펴보기
  • Red Hat 포트폴리오

    • Red Hat AI
    • Red Hat Enterprise Linux AI
    • Red Hat OpenShift AI
    • Red Hat AI Inference Server
  • 참여 & 학습

    • AI 학습 허브
    • AI 파트너
    • AI 서비스
하이브리드 클라우드
  • 플랫폼 솔루션

    • 인공지능

      AI 모델과 애플리케이션을 빌드, 배포, 모니터링합니다.

    • Linux 표준화

      운영 환경 전반에서 일관성을 확보합니다.

    • 애플리케이션 개발

      애플리케이션을 빌드, 배포, 관리하는 방식을 간소화합니다.

    • 자동화

      자동화를 확장하고 기술, 팀, 환경을 통합합니다.

  • 활용 사례

    • 가상화

      가상화와 컨테이너화된 워크로드를 위한 운영을 현대화합니다.

    • 디지털 주권

      중요 인프라를 제어하고 보호하세요.

    • 보안

      보안 중심 소프트웨어를 코딩, 빌드, 배포, 모니터링합니다.

    • 엣지 컴퓨팅

      엣지 기술로 소스에 더 가까운 위치에서 워크로드를 배포합니다.

  • 솔루션 탐색하기
  • 산업별 솔루션

    • 자동차
    • 금융 서비스
    • 의료
    • 산업 부문
    • 미디어 & 엔터테인먼트
    • 공공 부문(글로벌)
    • 공공 부문(미국)
    • 통신

클라우드 기술 살펴보기

Red Hat® Hybrid Cloud Console에서 맞춤형으로 Red Hat의 클라우드 제품과 솔루션을 사용하는 방법을 알아보세요.

제품
  • 플랫폼 제품

    • Red Hat AI

      하이브리드 클라우드 전반에서 AI 솔루션을 개발하고 배포합니다.

      새 버전
    • Red Hat Enterprise Linux

      유연한 운영 체제에서 하이브리드 클라우드 혁신을 지원합니다.

    • Red Hat OpenShift

      애플리케이션을 스케일에 맞게 빌드, 현대화, 배포하세요.

    • Red Hat Ansible Automation Platform

      기업 전체에 자동화를 구현하세요.

  • 추천 과정

    • Red Hat OpenShift Virtualization Engine
    • Red Hat OpenShift Service on AWS
    • Microsoft Azure Red Hat OpenShift
    • 모든 제품 보기
  • 체험 & 구매

    • 체험판 시작
    • 온라인 구매
    • 주요 클라우드 공급업체와의 연계
  • 서비스 & 지원

    • 컨설팅
    • 제품 지원
    • AI 서비스
    • 기술 계정 관리
    • 서비스 & 지원 탐색
교육
  • 교육 & 자격증

    • 교육 과정 및 시험
    • 자격증
    • Red Hat Academy
    • 교육 커뮤니티
    • 교육 서브스크립션
    • 교육 살펴보기
  • 추천 과정

    • Red Hat Certified System Administrator Exam
    • Red Hat System Administration I
    • Red Hat 교육 서브스크립션 체험판 (무료)
    • Red Hat Certified Engineer Exam
    • Red Hat Certified OpenShift Administrator Exam
  • 서비스

    • 컨설팅
    • 파트너 교육
    • 제품 지원
    • AI 서비스
    • 기술 계정 관리
정보
  • 기술 역량 강화

    • 도큐멘테이션
    • 핸즈온 랩
    • 하이브리드 클라우드 학습 허브
    • 인터랙티브 학습 경험
    • 교육 및 자격증
  • 다양한 리소스

    • 블로그
    • 이벤트 및 웨비나
    • 팟캐스트 & 영상 시리즈
    • Red Hat TV
    • 리소스 라이브러리

개발자 리소스

클라우드 네이티브 애플리케이션과 서비스를 빌드, 제공, 관리하는 데 도움이 되는 리소스와 툴을 살펴보세요.

파트너
  • 고객

    • 파트너 협력
    • Red Hat 에코시스템 카탈로그
    • 파트너 찾기
  • 파트너

    • 파트너 커넥트
    • 파트너 되기
    • 교육
    • 지원
    • 파트너 포털 액세스

전문 파트너와 협력해 솔루션 구현

Red Hat® 에코시스템 카탈로그에서 협업 커뮤니티의 전문성과 기술을 바탕으로 한 다양한 솔루션을 찾아보세요.

검색

항목 선택:

  • 체험판 시작
  • 서브스크립션 관리
  • Red Hat 채용 정보 보기
  • 기술 토픽 살펴보기
  • 구매 문의처
  • 고객 서비스에 문의하기

리소스 찾기:

  • 도큐멘테이션
  • 개발자 리소스
  • 기술 평가하기
  • Architecture Center
  • 보안 업데이트
  • 서포트 케이스

관심 토픽 선택:

  • AI
  • 애플리케이션 현대화
  • 자동화
  • 클라우드 네이티브 애플리케이션
  • Linux
  • 가상화
Console도큐멘테이션지원New 추천받기

추천 콘텐츠

검색하시는 동안 여러분께 유용한 리소스를 추천해 드립니다. 다음 중 선택해 보세요:

  • 제품 무료 평가판
  • 교육 과정 및 시험
  • 모든 제품
  • 기술 토픽
  • 리소스 라이브러리
로그인

Red Hat 계정을 사용하여 더 많은 리소스를 확인하세요

  • 콘솔 액세스
  • 이벤트 등록
  • 교육 & 체험판
  • 세계 최고 수준의 지원

일부 서비스는 서브스크립션이 필요합니다.

로그인 또는 등록하기
문의하기
  • Home
  • 리소스
  • Red Hat AI Inference Server

Red Hat AI Inference Server

2025년 9월 29일•
리소스 유형: 데이터시트

개요

AI의 진정한 가치는 빠르고 정확한 답변을 대규모로 제공하는 데 있습니다. Red Hat® AI Inference Server는 하이브리드 클라우드 전반에서 더 빠르고 비용 효율적인 모델 배포를 지원함으로써 추론 프로세스를 최적화하여 직접 이 가치를 실현합니다. 추론 프로세스란 AI 애플리케이션이 대규모 언어 모델(LLM)과 통신하고 데이터를 기반으로 응답을 생성하도록 하는 중요한 단계입니다.

어디서나 빠르고 비용 효율적인 추론

Red Hat AI 플랫폼의 일부인 Red Hat AI Inference Server는 일관되고 빠르며 비용 효율적인 추론을 대규모로 제공합니다. AI Inference Server를 사용하면 비즈니스 니즈를 충족하는 데 필요한 유연성과 선택권을 바탕으로 모든 하드웨어 가속기, 데이터센터, 클라우드, 엣지 환경에서 모든 생성형 AI 모델을 실행할 수 있습니다. AI Inference Server는 LLM 압축기를 사용하여 기본 모델과 학습된 모델을 모두 압축하는 모델 최적화를 통해, 혹은 빠른 추론 배포가 가능한 검증되고 최적화된 생성형 AI 모델의 컬렉션에 대한 액세스 제공을 통해 효율적 추론을 제공합니다. 

Red Hat AI Inference Server는 다양한 하드웨어 가속기 및 모델과 연동하고, Red Hat AI 플랫폼, Red Hat Enterprise Linux®, Red Hat OpenShift®, 타사 Linux 또는 쿠버네티스 배포판 등 원하는 인프라 및 운영 체제(OS)에서 실행될 수 있어 모든 아키텍처에 부합하는 유연성을 제공합니다.

표 1. 특징 및 장점

장점

설명

가상 대규모 언어 모델을 사용하여 모델 추론에 대한 효율적 접근 방식 제공

(vLLM)

AI Inference Server는 vLLM을 통해 GPU 메모리 사용과 추론 대기 시간을 최적화하여 모델 추론에 대한 효율적 접근 방식을 제공합니다.

운영 복잡성 감소

AI Inference Server는 하이브리드 클라우드 전반에서 모델을 배포하고 최적화하기 위한 일관된 플랫폼을 제공합니다. 또한 양자화를 포함한 고급 머신 러닝(ML) 기술을 사용자 친화적으로 관리하는 접근 방식을 제공하고 Prometheus, Grafana 등과 같은 관측성 툴과 연동할 수 있도록 지원합니다.

하이브리드 클라우드 유연성

vLLM을 핵심으로 하는 AI Inference Server를 사용하는 조직은 데이터센터, 클라우드 환경, 엣지 등 어디서나 AI 모델을 실행할 수 있습니다. 

기술 사양

  • 하이브리드 클라우드의 추론 런타임. 정교하고 강력한 추론 런타임을 가진 vLLM을 핵심으로 하는 AI Inference Server는 다양한 가속기, 쿠버네티스, Linux 환경 전반에서 기업이 원하는 모델을 실행할 수 있는 고성능 통합 플랫폼을 제공합니다. 또한 모니터링 강화를 위해 관측성 툴과 연동하고 유연한 배포를 위해 OpenAI와 같은 LLM API를 지원합니다.
  • LLM 압축기. AI 팀은 기본 모델과 학습된 모델을 크기에 관계없이 압축하여 컴퓨팅 사용량과 관련 비용을 줄이는 동시에 높은 모델 응답 정확도를 유지할 수 있으며, Red Hat과 협력하여 모델 최적화 이니셔티브를 통해 지원받을 수 있습니다.
  • 최적화된 모델 리포지토리. Hugging Face의 Red Hat AI 페이지에 호스팅되고 있는 AI Inference Server는 추론 배포가 즉시 가능한 주요 AI 모델들의 검증되고 최적화된 컬렉션에 대한 즉각적인 액세스를 제공해 모델 정확도를 저해하지 않으면서 효율성을 2~4배 높이는 데 도움이 됩니다.
  • 모든 Red Hat 제품에 대한 인증 완료. AI Inference Server는 Red Hat OpenShift AI와 Red Hat Enterprise Linux AI의 일부로 포함되며, Red Hat OpenShift와 Red Hat Enterprise Linux에서도 지원됩니다.
  • 타사 플랫폼 배포. AI Inference Server는 타사 Linux 및 쿠버네티스 플랫폼에 배포할 수 있으며, Red Hat의 타사 지원 정책을 적용받습니다. 이러한 경우 Red Hat은 Inference Server 구성 요소만 지원하며, 고객은 고객의 기반 플랫폼과 관련된 문제가 Red Hat Enterprise Linux나 Red Hat OpenShift에서 재현될 수 없는 경우 해당 문제에 대해 책임을 집니다.

완전히 최적화된 자동화로 가는 경로 살펴보기

AI Inference Server를 통해 빠르고 비용 효율적이며 확장 가능한 추론을 제공하는 방법은 Red Hat AI Inference Server 제품 페이지를 참조하세요.

태그:AI inference, AI/ML

Red Hat logoLinkedInYouTubeFacebookX

플랫폼

  • Red Hat AI
  • Red Hat Enterprise Linux
  • Red Hat OpenShift Enterprise
  • Red Hat Ansible Automation Platform
  • 모든 제품 보기

툴

  • 교육 및 자격증
  • 내 계정
  • 고객 지원
  • 개발자 리소스
  • 파트너 찾기
  • Red Hat 에코시스템 카탈로그
  • 도큐멘테이션

체험, 구매 & 영업

  • 제품 무료 평가판
  • Red Hat 스토어
  • 온라인 구입(일본)
  • Console

커뮤니케이션

  • 구매 문의처
  • 고객 서비스에 문의하기
  • 교육 문의
  • 소셜 미디어

Red Hat 소개

Red Hat은 Fortune 선정 500대 기업이 신뢰하는 어드바이저이며, 클라우드, 개발자, Linux, 자동화, 애플리케이션 플랫폼 기술 분야에서 전문성은 물론 수상 경력을 갖춘 서비스를 제공합니다.

  • 기업 소개
  • 기업 문화
  • 고객 성공 사례
  • 애널리스트 정보
  • 뉴스룸
  • 오픈소스를 위한 노력
  • 소셜 임팩트
  • 채용 정보

Change page language

Red Hat legal and privacy links

  • Red Hat 소개
  • 채용 정보
  • 이벤트
  • 위치
  • Red Hat에 문의
  • Red Hat 블로그
  • Red Hat의 포용성
  • Cool Stuff Store
  • Red Hat Summit
© 2025 Red Hat

Red Hat legal and privacy links

  • 개인 정보 취급 방침
  • 이용 약관
  • 제반 정책 및 지침
  • 디지털 접근성