고성능 컴퓨팅(HPC)은 전 세계의 주요 과학적 발전의 상당 부분을 주도합니다. 가장 신뢰할 수 있는 엔터프라이즈 Linux 플랫폼 중 하나인 Red Hat Enterprise Linux(RHEL)는 이러한 많은 HPC 워크로드의 기반 역할을 하며 자동차, 금융 서비스, 바이오의료, 에너지 등의 산업에 서비스를 제공합니다.
한편 퍼블릭 클라우드는 엄청난 유연성과 다이나믹 인프라를 제공하면서 광범위한 컴퓨팅 시장에서 계속해서 주목을 받고 있습니다. 이러한 추세는 HPC에서도 나타나고 있으며, 조직은 온디맨드로 HPC 클러스터를 확장하기 위해 동일한 유연성과 추가 컴퓨팅 용량을 활용하여 제품 개발 또는 연구 주기를 단축하고자 합니다.
새로운 오퍼링인 RHEL for HPC on Azure를 출시하게 되어 기쁩니다. Red Hat은 Microsoft와 긴밀히 협력하여 공동 고객의 배포 시간을 단축할 수 있는 기술 요구 사항을 파악했습니다. RHEL for HPC on Azure를 사용하면 Azure 인프라에서 가속화된 HPC 컴퓨팅 환경에 필요한 툴과 라이브러리를 설치하는 자동화를 얻을 수 있습니다.
RHEL HPC 시스템 롤 소개
RHEL HPC 9.6 for Azure 클라우드 오퍼링은 RHEL 시스템 롤을 기반으로 합니다.
RHEL HPC 시스템 롤은 HPC 환경의 배포 및 구성을 간소화하기 위해 특별히 설계된 Red Hat Ansible Automation Platform 롤입니다. 이 시스템 롤은 고객이 수동으로 통합해야 하는 NVIDIA CUDA 드라이버, CUDA 툴킷, NVIDIA Collective Communications Library(NCCL), NVIDIA Fabric Manager, NVIDIA RDMA 패키지, Open MPI 등 필요한 타사 구성 요소를 설치합니다. 모듈식이므로 사용자가 특정 패키지를 선택적으로 설치하거나 건너뛸 수 있으며, Azure에서 이러한 대규모 설치에 충분한 디스크 공간이 할당되도록 스토리지 볼륨을 구성하는 등의 기능을 제공합니다.
이제 Azure 마켓플레이스에서 RHEL HPC 이미지 목록을 선택할 수 있습니다. 가상 머신(VM) 인스턴스가 시작된 후에는 몇 가지 기본 명령을 따라 RHEL HPC 시스템 롤(이미 이미지에 설치됨)을 실행하기만 하면 됩니다. 시스템 롤이 관련 HPC 패키지를 모두 다운로드한 후에는 이 이미지를 골든 이미지로 저장하고 이를 기반으로 여러 HPC 인스턴스를 생성할 수 있습니다.
RHEL HPC 시스템 롤을 통해 Red Hat은 향후 12개월 동안 HPC 패키지를 지속적으로 릴리스(빠른 경로)하는 동시에 6개월의 RHEL 릴리스 주기(저속 경로)에 완전히 맞출 필요가 없습니다. Red Hat 오퍼링이 성장함에 따라 RHEL 릴리스(RHEL9.8, RHEL9.9, RHEL10.2 등) 또는 최신 버전의 RHEL HPC 시스템 롤을 선택하여 사용할 수 있는 옵션을 기대할 수 있습니다.
제공 내용
RHEL HPC MVP의 목표는 엔드 투 엔드 HPC 클러스터 생성 및 관리를 위한 Microsoft의 플랫폼인 Azure CycleCloud에서 배포할 수 있는 Azure 최적화 이미지 인스턴스를 생성하는 것입니다. HPC 고객은 복잡한 클러스터 관리 및 프로비저닝 태스크를 본질적으로 처리하는 CycleCloud를 활용하는 경우가 많습니다.
Red Hat은 RHEL 9.6 이미지를 대상으로 Ansible을 통해 제공되는 새로 개발된 RHEL HPC 시스템 롤을 중심으로 Azure Marketplace를 위한 간소화된 RHEL HPC 오퍼링을 출시합니다. 이 오퍼링은 RHEL 이미지에서 HPC 환경의 배포 경험을 크게 개선합니다.
이 시스템 롤은 현대적인 HPC 워크로드에 필수적인 여러 핵심 종속성을 통합하도록 설계되었습니다:
- NVIDIA CUDA 드라이버: 계산을 위해 NVIDIA GPU를 활성화하는 데 필요한 독점 커널 모듈 및 드라이버를 설치합니다.
- NVIDIA CUDA Toolkit: CUDA 인프라를 사용하는 애플리케이션을 작성하는 데 필요한 개발 환경이 포함되어 있습니다.
- NVIDIA Collective Communications Library(NCCL): GPU 간 통신에 최적화된 기본 요소입니다. 이 라이브러리는 다중 GPU 시나리오에 중요하며 NVIDIA 리포지토리에 포함되어 있습니다.
- NVIDIA Fabric Manager: 이 패키지는 InfiniBand 및 네트워킹 유틸리티와 관련이 있으며, 특히 GPU 간 고속 상호 연결에 필수적인 NVSwitch와 같은 기능을 지원합니다.
- Open MPI(Message Passing Interface): 분산형 HPC 작업의 기본 표준으로, 클러스터의 노드 간 통신을 지원합니다.
이 솔루션을 배포하는 방법에 대한 자세한 내용은 RHEL Azure HPC 시스템 롤 설명서를 참조하세요.
목표
이 초기 릴리스 MVP는 완전한 오퍼링을 향한 첫 단계로, Azure에서 HPC 워크로드를 실행할 때 필요한 더 많은 툴, 라이브러리, 구성을 제공합니다. 앞으로 몇 달에 걸쳐 Red Hat의 전문가들이 직접 테스트하고 검증한 핵심 HPC 콘텐츠를 더욱 폭넓게 반영한 업데이트를 순차적으로 제공할 예정입니다. MVP를 구매하는 고객은 이러한 업데이트와 이 오퍼링의 확장된 기능에 액세스할 수 있습니다.
지금 바로 클라우드 HPC 용량 활용
Red Hat은 오랫동안 HPC 분야에서 신뢰할 수 있는 파트너로서 과학적 발견과 제품 개발을 지원해 왔습니다. 고객이 HPC를 클라우드로 확장하는 데 신뢰할 수 있는 파트너가 되어 기쁩니다. Azure용 RHEL for HPC를 사용하는 고객은 그 어느 때보다 빠르게 Azure 인프라에 HPC 클러스터를 배포할 수 있습니다.
이 오퍼링은 Azure 마켓플레이스에서 찾을 수 있으며 Azure 기반 HPC(고성능 컴퓨팅)를 위한 Red Hat Enterprise Linux(RHEL)에서 제공됩니다. 지금 바로 체험해 보고 HPC 배포를 가속화하세요.
제품 체험판
Red Hat Enterprise Linux | 제품 체험판
저자 소개
James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.
유사한 검색 결과
Red Hat Enterprise Linux now available on the AWS European Sovereign Cloud
More than meets the eye: Behind the scenes of Red Hat Enterprise Linux 10 (Part 4)
The Overlooked Operating System | Compiler: Stack/Unstuck
Linux, Shadowman, And Open Source Spirit | Compiler
채널별 검색
오토메이션
기술, 팀, 인프라를 위한 IT 자동화 최신 동향
인공지능
고객이 어디서나 AI 워크로드를 실행할 수 있도록 지원하는 플랫폼 업데이트
오픈 하이브리드 클라우드
하이브리드 클라우드로 더욱 유연한 미래를 구축하는 방법을 알아보세요
보안
환경과 기술 전반에 걸쳐 리스크를 감소하는 방법에 대한 최신 정보
엣지 컴퓨팅
엣지에서의 운영을 단순화하는 플랫폼 업데이트
인프라
세계적으로 인정받은 기업용 Linux 플랫폼에 대한 최신 정보
애플리케이션
복잡한 애플리케이션에 대한 솔루션 더 보기
가상화
온프레미스와 클라우드 환경에서 워크로드를 유연하게 운영하기 위한 엔터프라이즈 가상화의 미래