Account 로그인
Jump to section

Red Hat OpenShift 기반 AI/ML

URL 복사

Red Hat, 자체 관리형 Red Hat OpenShift(Red Hat의 AI/ML 클라우드 서비스)로 AI/ML 워크플로우와 AI 기반 지능형 애플리케이션 제공 가속화

 

MI 라이프사이클이란? 

대규모 볼륨과 다양한 데이터, 풍부한 컴퓨팅, 지능형 애플리케이션을 빌드할 수 있는 오픈소스 머신 러닝 툴이 제공하는 장점을 확보하기 위한 다단계 프로세스입니다.

라이프사이클에는 대체로 다음 네 가지 단계가 있습니다.

  1. 데이터 수집 및 준비: 입력 데이터의 완전성과 고품질 보장
  2. 모델 개발: 최상의 예측 정확도를 갖춘 모델의 교육, 테스트 및 선택 포함
  3. 모델 통합: 애플리케이션 개발 프로세스 및 추론에 모델 통합
  4. 모니터링 및 관리 모델링: 비즈니스 성과를 측정하고 잠재적인 프로덕션 데이터 드리프트에 대처

데이터 과학자는 선택한 모델이 계속해서 최상의 예측 정확도를 제공할 수 있도록 ML 모델링을 주로 담당합니다.

 

데이터 과학자가 당면한 핵심 과제는 다음과 같습니다.

  • 적합한 ML 툴 선택 및 배포(예: Apache Spark, Jupyter Notebook, TensorFlow, PyTorch 등)
  • 최상의 예측 정확도를 제공하는 ML 모델을 교육, 테스트, 선택, 유지하는 데 필요한 시간과 복잡성
  • 하드웨어 가속화 기능이 없어 모델링 및 추론 태스크 실행 속도 저하
  • 인프라 프로비저닝 및 관리를 위해 IT 운영 팀에 반복적으로 의존
  • 데이터 엔지니어 및 소프트웨어 개발자와 협업해 입력 데이터를 안전하게 보호하고 애플리케이션 개발 프로세스 중 ML 모델 배포

컨테이너와 쿠버네티스는 데이터 과학자가 ML 모델을 교육, 테스트, 배포하는 데 필요한 민첩성, 유연성, 이식성, 확장성을 제공하는 기술로서, ML 라이프사이클을 가속화하는 핵심 요소입니다.

Red Hat® OpenShift®는 업계를 선도하는 컨테이너 및 쿠버네티스 하이브리드 클라우드 플랫폼입니다. 이 플랫폼은 이러한 장점을 모두 제공하며 통합 DevOps 기능(예: OpenShift Pipelines, OpenShift GitOps, Red Hat Quay)과 하드웨어 가속기와의 통합으로 데이터 과학자와 소프트웨어 개발자 간 협업을 증진하며 하이브리드 클라우드(데이터센터, 엣지, 퍼블릭 클라우드) 전반에서 지능형 애플리케이션 롤아웃을 가속화합니다.

    데이터 과학자 역량 강화

    • 하이브리드 클라우드 전반에 걸쳐 데이터 과학자에게 일관된 셀프 서비스 클라우드 경험 제공
    • 데이터 과학자가 어떤 환경에서든 유연하게 선택한 컨테이너화 ML 툴을 사용할 수 있도록 지원하여 ML 모델을 빠르게 빌드, 확장, 재현 및 공유
    • 자체 관리형 및 Red Hat AI 클라우드 서비스 옵션을 위한 Red Hat 인증 쿠버네티스 오퍼레이터를 통해 가장 적합한 ML 툴 사용
    • 반복적이고 컴퓨팅 집약적인 ML 모델링 태스크용 인프라를 프로비저닝하기 위해 IT에 의존할 필요 없음
    • 특정 클라우드 제공업체와 해당 업체의 ML 툴 메뉴와 관련된 "종속성(Lock-In)" 우려 해소
    • CI/CD 툴과의 긴밀한 통합으로 ML 모델을 필요에 따라 반복적으로 신속히 배포

     

    컴퓨팅 집약적인 ML 모델링 작업 가속화

    Red Hat 인증 GPU 오퍼레이터를 통해 NVIDIA GPU와 같이 널리 사용되는 하드웨어 가속기와 통합하면 OpenShift가 높은 수준의 컴퓨팅 리소스 요구 사항을 원활하게 충족하여, 해당 모델이 프로덕션 환경에서 새로운 데이터를 경험하는 과정에서 최상의 예측 정확도와 ML 추론 작업을 제공하는 ML 모델을 선택할 수 있습니다.

     

    지능형 애플리케이션 개발

    OpenShift DevOps 자동화 기능을 ML 라이프사이클로 확장하면 데이터 과학자, 소프트웨어 개발자, IT 운영 팀간 협업이 증진되므로 ML 모델을 지능형 애플리케이션 개발에 신속히 통합할 수 있습니다. 이를 통해 생산성을 높이고 ML 기반 지능형 애플리케이션의 라이프사이클 관리를 간소화할 수 있습니다.

    • OpenShift Build로 컨테이너 모델 이미지 레지스트리에서 빌드
    • OpenShift Pipelines로 ML 모델 기반 지능형 애플리케이션을 지속적으로 반복 개발
    • OpenShift GitOps로 ML 모델 기반 지능형 애플리케이션의 지속적 배포 자동화
    • Red Hat Quay로 모델 컨테이너 이미지 및 마이크로서비스의 버전을 관리할 수 있는 이미지 리포지토리

    OpenShift는 다양한 업종별 조직이 하이브리드 클라우드에서 지능형 애플리케이션을 개발함으로써 비즈니스 및 미션 크리티컬 이니셔티브를 가속화하도록 지원하고 있습니다. 몇 가지 활용 사례로 사기 감지, 데이터 중심 진단 및 치료, 커넥티드 카, 자율 주행, 석유 및 가스 탐사, 자동 보험 견적, 청구 처리 등을 들 수 있습니다.

    애널리스트 리포트: AI 이니셔티브를 지원하는 오픈소스 및 클라우드 기반 소프트웨어

    성공 사례: 혁신적인 데이터 플랫폼을 사용하여 생명을 구하는 데 일조한 HCA Healthcare

    동영상: Red Hat OpenShift를 적용한 BMW ConnectedDrive

    Red Hat Decision Manager는 ML 모델을 의사결정 모델과 통합할 수 있는 클라우드 네이티브 비즈니스 룰 및 의사결정 플랫폼입니다. 이러한 모델은 OpenShift 기반 마이크로서비스로 제공하여 추론에 사용할 수 있습니다. Prometheus, Grafana와 같은 모니터링 툴과 통합하면 프로덕션 환경에서 ML 모델의 (비즈니스) 성과를 모니터링하고 관리할 수 있습니다.

    Red Hat Decision Manager에 관해 자세히 알아보려면 Red Hat Decision Manager 제품 페이지를 참조하거나 Red Hat Developer 사이트를 방문하세요.

    Red Hat Data Services는 데이터 수집 및 준비, ML 모델링에서 추론 단계에 이르는 ML 라이프사이클에서 페타바이트 규모의 스토리지 요구 사항을 충족하기 위해 구축되었습니다. Red Hat Data Services 포트폴리오에는 Red Hat Ceph Storage라고 하는 오픈소스 소프트웨어 정의 스토리지 시스템이 포함되어 있습니다. 이 시스템은 S3 개체, 블록, 파일 스토리지에 대한 통합 지원을 제공하고 업계 표준 상용 하드웨어에 대규모 확장성을 제공합니다.

    예를 들어, S3 또는 퍼시스턴트 볼륨을 통해 OpenShift의 컨테이너화된 Jupyter Notebook에 확장 가능한 Ceph 스토리지를 제공할 수 있습니다.

    Open Data Hub 프로젝트는 Red Hat OpenShift, Red Hat Ceph Storage, Red Hat AMQ Streams, 그리고 몇 가지 업스트림 오픈소스 프로젝트를 기반으로 한 기능적 아키텍처로서, 필수 ML 툴링이 포함된 개방형 ML 플랫폼을 구축하는 데 도움이 됩니다.

    블로그 게시물을 통해 Open Data Hub 프로젝트에 대해 자세히 알아보고 여기에서 시작하세요.

    추가 자료

    e-book

    프로덕션 레디 AI/ML 환경을 구축하기 위해 고려해야 할 중요 사항

    학습

    인터랙티브 교육 포털

    OpenShift 기반 AI 및 머신 러닝

    개발자 및 데이터 과학자를 위한 툴

    OpenShift Data Science logo

    Red Hat® OpenShift® Data Science는 데이터 과학자 및 지능형 애플리케이션 개발자들을 위한 관리형 클라우드 서비스입니다. 프로덕션에 배포하기 전에 퍼블릭 클라우드에서 머신 러닝(ML) 모델을 신속하게 개발, 교육 및 테스트할 수 있도록 완벽하게 지원되는 샌드박스를 제공합니다.

    Illustration - mail

    유용한 콘텐츠 더 보기

    Red Hat Shares 뉴스레터를 구독해 보세요(무료).