AI 인프라로 Red Hat Ansible Automation Platform을 선택하는 이유

URL 복사

기업은 AI(인공지능)를 활용해야 한다는 압박을 받고 있지만, AI 툴을 채택하고 유지 관리하는 데에는 여러 가지 인프라 문제가 존재합니다. 기업은 AI 워크로드의 가동 시간을 보장하고 늘어나는 맞춤형 모델 학습 수요를 충족하기 위해 더욱 강력한 컴퓨팅 성능, 네트워크 대역폭, 스토리지 용량을 필요로 합니다. AI 애플리케이션에서 처리하는 데이터는 민감한 경우가 많기 때문에 데이터 보안, 컴플라이언스, 개인정보 보호도 그에 못지않게 중요합니다. 

이처럼 증가하는 복잡성을 효율적으로 관리하여 비용을 제어하고 개발자 생산성을 높이면 AI로 인해 속도가 느려지는 대신 오히려 속도를 높일 수 있습니다.

AI를 통한 기회와 혁신에 대비하고자 하는 기업은 강력한 인프라 기반을 구축해야 하는데, 엔터프라이즈 규모에서는 IT 자동화를 통해서만 이러한 목표를 실현할 수 있습니다. 자동화를 통해 기업은 기존 IT 시스템의 구축, 확장, 유지 관리의 복잡성과 AI에 필요한 새로운 인프라 간의 균형을 맞출 수 있습니다.
 

웨비나 보기 

자동화와 AI 모두 수작업을 줄이면서 운영의 속도와 효율성을 높이는 데 도움이 됩니다. 하지만 다음과 같이 뚜렷한 차이점이 있습니다.

  • 자동화는 인간이 작성한 사전 정의된 룰에 따라 매번 동일한 방식으로 태스크를 수행합니다. 정해진 지침을 따르며 경험을 통해 학습하지 않습니다. 그러나 인간은 자신의 지식을 이처럼 코드화된 룰로 기록하여 복잡한 프로세스를 수동으로 수행하는 데 걸리는 시간보다 훨씬 짧은 시간 내에 오류 없이 완료할 수 있습니다. 자동화 플랫폼은 IT 인프라의 다양한 부분이 서로 빠르고 안전하게 통신할 수 있는 프레임워크 역할을 합니다. 여기에는 SSH(보안 셸) 프로토콜, API(애플리케이션 프로그래밍 인터페이스) 및 기타 메커니즘을 통한 통신과 자격 증명을 사용하고 제공되는 자동화를 실행할 수 있는 기능이 포함됩니다.
  • AI는 관찰된 패턴과 과거의 결과를 기반으로 구축된 학습된 행동이나 경험에 따라 태스크를 수행합니다. AI는 더 지적인 수준에서 인간을 모방하며, 데이터로부터 학습하고, 시간이 지남에 따라 개선되며, 경험을 기반으로 결정을 내릴 수 있습니다. 이상적인 구현에서 AI는 경험으로부터 학습하고 새로운 상황에 적응합니다. AI는 기존의 자동화 툴, 프레임워크, 플러그인을 통해 다양한 IT 시스템과 통신합니다. AI 툴에는 모델과 런타임 환경 외부의 환경 및 인프라와 상호작용하기 위해 AI 에이전트가 필요한 경우가 많습니다.

AI는 정보에 입각한 결정을 내리고 인간의 지능을 복제할 수 있어서 복잡한 의사 결정의 속도를 개선하고자 하는 기업에 매우 매력적인 툴입니다. 그러나 가장 발전되고 복잡한 AI 툴조차도 제공하는 잠재적인 이점이 전적으로 사용 방법에 달려 있으며, 현대적인 기업의 분산된 IT 환경에 AI를 도입하는 것은 결코 간단하지 않습니다. AI 솔루션을 자동화 기반과 결합하면 장기적인 목표를 향해 더욱 빠르게 나아가는 데 도움이 될 수 있습니다.

Forrester Wave™: 2024년 4분기 인프라 자동화 플랫폼 부문

엔터프라이즈 AI를 도입하거나 확장하려는 기업은 AI의 이점을 극대화하는 데 필요한 기술적, 전략적 요구 사항을 충족할 수 있도록 준비해야 합니다.

인프라의 가동 시간 및 가용성 보장

AI 툴에서 실시간으로 효과적인 의사 결정을 내리려면 모니터링하는 소스가 무엇이든 지속적인 데이터 흐름을 활용해야 합니다. 따라서 가동 시간이 매우 중요합니다. 병원에서 정확한 환자 데이터를 제공하거나 공장에서 비용이 많이 드는 사고를 예방하기 위해 오작동하는 장비를 끄는 등 AI 기반 비즈니스 운영에서는 가동 시간과 가용성을 보장할 수 있는 복구 가능한 인프라가 매우 중요합니다. 인프라가 불안정하고 데이터가 중단되면 AI 모델의 작동이 중단되어 운영에 부정적인 영향을 미치고, 고객 경험을 저해하며, 상당한 재정적 손실을 초래할 수 있습니다. 가동 시간을 일관되게 유지하려면 데이터센터에서 엣지 위치까지의 데이터 흐름과 저장을 적절하게 구성해야 합니다.

팀이 워크로드를 관리하고 확장하는 데 도움이 되는 사례 구축

AI 모델은 지속적으로 안정적이고 사용 가능한 IT 인프라에 의존하기 때문에 기업은 기업의 데이터센터를 평가하여 적절한 리소스가 있는지 확인해야 합니다. AI 워크로드의 가동 시간과 가용성에 대한 높은 수요를 충족하기 위해 전력과 쿨링 기능을 추가로 제공하고 서버, 스토리지, 네트워크 용량을 확장하기 위해 인프라를 업그레이드해야 할 수도 있습니다. 그러나 대부분의 조직은 적절한 리소스가 있더라도 이러한 프로세스를 효과적으로 관리하는 데 어려움을 겪습니다. 자동화를 사용하면 워크플로우를 효율적으로 관리하여 인프라 태스크가 빠르고 일관되게 실행되고 인적 오류가 발생할 여지가 줄어듭니다.

AI를 경쟁 차별화 요소로 활용할 수 있는 기업은 가장 큰 데이터 모델을 보유하거나 GPU에 과도한 비용을 지출한다고 해서 성공할 수 있는 것이 아닙니다. AI 워크로드를 원활하게 확장할 수 있는 자동화되고 복원 가능한 인프라를 운영함과 동시에 AI 툴과 통합하여 더욱 지능적으로 변화해야 성공할 수 있습니다. 간단히 말해 자동화 여정을 자동화하고 성숙시키지 않으면 AI를 통합하고 AI의 이점을 활용하는 데 더 오랜 시간이 걸립니다.

Red Hat® Ansible® Automation Platform은 AI 모델과 인프라 구성 요소의 배포, 관리, 구성, 라이프사이클을 간소화함으로써 AI 구현을 위한 견고한 기반을 구축합니다. Ansible Automation Platform은 다음을 수행하는 데 도움이 됩니다.

배포 표준화. Ansible Playbook은 운영 체제, 서버, 스토리지, 모델, 컨테이너, 데이터, 네트워킹 리소스와 같은 AI 구성 요소를 배포하는 일관되고 반복 가능한 방법을 제공합니다. Ansible Automation Platform은 인프라를 코드화하여 모든 AI 환경에서 일관성과 안정성을 높이고 구성 오류나 불일치가 발생할 가능성을 줄여줍니다. 또한 표준화된 배포를 BCDR(비즈니스 연속성 및 재해 복구, Business Continuity and Disaster Recovery) 계획과 운영을 위한 청사진으로 사용할 수 있습니다.

모니터링 및 알림 통합. Ansible Automation Platform은 모니터링 및 알림 툴과 원활하게 통합되므로 IT 운영 팀이 AI 인프라 구성 요소에 대한 모니터링 에이전트, 임계값, 알림 규칙을 자동으로 설정할 수 있습니다. Ansible Automation Platform을 통해 성능 메트릭과 시스템 상태를 지속적으로 추적함으로써 잠재적인 문제를 사전에 식별하고 해결함으로써 AI 운영 중단을 방지할 수 있습니다.

데이터 관리. AI 모델을 학습시킬 때 가장 어려운 태스크 중 하나는 데이터가 생성된 위치에서 학습시킬 수 있는 위치로 데이터를 가져오는 것입니다. Ansible Automation Platform은 데이터를 서버에서 지역 내 스토리지로 이동하여 데이터 보안을 강화하는 데 도움이 됩니다. 또한 Red Hat OpenShift® AI를 사용하여 모델을 학습시키기 위해 적절한 사용자가 데이터에 액세스할 수 있도록 합니다.

Ansible Automation Platform은 하이브리드 IT 환경을 관리하는 데 필요한 자동화 연결 역할을 합니다.

구성원과 프로세스를 통합하는 방법을 알아보세요.

이러한 활용 사례를 자동화하면 표준화되고 코드화된 지능적인 Day 2 오퍼레이션으로 이어질 수 있습니다.

AI 인프라 자동화

Ansible Automation Platform을 사용하면 IT 인프라를 최적화하여 AI 워크로드 성능을 향상하는 동시에 AI를 사용하여 스택을 개선할 수 있습니다. Ansible Automation Platform을 통해 AI 서비스를 설정 및 구성하고, 다양한 모델을 설치 및 관리하고, GPU를 구성하고, 인프라의 다양한 부분을 조정할 수 있습니다.

Ansible Automation Platform을 통해 누릴 수 있는 장점은 다음과 같습니다.

  • AI 배포 및 구성.AI 워크로드의 배포 및 구성을 자동화하여 지속적인 안정 상태를 보장합니다. 단일 YAML 기반 언어를 사용하여 기술 스택 전반에서 스토리지, 서버, 엣지 기기, 네트워크 스위치, GPU, 데이터의 구성과 AI 기능 활성화를 간소화합니다.
  • Red Hat AI 인프라 조정. 프로덕션 환경에서 원활하게 운영할 수 있도록 AI 플랫폼의 모든 구성 요소를 연결하고 구성합니다.
  • 엣지 데이터 온보딩. 사물 인터넷(IoT) 장치와 같은 새로운 엣지 배포의 온보딩을 간소화하여 해당 데이터를 수집하고 AI 솔루션과 동기화합니다. AI 학습 및 추론 모델을 위해 데이터 수집에 대한 설정과 배포를 조정합니다.

실행 가능한 AIOps 제공

AIOps는 조직이 점점 더 복잡해지는 환경에서 안정성, 확장성, 민첩성을 개선할 수 있도록 빅데이터와 AI를 결합하여 광범위한 IT 운영 태스크를 개선하거나 부분적으로 대체합니다. 기술 스택에 있는 대부분의 기존 툴에 예측 AI 기능이 내장되어 있을 가능성이 높지만, 이러한 기능을 효율적으로 사용하여 그 이점을 극대화하는 것은 사용자의 몫입니다.

Ansible Automation Platform은 전체 인프라를 아우르는 시스템과 툴을 통해 AI 기능을 오케스트레이션하여 AI를 즉시 사용할 수 있도록 도와줍니다. 기존 AI 솔루션을 이러한 통합 워크플로우에 통합하면 Event-Driven Ansible을 사용하여 모든 종류의 관측성 데이터를 자동화된 작업으로 전환하고 다음 목표를 실현할 수 있습니다.

  • 자가 치유(Self-healing) 인프라 구축.Red Hat AI solutions를 Event-Driven Ansible과 함께 사용하여 IT 이벤트에 자동으로 대응하고 문제를 해결합니다. 예를 들어, 사전 정의된 사용률 임곗값 80%로 서버의 메모리 사용량을 모니터링하는 경우, 서버가 한계에 가까워지면 메모리를 추가하도록 알리는 알림을 설정할 수 있습니다. 관측성 툴에서 데이터를 자동으로 수집하고, Event-Driven Ansible을 사용하여 이벤트를 선택하고, AI 플랫폼으로 이벤트를 해석하고, Ansible Lightspeed에서 플레이북을 생성하고, 문제를 해결하는 엔드 투 엔드 워크플로우를 만들 수 있습니다. 그러면 해당 데이터를 전체 주기 루프에 넣고 로그를 생성하여 향후 인시던트에 대비하도록 AI를 학습시킬 수 있습니다.
  • 지원 및 인시던트 티켓 강화.Red Hat Insights 또는 타사의 기타 관측성 솔루션을 사용하여 Event-Driven Ansible의 알 수 없는 이벤트를 조정하고 IT 인프라 엔지니어에게 컨텍스트를 제공합니다. Event-Driven Ansible에서 이벤트를 처리했지만 사용자가 해야 할 일이 무엇인지 모르는 경우, Red Hat Enterprise Linux® AI 또는 Red Hat OpenShift AI와 같은 AI 솔루션과 통합하면 오류의 의미를 파악할 수 있습니다. 그러면 문제가 자동으로 보고될 뿐만 아니라 엔지니어가 트러블슈팅을 시작할 수 있도록 컨텍스트가 즉시 제공되므로 MTTR(평균 문제 해결 시간, Mean Time To Resolution)을 단축할 수 있습니다.
  • 비용 및 리소스 최적화. Red Hat Insights는 AI 사용자 요구 사항과 연결된 노드, 클러스터, 프로젝트를 최적화하는 방법을 파악할 수 있습니다. 자동화된 워크플로우에서 최적화를 실행할 수 있으므로 AI 워크플로우에 사용자가 개입할 필요가 없습니다.
     


Ansible Lightspeed를 통한 생산성 향상

Red Hat의 생성형 AI 서비스는 자동화 개발자와 운영자가 더 빠르게 온보딩하고 자동화할 수 있도록 지원합니다. 자동화 코드 작성 방법을 막 배우기 시작했거나 Ansible Automation Platform UI 내에서 도움이 필요한 경우, Red Hat Ansible Lightspeed with IBM watsonx Code Assistant를 사용하면 Red Hat 전문가 팀이 바로 옆에서 지원하는 듯한 경험을 할 수 있습니다.

  • 자동화 콘텐츠 생성 가속화. Ansible Lightspeed는 신뢰할 수 있는 자동화 코드 생성의 장벽을 낮추어 사용자가 더 빠르게 온보딩하고 숙련도를 높일 수 있도록 지원합니다. Ansible 전용 데이터로 학습시킨 이 생성형 AI 서비스는 자동화 아이디어와 기능적 YAML 코드 사이의 격차를 해소해 줍니다. Ansible Lightspeed는 자연어 프롬프트를 기반으로 IBM watsonx Code Assistant에서 제공하는 200억 개의 Ansible 전용 매개변수로 구성된 파운데이션 모델을 활용하여 Ansible 모범 사례에 따른 코드 권장 사항을 생성합니다.
  • 신속한 답변 찾기. Ansible Lightspeed의 생성형 AI 기능은 Ansible Automation Platform UI 내에서 바로 직관적인 채팅 기반 가상 어시스턴트를 지원하기도 합니다. 자동화 워크플로우를 설정하는 방법을 배우고 싶으신가요? Ansible Lightspeed는 단계별 지침을 제공합니다. Ansible Automation Platform 기능에 대해 자세히 알고 싶으신가요? 질문을 입력하기만 하면 명확한 설명과 함께 관련 도큐멘테이션와 기타 Red Hat 리소스를 받을 수 있습니다.

Red Hat은 특정 목적을 위해 구축된 소규모 모델, 효율적인 커스터마이징 기술, 어디서나 개발과 배포가 가능한 유연성으로 엔터프라이즈 AI 도입을 가속화할 수 있도록 지원합니다. 기업에서 AI 기능을 최대한 활용하려면 IT 자동화가 필수적입니다. 자동화를 통해 복구 능력과 가동 시간을 늘려 IT 인프라를 개선하고, 기존 IT 솔루션을 조정하여 새로운 AI 기능을 활용하고, AIOps를 활성화하여 IT 인프라 엔지니어를 직접 지원하는 등 자동화는 현대적인 기업에서 AI를 구현하는 데 도움이 되는 기반에 해당합니다.

Red Hat Ansible Automation Platform은 자동화를 전사적으로 생성, 관리, 확장하는 데 필요한 모든 툴과 함께 제공되는 엔드 투 엔드 자동화 플랫폼입니다. 이는 운영 복잡성을 줄이고 팀 전체에 일관된 사용자 환경을 제공하여 아키텍트, 개발자 및 시스템 관리자 간 장벽을 허물어줍니다. Ansible Automation Platform 서브스크립션에는 이벤트 기반 솔루션, 확장되는 개발 툴 제품군, 모듈, 플레이북, 도큐멘테이션이 포함된 Ansible Content Collections에 대한 액세스가 포함되어 있어 여러 부서로 구성된 팀이 빠르게 자동화를 시작할 수 있습니다.

Ansible Automation Platform에 대해 자세히 알아보기

Red Hat AI

Red Hat AI는 하이브리드 클라우드 환경 전반에서 AI 솔루션의 개발과 배포를 가속화하는 유연하고 비용 효율적인 솔루션을 제공합니다.

T 자동화 솔루션: 기업을 위한 자동화 툴 선택 전략과 방법

IT 자동화 툴과 전략을 어떤 방법으로 선택할까요? Red Hat 자동화 솔루션으로 IT 운영의 효율화, 기술 도입 지원, 기업의 전반적인 비즈니스 자동화 확장을 향상하세요.

추가 자료

소프트웨어 정의 데이터센터(SDDC)란?

소프트웨어 정의 데이터센터(SDDC)는 컴퓨팅, 스토리지, 네트워킹 등과 같은 전통적인 인프라 구성 요소를 추상화하여 소프트웨어 서비스로 제공하는 IT 관리 방식입니다.

프로비저닝이란? IT 인프라 설정과 리소스 관리의 핵심 과정

프로비저닝(provisioning)이란 IT 인프라 설정과 데이터 및 리소스 액세스 관리를 위한 중요한 프로세스입니다. 데이터와 리소스 액세스를 관리하는 방법을 알아보세요.

IT 자동화 전략 수립 방법

격리된 자동화로는 한계가 있습니다. 자동화를 전체 IT 운영 영역으로 확장하려면 팀, 프로세스, 단절된 워크플로우를 통합하는 자동화 전략이 필요합니다.

자동화와 관리 리소스

주요 제품

관련 기사