통신 산업은 현대 네트워크의 복잡성 증가와 더 빠르고 안정적인 서비스 출시 요구에 따라 디지털 전환을 가속화하고 있습니다. 이러한 요구 사항을 충족하기 위해 운영자는 대량의 데이터를 수집하고 고속으로 작업을 자율적으로 실행하도록 설계된 자율 지능형 네트워크로 전환하고 있습니다. 자율 지능형 네트워크로의 전환은 단순한 기술 프로젝트가 아니라 수익을 보호하고 서비스 출시 시기를 앞당기기 위한 필수적인 운영 방식의 변화입니다. 그 결과, 네트워크 안정성을 강화하고 성능을 개선하며 비용 효율성을 높이는 기술을 사용하여 직접적인 사람의 개입 없이 운영할 수 있는 네트워크 운영 센터인 DarkNOC와 같은 개념이 등장했습니다.

Autonomous 네트워크 구축을 위한 두 가지 근본적인 원칙은 다음과 같습니다. 바로 더 나은 Network AI 인사이트와 실행 가능한 Automation입니다.

향상된 네트워크 AI 인사이트 지원

모든 AIOps 솔루션이 효과적이려면 고품질의 AI 기반 인사이트를 토대로 구축해야 합니다. 이러한 인사이트는 다음과 같은 역량에서 비롯됩니다.

  • 데이터 집계와 분석
  • 이상 감지와 예측
  • 지능형 경고와 근본 원인 분석
  • AI를 활용한 교차 도메인 이벤트 모니터링

Red Hat은 강력한 통합 기술 세트를 제공하여 AIOps 전략을 가속화합니다. Red Hat의 포트폴리오는 하이브리드 클라우드 인프라, 클라우드 네이티브 개발, AI, IT 자동화 및 관리, 엣지 컴퓨팅을 포함하며, Red Hat OpenShift, Red Hat AI, Red Hat Enterprise Linux(RHEL), Red Hat Ansible Automation Platform, Red Hat Runtimes와 Red Hat OpenShift Streams for Apache Kafka와 같은 중앙 집중식 메시징 시스템과 같은 기술로 구성됩니다. 이 제품들을 결합하면 AIOps 솔루션에 필요한 핵심 CaaS(Container-as-a-Service)와 AI 플랫폼을 제공할 수 있습니다.

실행 가능한 자동화 제공

인사이트를 얻는 것만으로는 충분하지 않습니다. 이러한 인사이트를 신속하고 신뢰성 있게 실행할 수 있는 능력이 필요합니다. 바로 실행 가능한 자동화(actionable automation)입니다. Red Hat은 TM Forum DarkNOC Catalyst 프로젝트와 같은 개념에 참여하면서 강조한 점은, 단편화된 독점 툴과 스크립트 환경을 극복할 수 있는 Red Hat Ansible Automation Platform을 중심으로 한 통합 자동화 접근 방식의 필요성이었습니다.

이 통합 접근 방식의 진정한 강점은 문제에서 해결까지 인간이 개입하는 과정보다 훨씬 빠르게 이동하는 폐쇄형 시스템(closed-loop system)을 만들 수 있다는 점입니다. 이 에이전트 시스템은 문제를 자동으로 감지하고, 해결 방법을 결정하며, 코드를 생성하고, 정책에 따라 감시 가능한 방식으로 문제를 수정합니다. 즉, 이전에는 전체 팀과 수시간이 필요했던 작업이 자동으로 처리되어 네트워크 가동 시간을 극대화할 수 있다는 의미입니다.

효과적인 멀티 도메인 자동화 전략의 핵심 요소는 다음과 같습니다.

  • Ansible YAML 코드와 같이 간소화를 위한 단일 자동화 언어
  • 코드 품질을 개선하고 기존 자동화 스크립트 부족 문제를 해결하기 위한 코드 생성 가속화
  • 확장 가능한 안정적인 실행과 속도 및 성능을 위한 확장 가능한 이벤트 기반 실행
  • 자동화된 코드형 정책은 AI 가이드라인 역할을 하는 동시에 자동화가 관련 규정 준수 및 안전 요구 사항을 충족하는지 확인

DarkNOC에서 에이전틱 AI로: 실행 가능한 자동화의 발전

현재 Red Hat은 Red Hat Ansible Automation Platform의 기본 기능인 Red Hat Ansible Lightspeed를 사용하여 생성형 AI 서비스로 코드를 생성하는 수준을 넘어 이러한 비전을 발전시키고 있습니다. 이제 자동화 루프를 완성하기 위해 에이전틱 AIMCP(모델 컨텍스트 프로토콜)를 추가하고 있습니다. 에이전틱 AI는 복잡한 작업을 계획하고 실행할 수 있는 자율 시스템이므로 획기적인 발전입니다. Red Hat은 에이전틱 AI를 Red Hat Ansible Automation Platform과 통합하여 문제 해결 코드를 생성할 수 있을 뿐만 아니라 자동화된 코드형 정책을 통해 AI 가이드라인으로 제어되는 실행을 지능적으로 오케스트레이션할 수 있는 시스템을 지원합니다.

모든 요소 통합

Red Hat은 통합 및 최적화된 포트폴리오가 생성형 AI와 에이전틱 AI를 모두 사용하여 더 나은 AI 인사이트와 실행 가능한 자동화를 결합함으로써 미래의 지능형 자율 네트워크를 구축하는 방법을 보여주는 포괄적인 데모를 구축했습니다.

Fig-1 AI-Driven Autonomous Intelligent Infrastructure : Gen and Agentic AI lab concept

데모 워크플로우 진행 방식은 다음과 같습니다.

  1. 이벤트 발생: 의도적으로 서비스 장애를 생성합니다.
  2. 알림 및 트리거: Red Hat Streams for Apache Kafka는 대규모 분산 환경에서 이벤트를 전송합니다. 그런 다음 Event-Driven Ansible이 이벤트를 캡처하여 Ansible Automation Platform에서 룰북 워크플로우를 자동으로 트리거합니다.
  3. AI 분석 및 인사이트: 워크플로우는 오류 로그를 Llama Stack 기반 에이전트로 전송하여 근본 원인 분석(RCA)을 수행합니다. 이 분석을 기반으로 문제 해결 플레이북을 만드는 데 사용될 프롬프트가 생성됩니다. 동시에 네트워크 운영 팀은 오류 로그와 AI가 생성한 RCA에 대한 알림을 받습니다.

Red Hat 기술은 이벤트 수집을 최적화하고 대규모 언어 모델(LLM)을 효율적으로 실행하여 근본 원인 분석을 개선함으로써 AIOps 솔루션을 향상시킵니다.

실행 가능한 자동화 제공

  1. 에이전트 결정: 에이전트는 분석을 기반으로 자체적으로 문제를 처리할 수 있는지 여부를 결정합니다. 에이전트는 Red Hat Ansible Automation Platform과 제3자 MCP를 확인하여 문제를 해결할 수 있는 기존 작업 템플릿(job template)이 있는지 검토합니다. 만약 템플릿을 찾으면, 에이전트가 이를 자동으로 실행하여 문제를 해결합니다. 그렇지 않으면, 올바른 조치를 취할 수 있도록 사람이 개입하는(human-in-the-loop) 프로세스를 통해 문제 해결을 처리합니다.

사람 개입(Human-in-the-Loop)을 통한 문제 해결

  1. Ansible 코드 생성: 사람 운영자가 AI 에이전트에 프롬프트를 제공합니다. 타사 MCP 및 Ansible Automation Platform을 사용하여 에이전트는 이 프롬프트를 Red Hat Ansible Lightspeed로 전달하여 새로운 문제 해결 플레이북을 생성합니다. 이 프로세스는 완전히 자동화할 수 있지만, 생성된 플레이북이 실행되기 전에 정확하고 안전한지 검토하고 검증하기 위해 사람이 개입하는 루프가 의도적으로 포함되어 있습니다.
  2. 시스템 구성: 생성된 플레이북이 정확하고 안전한지 확인한 후, 사람 운영자는 AI 에이전트에게 Ansible Automation Platform에서 워크플로우를 트리거하도록 지시합니다. 이 워크플로우는 새 Ansible 플레이북을 Git 리포지토리로 푸시하고, Ansible Automation Platform에서 프로젝트를 동기화하고, 이를 실행할 작업 템플릿을 생성합니다.
  3. 문제 해결(Remediation):  마지막으로 AI 에이전트는 Ansible Automation Platform을 호출하여 서비스 중단을 일으킨 원래 문제를 해결하는 Ansible Playbook의 실행을 오케스트레이션합니다. Ansible Automation Platform 내에서는 Policy as Code가 AI 에이전트에 대한 가드레일 역할을 하여, 예를 들어 유지보수 시간 동안 변경이 발생하지 않도록 합니다.

결론

완전한 자율 지능형 네트워크로의 여정은 복잡하지만, 명확한 경로가 있으며 이를 작고 실용적인 단계로 나눌 수 있습니다. 더 나은 네트워크 AI 인사이트와 실행 가능한 자동화를 결합함으로써, 서비스 제공업체는 단편화 문제를 극복하고 통합된 지능형 자가 치유(self-healing) 시스템을 구축할 수 있습니다. Red Hat의 통합 솔루션 세트는 이러한 자가 치유 시스템을 구축하는 데 필수적인 기반을 제공합니다.

Red Hat의 통합 기술 세트, TM Forum 이니셔티브 및 관련 Catalyst 프로젝트에 대해 더 알아보세요.

Hatville: 엣지 컴퓨팅이 실현되는 미니어처 도시

Hatville. 이 미니 도시를 둘러보고 엣지 컴퓨팅이 어떻게 우리 주변의 산업을 혁신하는지 경험해 보세요.

저자 소개

As an Associate Specialist Solutions Architect on the Red Hat Tiger Team, Saad helps guide customers through the exciting world of open source. He contribute(s) to shaping Red Hat's strategy and ensuring customers get the most out of our innovative solutions.

Since joining Red Hat in 2023, he has/have primarily focused on designing and implementing robust cloud-native platforms using Red Hat OpenShift. While OpenShift is his core focus for building scalable applications, he also explore(s) how these platforms can cleverly incorporate AI capabilities to unlock new possibilities for businesses. With a Master's degree in Computer Science, he bring(s) a strong technical foundation to every challenge, helping organizations transform their ideas into powerful, real-world solutions.

Expert Telecom Solution Architect with 19 years of hands-on experience in designing, implementing, and optimizing Multi-Platform Integration & Automation solutions.

UI_Icon-Red_Hat-Close-A-Black-RGB

채널별 검색

automation icon

오토메이션

기술, 팀, 인프라를 위한 IT 자동화 최신 동향

AI icon

인공지능

고객이 어디서나 AI 워크로드를 실행할 수 있도록 지원하는 플랫폼 업데이트

open hybrid cloud icon

오픈 하이브리드 클라우드

하이브리드 클라우드로 더욱 유연한 미래를 구축하는 방법을 알아보세요

security icon

보안

환경과 기술 전반에 걸쳐 리스크를 감소하는 방법에 대한 최신 정보

edge icon

엣지 컴퓨팅

엣지에서의 운영을 단순화하는 플랫폼 업데이트

Infrastructure icon

인프라

세계적으로 인정받은 기업용 Linux 플랫폼에 대한 최신 정보

application development icon

애플리케이션

복잡한 애플리케이션에 대한 솔루션 더 보기

Virtualization icon

가상화

온프레미스와 클라우드 환경에서 워크로드를 유연하게 운영하기 위한 엔터프라이즈 가상화의 미래