AI 인프라의 전반적인 이해

공개 2024년 3월 15일•3분 읽기

일상 생활에서 인공지능(AI)이 점점 더 많이 사용되면서 효과적이고 효율적인 워크플로우를 지원하는 구조의 중요성이 부각되고 있습니다. 인공지능 인프라(AI 인프라)가 필요한 것은 바로 이 때문입니다.

잘 설계된 인프라는 데이터 사이언티스트와 개발자가 데이터에 액세스하고 머신 러닝 알고리즘을 배포하며 하드웨어의 컴퓨팅 리소스를 관리하는 데 도움이 됩니다.

AI 인프라는 안정적이고 확장 가능한 데이터 솔루션을 개발하고 배포하기 위해 인공지능과 머신 러닝(AI/ML) 기술을 결합합니다. 이 기술은 머신 러닝을 지원하여 머신이 인간처럼 사고할 수 있게 해줍니다.

머신 러닝이란 명시적으로 프로그래밍하지 않고도 패턴을 찾고, 예측하고, 경험을 통해 배우도록 컴퓨터를 학습시키는 기술입니다. 머신 러닝은 생성형 AI에 적용이 가능하며, 대량의 데이터를 분석하고 해석하는 머신 러닝 기술인 딥러닝을 통해 구현할 수 있습니다.

Red Hat AI 살펴보기

AI 인프라 기술 스택

기술 스택은 소프트웨어 애플리케이션을 빌드하고 배포하는 데 사용하는 기술, 프레임워크, 툴의 집합입니다. 시각적으로 이러한 기술은 하나씩 '쌓여' 애플리케이션을 빌드합니다. AI 인프라 기술 스택은 세 가지 필수 계층을 통해 애플리케이션의 개발과 배포를 가속화할 수 있습니다.

기업을 위한 AI 살펴보기

애플리케이션 계층은 엔드 투 엔드 애플리케이션이나 최종 사용자 대상 애플리케이션과 같은 툴을 사용할 때 사람과 머신이 협업할 수 있는 기회를 제공합니다. 최종 사용자 대상 애플리케이션은 주로 오픈소스 AI 프레임워크를 통해 빌드되어 사용자 정의가 가능하고 특정 비즈니스 요구 사항을 충족하도록 맞춤화할 수 있는 모델을 생성합니다.

모델 계층은 AI 제품이 작동하는 데 도움이 되며, 배포용 호스팅 솔루션을 필요로 합니다. 이 계층에는 기반을 제공하는 다음 세 가지 모델이 있습니다.

일반 AI: 사람 두뇌의 사고 및 의사결정 능력을 모방합니다. 예를 들면 OpenAI의 ChatGPT나 DALL-E와 같은 AI 애플리케이션입니다.
특정 AI: 특정한 데이터를 사용하여 정확한 결과를 생성합니다. 광고 카피와 노래 가사를 생성하는 태스크가 그러한 예입니다.
하이퍼로컬 AI: 각 분야의 전문 지식이 탑재되어 정확성과 관련성이 최고 수준에 도달할 수 있는 인공지능입니다. 과학 논문 작성이나 인테리어 디자인 모형 생성이 이에 해당합니다.

인프라 계층에는 모델 빌드 및 학습에 필요한 하드웨어와 소프트웨어가 포함됩니다. GPU(하드웨어), 최적화 및 배포 툴(소프트웨어)을 비롯한 전문 프로세서와 같은 구성 요소가 이 계층에 해당합니다. 클라우드 컴퓨팅 서비스도 인프라 계층에 속합니다.

Red Hat OpenShift AI에 대해 자세히 알아보기

지금까지 AI 인프라와 관련된 세 가지 계층을 알아봤습니다. 이제부터는 AI 모델을 빌드, 배포, 유지관리하는 데 필요한 몇 가지 구성 요소를 살펴보겠습니다.

데이터 스토리지

데이터 스토리지란 애플리케이션, 네트워크 프로토콜, 문서, 미디어, 주소록, 사용자 기본 설정 등을 구성하는 세부 데이터인 디지털 정보를 수집하고 보관하는 것을 말합니다. 데이터 스토리지는 AI 정보를 저장, 구성, 검색하는 데 중요합니다.

데이터 관리

데이터 관리란 데이터를 수집, 저장, 사용하는 프로세스를 말하며, 데이터 관리 소프트웨어의 지원을 받는 경우가 많습니다. 보유 중인 데이터 종류, 데이터 위치, 데이터 소유자, 데이터 확인 권한을 가진 사용자, 액세스 방법 등을 데이터 관리를 통해 파악할 수 있습니다. 데이터 관리 워크플로우는 올바른 제어와 구현을 통해서 더 나은 결정을 내리는 데 필요한 분석적 인사이트를 제공합니다.

최적화 소프트웨어

vLLM과 llm-d 같은 최적화 소프트웨어를 사용하면 하드웨어를 최대한 효율적으로 활용할 수 있습니다.

vLLM은 virtual large language model의 약자로, 오픈소스 코드 라이브러리입니다. vLLM은 대규모 언어 모델(LLM)이 더 효율적으로, 대규모로 추론 연산을 수행할 수 있도록 도와줍니다. 보다 구체적으로는, vLLM은 GPU 메모리를 더 효과적으로 활용하여 생성형 AI 애플리케이션의 추론 속도를 높이는 인퍼런스 서버입니다.
llm-d는 쿠버네티스 네이티브 오픈소스 프레임워크로, 대규모 분산 추론을 고속으로 수행할 수 있도록 지원합니다. llm-d는 vLLM을 기반으로 분산 처리의 조정자(coordinator) 역할을 수행하여, 여러 GPU에서 이루어지는 연산을 가능한 한 빠르고 효율적으로 처리할 수 있게 합니다.

머신 러닝 프레임워크

머신 러닝(ML)은 알고리즘을 사용하여 데이터 세트 내에서 패턴을 식별하고 예측하는 인공지능(AI)의 하위 범주이며, 머신 러닝 프레임워크는 이러한 작업에 필요한 툴과 라이브러리를 제공합니다.

머신 러닝 운영

머신 러닝 운영(MLOps)은 머신 러닝(ML) 모델을 제작, 유지관리, 모니터링하는 프로세스를 간소화하기 위한 일련의 워크플로우 사례입니다. DevOps와 GitOps 원칙에서 영감을 받은 MLOps는 ML 모델을 소프트웨어 개발 프로세스에 통합하기 위해 끊임없이 진화하는 지속적인 프로세스를 구축하고자 합니다.

AI/ML 환경 구축에 대해 자세히 알아보기

구성 요소가 잘 갖춰진 견고한 AI 인프라는 혁신과 효율성에 기여합니다. 하지만 AI 인프라를 설계할 때 고려해야 할 장점, 과제, 애플리케이션이 있습니다.

장점

AI 인프라는 AI 운영 팀과 조직에 여러 가지 장점을 제공합니다. 그중 하나는 확장성으로, 특히 클라우드 기반 AI/ML 솔루션을 사용하여 운영 규모를 온디맨드로 늘리고 줄일 수 있습니다. 또 다른 장점은 자동화로, 반복적인 작업의 오류를 줄이고 결과물을 제공하기 위한 처리 횟수를 늘릴 수 있습니다. 서비스형 모델(Models-as-a-Service)이란?

과제

여러 장점에도 불구하고 AI 인프라에는 해결해야 할 과제도 있습니다. 최대 과제 중 하나는 처리해야 할 데이터의 양과 품질입니다. AI 시스템이 학습하고 의사 결정을 내리려면 대량의 데이터가 필요하므로 기존의 데이터 스토리지 및 처리 방법으로는 AI 워크로드의 규모와 복잡성에 대응하기에는 부족할 수 있습니다. 실시간 분석과 의사 결정이 요구된다는 점도 또 하나의 큰 과제입니다. 이러한 요구 사항은 AI 인프라가 데이터를 빠르고 효율적으로 처리해야 한다는 것을 의미하며, 이는 대용량 데이터를 다룰 수 있는 적합한 솔루션을 통합하기 위해 반드시 고려해야 할 사항입니다.

자동화가 어떤 도움이 되는지 알아보기

애플리케이션

이러한 과제를 해결할 수 있는 애플리케이션은 여러 가지가 있습니다. Red Hat® OpenShift® 클라우드 서비스는 애플리케이션을 빠르게 빌드, 배포, 확장하는 데 도움이 됩니다. 또한 선제적인 관리와 지원으로 일관성과 보안을 강화하여 효율성을 높일 수 있습니다. Red Hat Edge를 사용하면 데이터 수집 위치에 더욱 가깝게 배포하고 실행 가능한 인사이트를 확보할 수 있습니다.

AI/ML을 위한 클라우드 서비스에 대해 자세히 알아보기

보안

AI 보안은 워크로드를 약화시키거나 데이터를 조작하거나 민감한 정보를 탈취하려는 악의적인 공격으로부터 AI 애플리케이션을 보호합니다. 기밀성, 무결성, 가용성이라는 핵심 원칙을 AI의 라이프사이클과 기술 환경에 맞게 적용합니다. AI 시스템을 제대로 보호하려면 먼저 그 구조와 작동 방식을 충분히 이해하는 것이 중요합니다. 기술과 인프라를 깊이 이해할수록 더 안전하게 지킬 수 있습니다.

AI 보안 더 보기

Red Hat® AI는 고객이 이미 신뢰하는 솔루션을 토대로 구축된 Red Hat의 AI 제품 포트폴리오입니다. 이 기반을 통해 Red Hat 제품의 안정성, 유연성, 확장성이 유지됩니다.

Red Hat AI를 활용하면 조직은 다음과 같은 장점을 실현할 수 있습니다.

AI를 신속하게 도입하고 활용하여 빠르게 혁신
AI 솔루션 제공의 복잡성 해소
어디서나 배포

Red Hat AI 살펴보기

Red Hat AI 파트너

아울러 Red Hat의 AI 파트너 에코시스템이 확장되고 있습니다. 다양한 기술 파트너들이 Red Hat과 협력하여 Red Hat AI와의 상호 운용성을 인증하고 있습니다. 따라서 오픈소스 솔루션 활용이 가능합니다.

Red Hat의 AI 파트너 확인하기

추가 자료

분산 추론(distributed inference)이란?

분산 추론은 추론 작업을 상호 연결된 일련의 기기에 분배하여 AI 모델이 더 효율적으로 워크로드를 처리할 수 있도록 하는 것을 말합니다.

MCP(Model Context Protocol)란?

MCP(Model Context Protocol)가 AI 애플리케이션을 외부 데이터 소스에 연결함으로써 더욱 스마트한 워크플로우를 구축하는 데 어떻게 도움이 되는지 알아보세요.

AIOps 설명

AIOps(IT 운영을 위한 AI)는 머신 러닝과 기타 고급 AI 기술로 IT 운영을 자동화하는 방식입니다.

AI 인프라의 전반적인 이해

AI 인프라 기술 스택

데이터 스토리지

데이터 관리

최적화 소프트웨어

머신 러닝 프레임워크

머신 러닝 운영

Red Hat 리소스

장점

과제

애플리케이션

보안

Red Hat AI 살펴보기 Red Hat AI 파트너

엔터프라이즈를 위한 AI 시작하기: 입문자용 가이드

모든 Red Hat 제품 체험판

추가 자료

분산 추론(distributed inference)이란?

MCP(Model Context Protocol)란?

AIOps 설명

AI/ML 리소스

플랫폼

툴

체험, 구매 & 영업

커뮤니케이션

Red Hat 소개

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links

Red Hat AI 살펴보기

Red Hat AI 파트너