Jump to section

데이터 서비스 이해하기

URL 복사

데이터 서비스는 오픈 하이브리드 클라우드 IT 전략의 핵심 구성 요소인 클라우드 네이티브 애플리케이션에 데이터를 포함시켜 구현할 수 있도록 데이터의 비즈니스 가치를 높여 줍니다.

데이터 서비스(또는 서비스로서의 데이터)는 데이터 스토리지 볼륨 형태로 수집 및 저장되는 정보를 개선하고, 체계화하며, 공유하거나 계산하는 여러 기능이 느슨하게 결합된 독립적인 소규모 컬렉션입니다. 데이터 서비스는 전통적인 데이터의 복원력, 가용성, 유효성을 높이고 메타데이터와 같이 원래는 없던 특성을 추가하여 데이터를 보강합니다.

 

 

데이터 서비스는 데이터에 원래 없던 특성을 부여하는 독립형 소프트웨어 기능 단위입니다. 데이터 서비스를 통해 데이터의 가용성과 복원력이 높아지고 데이터를 더 쉽게 이해할 수 있게 되므로 사용자와 프로그램의 데이터 활용도가 향상됩니다.

데이터 서비스 기능은 입력을 출력으로 전환합니다. 입력은 다양한 원시 데이터 세트, 즉 특정 목적을 위해 처리되지 않은 데이터입니다. 기본 형식으로 설정되고 물리, 가상 또는 클라우드 기반 스토리지 볼륨에 저장되어 있습니다. 출력의 특성은 일반적으로 다음과 같습니다.

  • 체계적: 데이터를 통합하고 배치 처리하고 구조를 부여하며, 일반적으로 정형(데이터베이스), 반정형(데이터 웨어하우스) 또는 비정형(데이터 레이크) 소스에서 가져옵니다.
  • 전송 가능: 데이터를 원래 장소에서 네트워크를 거쳐 애플리케이션이나 플랫폼과 같은 엔드포인트로 이동합니다.
  • 절차 준수: 일반적으로 데이터 모델링이나 분석 과정에서 또는 인공지능/머신 러닝(AI/ML) 소프트웨어를 사용하여 절차에 따라 데이터를 처리합니다.

유휴 데이터

스토리지 볼륨에 저장되어 있는 데이터를 말합니다. 데이터 서비스는 소스에서 원시 데이터를 추출합니다. 예를 들면 OLTP(온라인 트랜잭션 처리) 데이터베이스에서 고객 레코드를, 데이터 웨어하우스에서 재산 피해 정보를, 데이터 레이크에서 이미지나 동영상을 추출합니다. 그런 다음 거버넌스 원칙, 체계화 및 유지관리를 적용하여 애플리케이션에서 데이터를 사용하고 사용자가 데이터에 액세스할 수 있도록 합니다. 온갖 장소에 저장된 막대한 양의 정형, 반정형, 비정형 데이터 컬렉션에 의미를 부여하는 데이터 서비스는 빅데이터 전략의 중요한 요소입니다.

 

전송 중인 데이터

원래 저장되어 있던 곳에서 애플리케이션이나 플랫폼으로 이동하는 데이터를 말하며, 대개 실시간으로 이동합니다. 데이터 서비스는 데이터 파이프라인을 만들어 데이터가 여러 엔드포인트 사이를 계속해서 이동할 수 있도록 합니다. 예를 들어 데이터 서비스는 생성된 데이터를 즉시 조작함으로써 배치 방식으로 데이터를 처리하던 조직이 이벤트 중심 데이터 처리로 전환할 수 있도록 지원합니다. 또한 데이터 서비스는 데이터가 원래 장소에서 제거되지 않도록 보장합니다. 따라서 여러 엔드포인트에서 동일한 데이터포인트를 동시에 사용할 수 있습니다. 이를 이용해 스케일링 가능한 이벤트 중심 아키텍처를 구축할 수 있습니다.

 

사용 중인 데이터

데이터 과학, 데이터 분석, 데이터 모델링 소프트웨어에서 사용 중인 데이터 세트로 그룹화한 활성 데이터입니다. 데이터 서비스는 AI/ML, 딥 러닝 툴과 같은 고성능 지능형 데이터 처리 플랫폼에 대한 데이터 액세스를 향상하는 데 도움이 됩니다. 데이터 서비스에 따라서는 느슨하게 결합된 소규모 독립형 서비스 컬렉션이 사용 중인 데이터에 포함될 수 있으며, 이러한 서비스는 대개 컨테이너로 패키징되어 쿠버네티스 플랫폼에서 오케스트레이션합니다.

 

데이터가 시스템 사이를 이동할 때 개발자와 데이터 과학자가 협업할 수 있도록 지원하는 데이터 서비스가 없으면 클라우드 네이티브 애플리케이션 개발은 불가능합니다. 동일한 데이터를 사용하는 코드를 여러 차례 커밋하다 보면 빌드 시간이 늘어날 수 있지만, Red Hat® OpenShift® Data Foundation과 같은 데이터 서비스를 사용하면 동시 빌드 작업에서 시간에 구애받지 않아도 됩니다.

전통적인 스토리지

애플리케이션, 네트워크 프로토콜, 문서, 미디어, 주소록, 사용자 기본 설정 등을 구성하는 세부 데이터인 원시 디지털 정보를 실제로 수집하고 보관하는 곳입니다. 우리는 문서를 저장하고 위치를 선택할 때 데이터 스토리지 프로세스를 거치게 됩니다. 사용자의 눈에 보이는 데이터 스토리지는 일반적으로 인프라 수준에 머무르며 스토리지 볼륨이 서로 연결되는 일은 거의 없습니다. 예를 들어 워크스테이션, 클라우드 스토리지 제공업체, 외부 하드 드라이브에 저장되어 있는 모든 파일, 블록 또는 오브젝트를 확인할 수 있는 방법이 기본으로 제공되는 경우는 드뭅니다. 따라서 획일적인 수작업으로 데이터 스토리지를 탐색해야 합니다.

 

데이터 서비스

전통적인 데이터 스토리지 볼륨에 저장된 데이터를 입력으로 사용하여 특정한 출력을 생성하는 소프트웨어 또는 전통적인 데이터의 복원력, 가용성, 유효성을 높여 데이터를 보강하는 소프트웨어를 말합니다. 사용자는 일반적으로 애플리케이션을 통해 데이터 서비스와 상호 작용하므로 프로세스가 매우 유연하고 사용자 지정이 쉽습니다. 예를 들어 Red Hat OpenShift Data Foundation에서 제공하는 데이터 서비스는 스토리지 인프라에서 데이터를 추출하므로 데이터를 다양한 장소에 저장할 수 있지만 이는 단일 영구 리포지토리의 역할을 합니다.

MOC(Massachusetts Open Cloud)에서는 데이터 서비스를 사용합니다. MOC는 대학, 정부기관, 기업이 참여하는 비영리 이니셔티브로서 기업, 정부, 비영리 단체가 빅데이터를 분석할 수 있도록 공통의 클라우드 기반 인프라를 개발할 목적으로 출범했습니다. MOC는 소프트웨어 정의 스토리지 서비스인 Red Hat Ceph Storage를 사용해 대량의 데이터를 체계화하고 이를 사용자 지정 데이터 분석 플랫폼을 실행하는 여러 엔터티와 공유했습니다.

OpenShift Container Storage를 사용해 본 적이 없는 저희 팀은 개별 OpenShift 클러스터 두 개를 설정하고 2주도 안 되는 짧은 시간에 Db2 웨어하우스의 성능 검증을 완벽하게 수행할 수 있었습니다.

Piotr Mierzejewski

IBM Data & AI의 Db2 개발 책임자

Red Hat의 데이터 서비스는 모든 데이터 스토리지 제공업체와 잘 연동될 뿐 아니라 클라우드 네이티브 애플리케이션 개발을 보완하도록 구축되어 있습니다. 

원하는 데이터센터나 클라우드에서 끝없이 진화하는 클라우드 네이티브 애플리케이션에 이 모든 데이터를 자유롭게 구현해 보세요. Red Hat의 데이터 서비스를 통해 귀사의 오래된 데이터를 보강하고 클라우드 네이티브 애플리케이션으로 바로 스트리밍하여 중요한 정보를 파악하세요. 심각한 잠재적 문제가 해결될 수도 있습니다.

Evaluator Group이 실시한 100억 개의 오브젝트 테스트에서 Red Hat Ceph Storage가 거둔 성과를 확인하세요.

추가 자료

토픽

빅데이터 이해

빅데이터는 전통적인 데이터 프로세싱 방법으로 처리할 수 없을 정도로 대규모이거나 복잡한 데이터입니다.

문서

Red Hat 스토리지를 선택해야 하는 이유는 무엇일까요?

소프트웨어 정의 스토리지란 무엇인지, 데이터를 적절하게 관리하고 저장하고 공유할 수 있는 유연성을 제공하는 Red Hat 소프트웨어 정의 스토리지 솔루션을 어떻게 배포할 수 있을지 알아보세요.

문서

클라우드 스토리지란?

클라우드 스토리지는 권한이 있는 사용자가 인터넷으로 액세스할 수 있는 곳에 보관된 데이터를 체계적으로 관리하는 것을 말합니다. 작동 원리에 대해 자세히 알아보기

스토리지에 대한 자세한 내용

제품

Red Hat OpenShift Data Foundation

컨테이너를 추가 또는 축소하더라도 환경 전반에서 영구적으로 데이터를 저장할 수 있는 소프트웨어 정의 스토리지입니다.

Red Hat Gluster Storage

베어메탈, 가상, 컨테이너, 클라우드 환경에 배포할 수 있는 소프트웨어 정의 스토리지 플랫폼입니다.

Red Hat Ceph Storage

대규모로 확장 가능한 개방형 소프트웨어 정의 스토리지 시스템으로, 페타바이트 단위의 데이터를 효율적으로 관리합니다.

Red Hat Hyperconverged Infrastructure

경제적인 업계 표준 하드웨어에 공동 배치되어 확장이 가능한 소프트웨어 정의 컴퓨팅 및 스토리지입니다.

리소스

Illustration - mail

유용한 콘텐츠 더 보기

Red Hat Shares 뉴스레터를 구독해 보세요(무료).