데이터 서비스란 무엇일까요?
서비스로서의 데이터라고 불리기도 하는 데이터 서비스는 데이터 스토리지 볼륨 형태로 수집 및 저장되는 정보를 개선하고, 체계화하며, 공유하거나 계산하는 여러 기능이 탄력적으로 결합된 독립적인 소규모 컬렉션입니다. 데이터 서비스는 전통적인 데이터의 복원력, 가용성, 유효성을 높이고 메타데이터와 같이 원래는 없던 특성을 추가하여 데이터를 보강합니다. 데이터 서비스 아키텍처는 여러 유형의 데이터와 애플리케이션 서비스를 포함할 수 있으며, 이는 함께 서비스로서의 지능형 데이터(iDaaS) 아키텍처와 같은 목표를 달성할 수 있도록 합니다.
데이터 서비스는 어떤 방식으로 작동할까요?
데이터 서비스는 데이터에 원래 없던 특성을 부여하는 독립형 소프트웨어 기능 단위입니다. 데이터 서비스를 통해 데이터의 가용성과 복원력이 높아지고 데이터를 더 쉽게 이해할 수 있게 되므로 사용자와 프로그램의 데이터 활용도가 향상됩니다.
데이터 서비스 기능은 입력을 출력으로 전환합니다. 입력은 다양한 원시 데이터 세트, 즉 특정 목적을 위해 처리되지 않은 데이터입니다. 기본 형식으로 설정되고 물리, 가상 또는 클라우드 기반 스토리지 볼륨에 저장되어 있습니다. 출력의 특성은 일반적으로 다음과 같습니다.
데이터 서비스는 어디에 사용될까요?
저장된 데이터 관리
데이터 서비스는 유휴 상태의 데이터, 즉 스토리지 볼륨에 저장된 데이터를 관리할 수 있도록 합니다. 데이터 서비스는 소스에서 원시 데이터를 추출합니다. 예를 들면, OLTP(온라인 트랜잭션 처리) 데이터베이스에서 고객 레코드를, 데이터 웨어하우스에서 재산 피해 정보를, 데이터 레이크에서 이미지나 동영상을 추출합니다. 그런 다음 거버넌스 원칙, 체계화 및 유지관리를 적용하여 애플리케이션에서 데이터를 사용하고 사용자가 데이터에 액세스할 수 있도록 합니다. 온갖 장소에 저장된 막대한 양의 정형, 반정형, 비정형 데이터 컬렉션에 의미를 부여하는 데이터 서비스는 빅데이터 전략의 중요한 요소입니다.
데이터 이동
전송 중인 데이터는 원래 저장되어 있던 곳에서 애플리케이션이나 플랫폼으로 이동하는 데이터를 말하며, 데이터 서비스는 대개 실시간으로 이동하는 이러한 데이터에 활용할 수 있습니다. 데이터 서비스는 데이터 파이프라인을 만들어 데이터가 여러 엔드포인트 사이를 계속해서 이동할 수 있도록 합니다. 예를 들어 데이터 서비스는 생성된 데이터를 즉시 조작함으로써 배치 방식으로 데이터를 처리하던 조직이 이벤트 중심 데이터 처리로 전환할 수 있도록 지원합니다. 또한 데이터 서비스는 데이터가 원래 장소에서 제거되지 않도록 보장합니다. 따라서 여러 엔드포인트에서 동일한 데이터포인트를 동시에 사용할 수 있습니다. 이를 이용해 스케일링 가능한 이벤트 중심 아키텍처를 구축할 수 있습니다.
데이터 사용
데이터 서비스는 활성 데이터를 데이터 사이언스, 데이터 분석, 데이터 모델링 소프트웨어에서 사용할 수 있도록 합니다. 데이터 서비스는 AI/ML, 딥러닝 툴과 같은 고성능 지능형 데이터 처리 플랫폼에 대한 데이터 액세스를 향상하는 데 도움이 됩니다. 데이터 서비스에 따라서는 느슨하게 결합된 소규모 독립형 서비스 컬렉션이 사용 중인 데이터에 포함될 수 있으며, 이러한 서비스는 대개 컨테이너로 패키징되어 쿠버네티스 플랫폼에서 오케스트레이션합니다.
전통적인 스토리지와 데이터 서비스 비교
전통적인 스토리지
애플리케이션, 네트워크 프로토콜, 문서, 미디어, 주소록, 사용자 기본 설정 등을 구성하는 세부 데이터인 원시 디지털 정보를 실제로 수집하고 보관하는 곳입니다. 우리는 문서를 저장하고 위치를 선택할 때 데이터 스토리지 프로세스를 거치게 됩니다. 사용자의 눈에 보이는 데이터 스토리지는 일반적으로 인프라 수준에 머무르며 스토리지 볼륨이 서로 연결되는 일은 거의 없습니다. 예를 들어 워크스테이션, 클라우드 스토리지 제공업체, 외부 하드 드라이브에 저장되어 있는 모든 파일, 블록 또는 오브젝트를 확인할 수 있는 방법이 기본으로 제공되는 경우는 드뭅니다. 따라서 획일적인 수작업으로 데이터 스토리지를 탐색해야 합니다.
데이터 서비스
전통적인 데이터 스토리지 볼륨에 저장된 데이터를 입력으로 사용하여 특정한 출력을 생성하는 소프트웨어 또는 전통적인 데이터의 복원력, 가용성, 유효성을 높여 데이터를 보강하는 소프트웨어를 말합니다. 사용자는 일반적으로 애플리케이션을 통해 데이터 서비스와 상호 작용하므로 프로세스가 매우 유연하고 사용자 지정이 쉽습니다. 예를 들어, Red Hat® OpenShift Data Foundation에서 제공하는 데이터 서비스는 스토리지 인프라에서 데이터를 추출하므로 데이터를 다양한 장소에 저장할 수 있지만 이는 단일 퍼시스턴트 리포지토리의 역할을 합니다.
Red Hat을 선택해야 하는 이유
Red Hat 솔루션은 고객에게 새로운 기능을 지속적으로 제공할 수 있도록 데이터 서비스를 비롯한 클라우드 네이티브 애플리케이션 개발의 모든 측면을 지원합니다.
Red Hat Cloud Services 오퍼링에는 프로덕션에 배포하기 전에 퍼블릭 클라우드에서 머신 러닝(ML) 모델을 신속하게 개발, 교육, 테스트할 수 있도록 완벽하게 지원되는 환경을 제공하는 Red Hat OpenShift Data Science와 같은 플랫폼이 포함되어 있습니다.