ログイン / 登録 アカウント

トピック

データサービスについて理解する

データサービスは、クラウドネイティブ・アプリケーションの一部として実装できるよう、データのビジネス価値を高めるもので、オープン・ハイブリッドクラウド IT 戦略にとって欠かせない要素です。

Jump to section

データサービスとは

データサービス (または Data-as-a-Service) は、小型で独立した疎結合の機能の集合で、データストレージ・ボリュームに収集されて保存されている情報を強化、整理、共有、計算します。データサービスは、レジリエンシー (回復力)、可用性、正当性を向上させ、ネイティブでは持てない、メタデータなどの特性をデータに追加して、従来のデータを強化します。

データサービスの動作

データサービスはソフトウェア機能の自己完結ユニットで、それまで持っていなかった特性をデータに付与します。データサービスによって、データの可用性、回復力、包括性が向上し、ユーザーやプログラムにとって有用性が高まります。

データサービスの機能は、入力のデータを、求められる形に変換して出力します。入力は、まだ特定の目的で処理されていない、多種多様な未加工データの集まりで、ネイティブ形式で構成され、物理、仮想、またはクラウドベースのストレージボリュームに保存されています。出力には一般に以下の性質があります。

  • 構造的:データの統合、一括処理、構造。通常は構造化 (データベース)、半構造化 (データウェアハウス)、非構造化 (データレイク) ソースから取得されます。
  • 転送可能:データの発生元からネットワークを通じて、アプリケーションやプラットフォームなどのエンドポイントまで移動できます。
  • 手続き的:データの処理。通常は、データモデリング、分析、人工知能/マシンラーニング (AI/ML) ソフトウェアの一部として行われます。

データサービスの用途

保管されているデータ

ストレージボリュームに格納されているデータ。データサービスは、オンライン・トランザクション処理 (OLTP) データベースから顧客レコードを、データウェアハウスから資産の破損情報を、データレイクから画像やビデオを取得するなど、ソースから未加工データを抽出し、ガバナンス原則、組織、メンテナンスを適用して、データをアプリケーションにとって有益にしてユーザーがアクセスできるようにします。データサービスはビッグデータ戦略にとって重要な部分です。あらゆる場所に保存されている構造化、半構造化、非構造化データの大量のコレクションを有意義な情報を引き出すからです。

移動中のデータ

保管元からアプリケーションまたはプラットフォームへ、通常はリアルタイムで移動するデータ。データサービスはデータパイプラインを作成して、複数のエンドポイント間にデータを連続的に移動できるよう補助できます。たとえば、データサービスによって生成したデータを即座に処理できるので、バッチ指向のデータ処理をイベント駆動型データ処理へ移行できます。データサービスは、データが発生元から移動することのないようにもできるので、複数のエンドポイントで同じデータポイントを同時に使用できます。この特性を使用してスケーラブルなイベント駆動型アーキテクチャを作成できます。

動作中のデータ

データセットにグループ化され、データサイエンス、データ分析、データモデリング・ソフトウェアで使用されている、アクティブなデータ。データサービスにより、AI/ML やディープラーニング・ツールなど、高性能のインテリジェントなデータ処理プラットフォームへのデータアクセスが向上します。データサービスに応じて、動作中のデータには疎結合された小型で独立したサービスの集合が含まれます。これは通常コンテナにパッケージされ、Kubernetes プラットフォームによってオーケストレーションされます。

データがシステム間を移動する際に開発者やデータサイエンティストのコラボレーションをサポートするデータサービスがなければ、クラウドネイティブ・アプリケーションの開発は不可能です。同じデータを使用する複数のコードのコミットでビルド時間が長引くことがありますが、Red Hat® OpenShift® Container Storage などのデータサービスで同時ビルドに関する時間の依存性を減少できます。

従来のストレージとデータサービスの比較

従来のストレージ

未加工のデジタル情報 (アプリケーション、ネットワークプロトコル、ドキュメント、メディア、アドレス帳、ユーザー設定などを構成する情報) の実際の収集と保持。ドキュメント保存の操作をして場所を選択するとき、ユーザーはデータストレージのプロセスをたどっています。ユーザーから認識できるデータストレージは通常はインフラストラクチャ・レベルで、ストレージボリュームとの関連はまずありません。たとえば、ワークステーション、クラウドストレージプロバイダー、外部ハードディスクに保存されたそれぞれのファイル、ブロック、オブジェクトを認識するネイティブな方法はありません。そのため、データストレージを参照する操作は手作業頼みでモノリシックになります。

データサービス

従来のデータストレージ・ボリュームに入力として保存されたデータを使用して、特定の出力を作成するソフトウェア。または、従来のデータの回復力、可用性、正当性を向上して、データを拡張するソフトウェア。ユーザーは一般にアプリケーションの一部としてデータサービスとやり取りするので、プロセスの柔軟性が高まり、カスタマイズしやすくなります。たとえば Red Hat OpenShift Container Storage が提供するデータサービスでは、ストレージ・インフラストラクチャを抽象化し、データをさまざまな場所に保存できるようにしながら、1 つの永続リポジトリとして機能させます。

データサービスの使用事例

Massachusetts Open Cloud (MOC) はデータサービスを使用しています。MOC は大学、政府機関、企業からなる非営利団体です。企業、政府、非営利団体がビッグデータを分析するための、共通クラウドベース・インフラストラクチャを開発するために結成されました。MOC はソフトウェア・デファインド・ストレージ・サービスである Red Hat Ceph Storage を使用して大量のデータを整理し共有し、複数のエンティティでカスタムデータ分析プラットフォームを実行させています。

Red Hat を選ぶ理由

Red Hat のデータサービスはあらゆるデータストレージ・プロバイダーと連携するだけでなく、クラウドネイティブ・アプリケーション開発を補完する設計にもなっています。 

どのようなデータセンターやクラウドをお選びになっても、すべてのデータを、変化し続けるクラウドネイティブ・アプリケーションに実装する作業を開始できます。Red Hat のデータサービスを使って、企業が持つ古いデータを強化し、クラウドネイティブ・アプリケーションにそのまま取り込んで重要な情報を洗い出し、将来の大きな課題を解決に導けます。

データサービスを使い始める

Red Hat OpenShift Container Storage product logo

コンテナ環境向けのソフトウェア・デファインド・ストレージ。

データサービスについてさらに詳しく