データサービスについて理解する

掲載 2022 年 12 月 16 日 •

データサービスとは、データへのアクセス、データの管理、またはデータの分析を容易にするさまざまな種類のソフトウェアのことを指します。データサービスは、クラウドネイティブ・アプリケーション開発とオープン・ハイブリッドクラウド IT 戦略の基礎となるものです。

データサービス (Data-as-a-Service と呼ばれることもある) とは、一般に、データストレージ・ボリュームに収集されて保存されている情報を強化、整理、共有、計算する、小型で独立した疎結合の機能を指します。データサービスは、レジリエンシー (回復力)、可用性、正当性を向上させ、ネイティブでは持てない、メタデータなどの特性をデータに追加して、従来のデータを強化します。データサービス・アーキテクチャには、iDaaS (Intelligent Data-as-a-Service) アーキテクチャなど、目的を達成するために連携する複数の種類のデータサービスとアプリケーションサービスが含まれます。

データサービスはソフトウェア機能の自己完結ユニットで、それまで持っていなかった特性をデータに付与します。データサービスによって、データの可用性、回復力、包括性が向上し、ユーザーやプログラムにとって有用性が高まります。

データサービスの機能は、入力のデータを、求められる形に変換して出力します。入力は、まだ特定の目的で処理されていない、多種多様な未加工データの集まりで、ネイティブ形式で構成され、物理、仮想、またはクラウドベースのストレージボリュームに保存されています。出力には一般に以下の性質があります。

構造的：データの統合、管理、一括処理、構造。通常は構造化 (データベース)、半構造化 (データウェアハウス)、非構造化 (データレイク) ソースから取得されます。
転送可能：データの発生元からネットワークを通じて、アプリケーションやプラットフォームなどのエンドポイントまで移動できます。
手続き的：データの処理。通常は、データモデリング、分析、人工知能/マシンラーニング (AI/ML) ソフトウェアの一部として行われます。

保存されたデータの管理

データサービスは、保存データ、つまりストレージボリュームに保存されたデータの管理に役立ちます。データサービスは、オンライン・トランザクション処理 (OLTP) データベースから顧客レコードを、データウェアハウスから資産の破損情報を、データレイクから画像やビデオを取得するなど、ソースから未加工データを抽出し、ガバナンス原則、組織、メンテナンスを適用して、データをアプリケーションにとって有益にしてユーザーがアクセスできるようにします。データサービスはビッグデータ戦略にとって重要な部分です。あらゆる場所に保存されている構造化、半構造化、非構造化データの大量のコレクションを有意義な情報を引き出すからです。

データの移動

データサービスは移動中のデータに使用できます。データは通常、リアルタイムで保管元からアプリケーションまたはプラットフォームに移動するからです。データサービスはデータパイプラインを作成して、複数のエンドポイント間にデータを連続的に移動できるよう補助できます。たとえば、データサービスによって生成したデータを即座に処理できるので、バッチ指向のデータ処理をイベント駆動型データ処理へ移行できます。データサービスは、データが発生元から移動することのないようにもできるので、複数のエンドポイントで同じデータポイントを同時に使用できます。この特性を使用してスケーラブルなイベント駆動型アーキテクチャを作成できます。

データの使用

データサービスにより、データサイエンス、データ分析、データモデリング・ソフトウェアでアクティブなデータを使用することができます。データサービスにより、AI/ML やディープラーニング・ツールなど、高性能のインテリジェントなデータ処理プラットフォームへのデータアクセスが向上します。データサービスに応じて、動作中のデータには疎結合された小型で独立したサービスの集合が含まれます。これは通常コンテナにパッケージされ、Kubernetes プラットフォームによってオーケストレーションされます。

従来のストレージ

未加工のデジタル情報 (アプリケーション、ネットワークプロトコル、ドキュメント、メディア、アドレス帳、ユーザー設定などを構成する情報) の実際の収集と保持。ドキュメント保存の操作をして場所を選択するとき、ユーザーはデータストレージのプロセスをたどっています。ユーザーから認識できるデータストレージは通常はインフラストラクチャ・レベルで、ストレージボリュームとの関連はまずありません。たとえば、ワークステーション、クラウドストレージプロバイダー、外部ハードディスクに保存されたそれぞれのファイル、ブロック、オブジェクトを認識するネイティブな方法はありません。そのため、データストレージを参照する操作は手作業頼みでモノリシックになります。