了解数据服务

Published 2022 年 12 月 16 日 •

数据服务可以参考便于访问数据、管理数据或分析数据的各种软件类别。数据服务是云原生应用开发和开放混合云 IT 策略的基础。

数据服务（有时称为“数据即服务”）通常是指若干小型、独立且松散耦合的功能，这些功能可以增强、整理、共享或计算数据存储卷中收集和保存的信息。数据服务可以通过提高传统数据的弹性、可用性和有效性，并为它本身没有的数据（例如元数据）添加相应的特征，从而增强传统数据。数据服务架构可能涉及多种数据和应用服务，例如智能数据即服务（iDaaS）架构中的数据和应用服务，它们协同作用以实现共同目标。

数据服务是软件功能的独立单元，可提供其尚不具备的数据特征。数据服务可以提高数据的可用性、弹性和可理解性，从而使数据对用户和程序而言更有用。

数据服务功能会将输入变成输出。输入是指各种原始数据集（未针对特定目的进行处理的数据），它们以原生格式进行配置，并保存在物理、虚拟或基于云的存储卷中。而输出通常：

可整理：数据的合并、管理、批处理和结构化，通常是从结构化（数据库）、半结构化（数据仓库）或非结构化（数据湖）源中提取数据。
可传输：数据从其原始位置经过网络移动到端点（例如应用或平台）。
规程化：数据的处理，通常是作为数据建模、分析或人工智能/机器学习（AI/ML）软件的一部分。

管理存储的数据

数据服务可以帮助管理静态数据，即保存在存储卷中的数据。数据服务从源中提取原始数据（例如在线事务处理（OLTP）数据库中的客户记录、数据仓库中的财产损失信息，以及数据湖中的图像或视频），采用监管原则并加以整理和维护，从而让数据可供应用使用并可由用户访问。数据服务是大数据策略的重要组成部分，因为这些服务可以大规模收集存储在各个地方的结构化、半结构化和非结构化数据。

移动数据

数据服务可用于动态数据，因为动态数据通常会实时地从存储源移动到应用或平台。数据服务可以创建数据管道，以帮助数据在多个端点之间连续移动。例如，数据服务通过在数据生成时立即对其进行处理，可以帮助企业从面向批处理的数据处理转变为事件驱动型数据处理。此外，数据服务还有助于确保永远不会从源中实际删除数据，从而允许多个端点同时使用同一数据点。利用这一点可以创建可扩展的事件驱动型架构。

使用数据

数据服务有助于将活动数据用于数据科学、数据分析和数据建模软件。数据服务有助于改进高性能、智能数据处理平台（如 AI/ML 和深度学习工具）的数据访问。根据数据服务的不同，动态数据可能涉及小型、独立且松散耦合的服务的集合，这些服务通常打包在容器中，并由 Kubernetes 平台进行编排。

传统存储

原始数字信息（隐匿在应用、网络协议、文档、媒体、通讯录、用户首选项等背后的位和字节）的实际收集和留存。您每次保存文档并选择位置时，就会经历数据存储过程。用户通常是在基础架构级别上来看数据存储，很少会将它与存储卷联系起来。例如，通常并没有一种本机方式来查看跨工作站、云存储提供商和外部硬盘驱动器保存的每个文件、块或对象，这使得对数据存储的探索不得不依赖于手动操作，而且方法比较单一。

数据服务

利用保存在传统数据存储卷中的数据作为输入来创建特定输出的软件；或是通过提高传统数据的弹性、可用性和有效性来放大传统数据的软件。用户通常作为应用的一部分与数据服务进行交互，从而使该过程变得非常灵活且可以自定义。例如，红帽® OpenShift® 数据基础所提供的数据服务会对存储基础架构进行抽象处理，这样数据就可以存储在许多不同的位置，但仍相当于一个单一的持久存储库。

红帽的解决方案可以帮助您为云原生应用开发提供包括数据服务在内的全方位支持，从而能够持续向客户交付新的功能。

红帽云服务产品包含红帽 OpenShift 数据科学等平台，可提供一个享受全面支持的环境，在部署至生产环境前，可先在这个环境中快速开发、训练和测试公共云中的机器学习（ML）模型。

进一步了解红帽 Openshift 数据科学