登录 / 注册 Account
Jump to section

了解数据服务

复制 URL

数据服务为数据带来了更多的商业价值,因此可以作为云原生应用(开放混合云 IT 策略的一个组成部分)的一部分实施。

数据服务(或称为"数据即服务")是若干小型、独立且松散耦合的功能的集合,它们可以增强、整理、共享或计算数据存储卷中所收集和保存的信息。数据服务可以通过提高传统数据的弹性、可用性和有效性,并为它本身没有的数据(例如元数据)添加相应的特征,从而增强传统数据。

 

 

数据服务是软件功能的独立单元,可提供其尚不具备的数据特征。数据服务可以提高数据的可用性、弹性和可理解性,从而使数据对用户和程序而言更有用。

数据服务功能会将输入变成输出。输入是指各种原始数据集(未针对特定目的进行处理的数据),它们以原生格式进行配置,并保存在物理、虚拟基于云的存储卷中。而输出通常是指:

  • 可整理:数据的合并、批处理和结构化,通常是从结构化(数据库)、半结构化(数据仓库)或非结构化(数据湖)源中提取数据。
  • 可传输:数据从其原始位置经过网络移动到端点(例如应用或平台)。
  • 规程化:数据的处理,通常是作为数据建模、分析或人工智能/机器学习(AI/ML)软件的一部分。

静态数据

数据保存在存储卷中。数据服务从源中提取原始数据(例如在线事务处理(OLTP)数据库中的客户记录、数据仓库中的财产损失信息,以及数据湖中的图像或视频),采用监管原则并加以整理和维护,从而让数据可供应用使用并可由用户访问。数据服务是大数据策略的重要组成部分,因为它可以大规模收集各个地方存储的结构化、半结构化和非结构化数据。

 

动态数据

数据从其存储源移动到应用或平台,通常为实时。数据服务可以创建数据管道,以帮助数据在多个端点之间连续移动。例如,数据服务通过在数据生成时立即对其进行处理,可以帮助企业从面向批处理的数据处理转变为事件驱动型数据处理。此外,数据服务还有助于确保永远不会从源中实际删除数据,从而允许多个端点同时使用同一数据点。利用这一点可以创建可扩展的事件驱动型架构。

 

动态数据

将活动数据分组为数据集,供数据科学、数据分析和数据建模软件使用。数据服务有助于改进高性能、智能数据处理平台(如 AI/ML 和深度学习工具)的数据访问。根据数据服务的不同,动态数据可能涉及小型、独立且松散耦合的服务的集合,这些服务通常打包在容器中,并由 Kubernetes 平台进行编排。

 

当数据在系统之间移动时,如果没有数据服务为开发人员和数据科学家提供协助,云原生应用开发就无法进行。使用相同数据的多次代码提交会延长构建时间,而诸如红帽® OpenShift® 数据基础等数据服务却可以降低并发构建的时间依赖性。

传统存储

原始数字信息(隐匿在应用、网络协议、文档、媒体、通讯录、用户首选项等背后的位和字节)的实际收集和留存。您每次保存文档并选择位置时,就会经历数据存储过程。用户通常是在基础架构级别上来看数据存储,很少会将它与存储卷联系起来。例如,通常并没有一种本机方式来查看跨工作站、云存储提供商和外部硬盘驱动器保存的每个文件、块或对象,这使得对数据存储的探索不得不依赖于手动操作,而且方法比较单一。

 

数据服务

利用保存在传统数据存储卷中的数据作为输入来创建特定输出的软件;或是通过提高传统数据的弹性、可用性和有效性来放大传统数据的软件。用户通常作为应用的一部分与数据服务进行交互,从而使该过程变得非常灵活且可以自定义。例如,红帽 OpenShift 数据基础所提供的数据服务会对存储基础架构进行抽象处理,这样数据就可以存储在许多不同的位置,但仍相当于一个单一的持久存储库。

Massachusetts Open Cloud(美国麻省开放云,MOC)就在使用数据服务。MOC 是一项由大学、政府机构和企业联合发起的非营利计划。该计划旨在为企业、政府和非营利组织开发一个基于云的通用基础架构,以进行大数据分析。MOC 使用红帽 Ceph 存储(一种软件定义存储服务)来与运行自定义数据分析平台的多个实体一起整理和共享大量数据。

在毫无 OpenShift 容器存储使用经验的情况下,我们的团队能够在不到 2 周的时间内建立 2 个不同的 OpenShift 集群并进行了完整的 Db2 仓库性能验证。

Piotr Mierzejewski

IBM 数据与人工智能 Db2 开发总监

我们的数据服务不仅能与每个数据存储提供商很好地配合,而且也是对云原生应用开发的一种补充。 

因此,您尽可以使用任何数据中心或云,然后将所有这些数据运用到不断演进的云原生应用中。借助我们的数据服务,企业的旧数据可以得到增强并直接流入您的云原生应用中,从而获取一些帮助与解决未来重大挑战的重要信息。

了解红帽 Ceph 存储在 Evaluator Group 的 100 亿个对象测试中表现如何。

扩展阅读

主题

了解大数据

大数据要么体量过大,要么过于复杂,传统的数据处理办法无法应对。

文章

为什么选择红帽存储

了解什么是软件定义存储,如何部署红帽软件定义存储解决方案,从而根据您的需求灵活地管理、存储和共享数据。

文章

什么是云存储?

云存储就是整理存放在某处的数据,只要获得相应权限,所有人都能通过互联网访问这些数据。了解其工作原理。

详细了解存储

产品

Red Hat OpenShift Data Foundation

出色的软件定义存储,可以随着容器的增减,跨环境为数据提供永久的存储位置。

Red Hat Gluster Storage

一个软件定义存储平台,可以部署到裸机、虚拟、容器和云环境中。

Red Hat Ceph Storage

可大规模扩展的开放式软件定义存储系统,可有效管理 PB 级数据。

Red Hat Hyperconverged Infrastructure

一套共址、可扩展的软件定义型计算与存储方案,运行于经济实惠的行业标准硬件上。

相关资源

Illustration - mail

获取更多类似的内容

免费订阅我们的 Red Hat Shares 通讯邮件