概述
数据管理是收集、存储和使用数据的过程。通过数据管理,您可以了解自己掌握哪些数据、数据所在位置、数据归谁所有、谁可以看到该数据以及如何访问数据。数据管理使企业及机构能够安全且经济高效地部署关键系统和应用,并参与战略决策。
有了良好的数据管理战略,企业及机构就能自如扩展和适应不断变化的业务流程及需求,为团队提供充分的信息,使其能放心地采取更快、更明智的行动。
为什么数据管理很重要?
数据管理的类型
数据管理涵盖许多架构组件,企业及机构在解决自身数据需求时需要对此进行考虑。通过以下这些方面,数据管理能有效地将数据转化为战略资产。
- 数据存储收集和保留数字信息,即应用、网络协议、文档、媒体、地址簿、用户偏好等背后的位和字节。
- 数据准备为分析、修复错误和整合不同来源的原始数据做好准备。
- 数据目录对元数据进行分类,帮助用户轻松查找、理解和使用对他们十分重要的数据。
- 数据仓库将数据存储在为报告而设计的结构化模型中。
- ETL(提取、转换、加载)从数据库中提取数据,将其转换为新格式,然后将其加载到数据仓库中。
- 数据管道自动实时地将传入数据从一个系统传输到另一个系统并加以处理。
- 数据湖以原生格式存储大量多样的非结构化数据,它能让您查看自己未经加工、原始状态的数据。
- 数据架构正式定义收集、存储、传输和使用数据的方式。
- 数据建模勾勒出数据在业务或应用中移动的方式。
- 数据网格(Data mesh)将分析数据分散,使其更易于跨团队和跨地点的访问和使用。
- 另一种数据网格(Data grid)使用企业及机构的计算机共同完成大型任务。
- 数据联邦从多个来源收集数据,并准备好让它们一起运行。
数据库管理系统(DBMS)是数据保管系统,用于自动化或监督这些类型的数据管理。关系型 DBMS 依赖 SQL 编程语言来构建和连接数据,而 NoSQL 数据库更适合非结构化数据。
数据管理的挑战
数据只有在可以得到保护、可以处理以及可以利用时,才算是具有价值。利用好数据回报很高,但也很复杂。随着数据以更大的数量和更快的速度涌入企业,需要应对的挑战也日益增多。
- 数据量:您的数据以更大的规模和不同的格式流入,因此很容易忘记自己所拥有的数据以及数据的位置。
- 数据集成:随着数据变得越来越复杂,有效并战略性地整合来自不同来源的数据变得愈发困难。
- 数据筒仓:未集成的数据无法协同工作,导致错失未开发的价值并造成资源浪费。
- 存储和处理数据:IT 团队必须确定数据应该流向哪里以及应该如何处理才能获得最佳效用。
- 成本:数据处理和存储会增加成本,无论您是在本地部署还是在云中进行管理。评估成本、业务目标以及数据价值非常重要。
- 合规:不遵守行业规定和数据隐私标准可能会导致罚款、数据安全漏洞、认证丢失或对您的业务造成其他损害。
- 数据引力:随着数据体量的增加,它会吸引更多的应用和服务。长此以往,大型数据集及其吸引的组件便越来越难以移动。
大数据管理
大数据是指对于传统的数据处理方法来说过于庞大或复杂的数据。大数据管理会整理并管理这些数据,以提供可用于改进业务的实时信息。
大数据分类和分析可以从各种来源快速定位关键信息。虽然集成、清理和管理大型数据集可能难度较大,但建立强大的架构和巧妙的数据策略可以帮助您有效扩展、实现业务目标并收集高质量的数据分析。大数据需要一个管理平台来支持集成和自动化。
数据生命周期管理
数据生命周期管理(DLM)是在数据的整个生命周期(从开始到删除)控制和管理数据的人员、工具和流程。这包括捕获、存储、共享、归档和销毁数据。
您的 DLM 策略应确保信息安全、准确、可访问,并符合《通用数据保护条例》(GDPR)等的监管要求。DLM 产品通常会自动执行此流程,根据监管策略将数据分成多个层级,并在相应的层级之间进行数据迁移。
主数据管理
主数据是企业的核心数据,对于业务运营必不可少。主数据可为业务交易提供基础,并且让企业及机构可以跨系统一致地进行数据比较。客户、产品和位置都是构成主数据的一些实体。
主数据管理(MDM)是维护主数据的过程。统一的 MDM 战略可防止关键数据在跨系统时出现分离和孤立。MDM 战略还通过保持单一的事实来源来防止复合出错。
MDM 系统应提供跨不同流的企业主数据概述,以及实时数据可视化和安全功能。
数据管理平台和最佳实践
数据管理平台会执行数据管理的许多关键功能,例如定位和解决错误、划分资源和优化系统以提高性能,让许多功能实现自动化,从而降低成本并提高效率。在使用这些平台时,紧跟数据管理最佳实践非常重要。
- 评估您拥有的数据。让 IT 团队、数据科学家和业务高管了解您所生成的数据及其价值所在非常重要。
- 将您的数据与业务目标保持一致。只保留您需要的数据。了解哪些数据会影响业务可以使您的系统保持精简、简化维护并帮助您定位到重要数据。
- 优化您的数据库。 确保您的数据库在您从不同数据源提取数据时能够扩展和正常运行。许多数据库提供高级算法、机器学习和人工智能功能,帮助您根据自身数据做出明智的业务决策。
- 保持高数据质量。从例行更新到拼写和格式修复,通过定期质量检查,保持数据准确和最新。
- 监管您的数据并确保恰当的访问权限。将团队、政策和系统落实到位,确保数据的完整性,即数据的使用、存储和查看方式。
- 关注安全防护和合规。培训您的团队并保护您的系统,使其遵守法规并确保您的商业智能和数据安全。
红帽助您一臂之力
据 IDC 调查报告,红帽企业 Linux 因其稳定性、安全性和性能,可在基础架构中的所有环境(本地、虚拟化、云端和边缘)提供一致体验而成为客户关键业务部署的热门选择。它可以为您的数据管理解决方案提供一个集中枢纽,使您保持敏捷,随着发展实现转型和创新目标。
红帽企业 Linux 是一款性能驱动、经济高效的 Microsoft SQL Server 平台,能够让您快速处理大量数据,并满足不断增长的运营和分析需求。它能够提供可扩展基础和一致的应用体验,无论是部署在裸机、虚拟机、容器还是混合云环境中。其所包含的分析功能可识别对安全性、性能、可用性和稳定性的威胁,并提供修复指导以避免问题、预防停机和计划外停机。红帽企业 Linux 是 Microsoft 在 Linux 上的 SQL Server 基准平台,而 RHEL 8 更提供了创纪录的 SQL Server 性能。
红帽 OpenShift® 数据科学是面向数据科学家和智能应用开发人员的托管云服务。它可提供一个享受全面支持的沙盒,在部署至生产环境前,可先在这个沙盒中快速开发、训练和测试公共云中的机器学习(ML)模型。
红帽开发了一项新的附加服务,即红帽 OpenShift 数据库接入,它使管理员能够更轻松地配置和管理针对多个第三方数据库服务的访问权限。OpenShift 数据库接入还可以帮助开发人员以一致、可预测的方式将他们的应用连接到数据库服务,无需打扰管理员,也无需了解数据库服务提供商访问要求的细微差别。