El concepto de los servicios de datos

Actualizado 16 de diciembre de 2022 •

El concepto de servicios de datos se refiere a varias categorías de software que facilitan el acceso a los datos, su gestión y su análisis. Son una parte fundamental del desarrollo de las aplicaciones originales de la nube y de las estrategias de TI de la nube híbrida abierta.

El concepto de servicios de datos (también conocidos como datos como servicio) suele hacer referencia a funciones pequeñas, independientes y sin conexión directa que mejoran, organizan, comparten o calculan la información recopilada y guardada en volúmenes de almacenamiento de datos. Permiten potenciar los datos tradicionales, ya que mejoran su resistencia, disponibilidad y validez, y, además, agregan ciertas características que no suelen incluir desde su creación, como es el caso de los metadatos. Las arquitecturas de servicios de datos pueden necesitar que varios tipos de servicios de datos y de aplicaciones funcionen en conjunto en pos de un objetivo, como sucede en las arquitecturas de datos inteligentes como servicio (iDaaS).

Los servicios de datos son unidades autónomas de funciones de software que aportan a los datos características que aún no poseen. Pueden aumentar su disponibilidad, resistencia y comprensibilidad, lo cual los vuelve más útiles para los usuarios y los programas.

Estas funciones transforman las entradas en resultados. Las entradas son distintos conjuntos de datos que no se han procesado para un fin particular. Tienen su configuración de origen y están guardados en volúmenes de almacenamiento físicos, virtuales o en la nube. Los resultados suelen ser los siguientes:

Organizativos: hacen referencia a la consolidación, la administración, el procesamiento por lotes y la estructura de los datos, los cuales generalmente se extraen de fuentes estructuradas (bases de datos), semiestructuradas (almacenes de datos) o no estructuradas (lagos de datos).
Transferibles: comprenden el movimiento de los datos a través de una red, desde su lugar de origen hasta un extremo (p. ej., una aplicación o una plataforma).
Procedimentales: se refieren al procesamiento de los datos, generalmente como parte de un software de modelado o análisis de datos o de inteligencia artificial y aprendizaje automático (IA/ML).

Gestión de los datos almacenados

Los servicios de datos permiten gestionar los datos en reposo, en otras palabras, aquellos que están guardados en volúmenes de almacenamiento. Estos servicios extraen de las fuentes datos sin procesar (p. ej., los registros de clientes de las bases de datos de procesamiento de transacciones en línea (OLTP); información sobre daños a la propiedad de los almacenes de datos; e imágenes y videos de los lagos de datos) y aplican principios de control, organización y mantenimiento que los hacen útiles para las aplicaciones y facilitan su acceso a los usuarios. Son un elemento importante de las estrategias de big data porque permiten darle sentido a los enormes conjuntos de datos estructurados, semiestructurados y no estructurados que se encuentran almacenados por todas partes.

Datos en tránsito

Los servicios de datos se pueden usar con los datos en tránsito, ya que estos se trasladan desde el lugar en el que están almacenados hasta una aplicación o plataforma, por lo general de forma inmediata. Los servicios de datos pueden crear canales que permitan trasladarlos de un extremo a otro sin interrupciones. Por ejemplo, gracias a estos servicios, las empresas pueden trabajar con los datos a medida que se generan y, así, pasar del procesamiento por lotes a uno basado en eventos. También ayudan a garantizar que nunca se eliminen de su lugar de origen, lo cual permite que varios extremos utilicen el mismo punto de datos a la vez. Esto sirve para crear arquitecturas con capacidad de ajuste y basadas en eventos.

Uso de los datos

Los servicios de datos contribuyen a que pueda utilizarse software para el análisis y la generación de modelos en los datos activos. También ayudan a mejorar el acceso de estos a las plataformas inteligentes y de alto rendimiento destinadas para su procesamiento, como las herramientas de aprendizaje profundo e IA/ML. Dependiendo del servicio del que se trate, los datos en acción podrían abarcar los conjuntos de servicios pequeños, independientes y sin conexión directa, los cuales por lo general se empaquetan en contenedores y se organizan con una plataforma de Kubernetes.

Almacenamiento tradicional

Se refiere a la recopilación y conservación real de la información digital sin procesar, es decir, los bits y bytes que están detrás de las aplicaciones, los protocolos de red, los documentos, el contenido multimedia, las libretas de direcciones, las preferencias de los usuarios, entre otros. Si usted guarda un documento y selecciona una ubicación, se realiza el proceso de almacenamiento de datos. Lo que ve el usuario del almacenamiento de datos generalmente se queda en la infraestructura, y no se relaciona con la capacidad. Por ejemplo, no suele haber una función intrínseca que permita ver cada archivo, bloque u objeto guardado en una estación de trabajo, un proveedor de almacenamiento en la nube o un disco duro externo. Por eso, examinar el almacenamiento de datos es una tarea sumamente manual y monolítica.

Servicios de datos

Es un software que utiliza los datos guardados en volúmenes de almacenamiento tradicionales como entradas para generar resultados específicos; o un software que mejora su resistencia, disponibilidad y validez, lo cual permite potenciarlos. Por lo general, los usuarios interactúan con los servicios de datos mediante una aplicación, lo que hace que el proceso sea muy flexible y personalizable. Por ejemplo, el servicio de datos que ofrece Red Hat® OpenShift® Data Foundation extrae la infraestructura de almacenamiento para que los datos puedan almacenarse en muchos lugares diferentes, pero actúa como un repositorio único y permanente.

Las soluciones de Red Hat le permiten incorporar todos los aspectos del desarrollo de aplicaciones en la nube, entre ellos los servicios de datos, para que pueda ofrecer funciones nuevas a sus clientes con regularidad.

Las ofertas de Red Hat Cloud Services, como Red Hat OpenShift Data Science, ofrecen un entorno totalmente compatible donde se pueden desarrollar, entrenar y probar rápidamente los modelos de aprendizaje automático (ML) en la nube pública antes de implementarlos en la producción.

Obtenga más información sobre Red Hat OpenShift Data Science

Conozca Red Hat OpenShift Service on AWS (ROSA)

Empezar hoy mismo

Red Hat User Group en Latinoamérica

Gestión de los datos almacenados

Datos en tránsito

Uso de los datos

Open Technology Sessions en español

Almacenamiento tradicional

Servicios de datos

Conozca Red Hat OpenShift Service on AWS (ROSA)

Productos

Artículos relacionados

Contenido adicional

PODCAST

Plataformas

Herramientas

Versiones de prueba, compras y ventas

Canales de comunicación

Acerca de Red Hat

Cambiar el idioma

Red Hat legal and privacy links

Red Hat legal and privacy links