Iniciar sesión / Registrar Cuenta

Tema

El concepto de los servicios de datos

Estos servicios aportan más valor empresarial a los datos, para que puedan implementarse como parte de las aplicaciones creadas en la nube, las cuales son un elemento integral de las estrategias de TI de la nube híbrida abierta.

¿Qué son los servicios de datos?

Los servicios de datos son conjuntos de funciones pequeñas, independientes y sin conexión directa que mejoran, organizan, comparten o calculan la información recopilada y guardada en volúmenes de almacenamiento de datos. Permiten potenciar los datos tradicionales, ya que mejoran su resistencia, disponibilidad y validez y, además, agregan ciertas características que no suelen incluir desde su creación, como es el caso de los metadatos.

¿Cómo funcionan los servicios de datos?

Los servicios de datos son unidades autónomas de funciones de software que aportan a los datos características que aún no poseen. Pueden aumentar su disponibilidad, resistencia y comprensibilidad, lo cual los vuelve más útiles para los usuarios y los programas.

Estas funciones transforman las entradas en resultados. Las entradas son distintos conjuntos de datos que no se han procesado para un fin particular. Tienen su configuración de origen y están guardados en volúmenes de almacenamiento físicos, virtuales o en la nube. Los resultados suelen ser:

  • Organizativos: hacen referencia a la consolidación, el procesamiento por lotes y la estructura de los datos, los cuales generalmente se extraen de fuentes estructuradas (bases de datos), semiestructuradas (almacenes de datos) o no estructuradas (lagos de datos).
  • Transferibles: comprenden el movimiento de los datos a través de una red, desde su lugar de origen hasta un extremo (p. ej., una aplicación o una plataforma).
  • Procedimentales: se refieren al procesamiento de los datos, generalmente como parte de un software de modelado o análisis de datos o de inteligencia artificial y aprendizaje automático (IA/ML).

¿Para qué se utilizan los servicios de datos?

Datos en reposo

Son aquellos que están guardados en volúmenes de almacenamiento. Estos servicios extraen de las fuentes datos sin procesar (p. ej., los registros de clientes de las bases de datos de procesamiento de transacciones en línea (OLTP); información sobre daños a la propiedad de los almacenes de datos; e imágenes y videos de los lagos de datos) y aplican principios de control, organización y mantenimiento que los hacen útiles para las aplicaciones y facilitan su acceso a los usuarios. Son un elemento importante de las estrategias de big data porque permiten darle sentido a los enormes conjuntos de datos estructurados, semiestructurados y no estructurados que están almacenados por todas partes.

Datos en movimiento

Son los que se mueven desde el lugar en el que están almacenados hasta una aplicación o plataforma, por lo general de forma inmediata. Los servicios de datos pueden crear canales que permitan trasladarlos de un extremo a otro sin interrupciones. Por ejemplo, gracias a estos servicios, las empresas pueden trabajar con los datos a medida que se generan y, así, pasar del procesamiento por lotes a uno basado en eventos. También ayudan a garantizar que nunca se eliminen de su lugar de origen, lo cual permite que varios extremos utilicen el mismo punto de datos a la vez. Esto sirve para crear arquitecturas escalables y basadas en eventos.

Datos en acción

Son datos activos que se agrupan en conjuntos y se utilizan en el software de modelado, la ciencia y el análisis de datos. Los servicios de datos ayudan a mejorar su acceso a las plataformas inteligentes y de alto rendimiento destinadas para su procesamiento, como las herramientas de aprendizaje profundo e IA/ML. Dependiendo del servicio del que se trate, los datos en acción podrían abarcar los conjuntos de servicios pequeños, independientes y sin conexión directa, los cuales por lo general se empaquetan en contenedores y se organizan con una plataforma de Kubernetes.

El desarrollo de aplicaciones en la nube resulta imposible sin los servicios adecuados de datos, que ayudan a los desarrolladores y los analistas a trabajar juntos durante su traslado de un sistema a otro. Las múltiples confirmaciones de cambios en el código que utilizan los mismos datos pueden extender los tiempos de diseño. Sin embargo, un servicio de datos como Red Hat® OpenShift® Container Storage reduce la dependencia de tiempo de los diseños simultáneos.

Comparación entre el almacenamiento tradicional y los servicios de datos

Almacenamiento tradicional

Se refiere a la recopilación y conservación real de la información digital sin procesar, es decir, los bits y bytes que están detrás de las aplicaciones, los protocolos de red, los documentos, el contenido multimedia, las libretas de direcciones, las preferencias de los usuarios, entre otros. Si usted guarda un documento y selecciona una ubicación, se realiza el proceso de almacenamiento de datos. Lo que ve el usuario del almacenamiento de datos generalmente se queda en la infraestructura, y no se relaciona con la capacidad. Por ejemplo, no hay una función intrínseca que permita ver los archivos, bloques u objetos guardados en una estación de trabajo, un proveedor de almacenamiento en la nube y un disco duro externo. Por eso, examinar el almacenamiento de datos es una tarea sumamente manual y monolítica.

Servicios de datos

Es un software que utiliza los datos guardados en volúmenes de almacenamiento tradicionales como entradas para generar resultados específicos; o un software que mejora su resistencia, disponibilidad y validez, lo cual permite potenciarlos. Por lo general, los usuarios interactúan con los servicios de datos como parte de una aplicación, lo cual genera un proceso muy flexible y personalizable. Por ejemplo, el servicio que ofrece Red Hat OpenShift Container Storage extrae la infraestructura de almacenamiento para que los datos puedan almacenarse en muchos lugares diferentes, pero actúa como un repositorio único y permanente.

¿Quién utiliza los servicios de datos?

Massachusetts Open Cloud (MOC) es una iniciativa sin fines de lucro que utiliza los servicios de datos y reúne a diversas universidades, organizaciones gubernamentales y empresas. Se creó para desarrollar una infraestructura común y de nube para que las empresas, los gobiernos y las organizaciones sin fines de lucro pudieran analizar el big data. MOC usó Red Hat Ceph Storage, un servicio de almacenamiento definido por software, para organizar y compartir grandes cantidades de datos con las diversas entidades que ejecutan plataformas personalizadas para analizarlos.

¿Por qué conviene elegir Red Hat?

Nuestros servicios de datos no solo funcionan bien con todos los proveedores de almacenamiento de datos, sino que también son un excelente complemento para el desarrollo de aplicaciones en la nube

Utilice el centro de datos o la nube que prefiera, e implemente esos datos en las aplicaciones creadas en la nube, las cuales no dejan de evolucionar. Con nuestros servicios, puede mejorar los datos antiguos de su empresa y enviarlos directamente a sus aplicaciones, para obtener información relevante que permita resolver los mayores desafíos del futuro.

Los servicios de datos que necesita para ponerse en marcha

Red Hat OpenShift Container Storage product logo

Almacenamiento definido por software para entornos de contenedores.

Los servicios de datos tienen mucho más que ofrecer