Login / Registre-se Account

Tópico

Introdução aos serviços de dados

Os serviços de dados agregam valor de negócios às informações, por isso eles podem ser implementados como parte das aplicações nativas em nuvem, em outras palavras, como um elemento integral da sua estratégia de TI para nuvem híbrida aberta.

O que é o serviço de dados?

Os serviços de dados (ou dados como serviço) são conjuntos de pequenas funções independentes e levemente acopladas que aprimoram, organizam, compartilham ou processam as informações coletadas e salvas em volumes de armazenamento. Eles otimizam a resiliência, a disponibilidade e a validade dos dados tradicionais para amplificá-los, além de incorporar novas características, como os metadados.

Como funcionam os serviços de dados?

Os serviços de dados são unidades autônomas de funções de software que incorporam novas características aos dados. Eles aumentam a disponibilidade, a resiliência e a abrangência dos dados, o que os torna mais úteis para usuários e aplicações.

As funções dos serviços de dados transformam as entradas em saídas. As entradas são conjuntos variados de dados brutos, que não foram processados para uma finalidade específica. Eles estão configurados no formato nativo e são salvos em volumes de armazenamento baseados em nuvem, sejam virtuais ou físicos. Geralmente, as saídas são:

  • Organizacionais: a consolidação, o agrupamento e a estrutura dos dados, geralmente extraídos de fontes estruturadas (bancos de dados), semiestruturadas (data warehouses) ou não estruturadas (data lakes).
  • Transferíveis: o deslocamento dos dados por uma rede, indo da origem até um ponto final, como uma aplicação ou plataforma.
  • Processuais: o processamento dos dados, geralmente como parte do software de inteligência artificial/machine learning (AI/ML), análise ou modelagem.

Em que os serviços de dados são usados?

Dados em repouso

Dados salvos em volumes de armazenamento. Primeiro, os dados brutos – como registros de clientes em bancos de dados de processamento de transações online (OLTP), informações de danos à propriedade obtidos de data warehouses e imagens ou vídeos vindos de data lakes – são extraídos das fontes. Depois, são aplicados princípios de manutenção, organização e governança para torná-los úteis para as aplicações e acessíveis para os usuários. Os serviços de dados são uma parte importante das estratégias de big dataporque ajudam a compreender conjuntos enormes de dados estruturados, semiestruturados e não estruturados armazenados em todos os lugares.

Dados em trânsito

Dados que são transferidos do armazenamento de origem para uma aplicação ou plataforma, geralmente em tempo real. Com os serviços de dados, é possível criar pipelines para que a transferência aconteça de maneira contínua entre vários endpoints. Por exemplo, ao operar os dados assim que eles são gerados, as organizações podem trocar o processamento de dados orientado a lotes pelo modelo orientado a eventos. Além disso, os dados nunca são removidos da origem, possibilitando que vários endpoints os usem simultaneamente. Isso ajuda a criar arquiteturas escaláveis e orientadas a eventos.

Dados em ação

Dados ativos agrupados em conjuntos que são usados por softwares de modelagem, análise e ciência. Os serviços de dados aprimoram o acesso a plataformas de processamento inteligentes e de alto desempenho, como ferramentas de aprendizado profundo e AI/ML. Dependendo do serviço, os dados em ação envolvem conjuntos de serviços pequenos, independentes e levemente acoplados – geralmente, empacotados em containers e orquestrados por uma plataforma Kubernetes.

É impossível criar aplicações nativas em nuvem sem serviços que ajudem os cientistas e desenvolvedores a trabalharem juntos, à medida que os dados são transferidos pelos sistemas. Várias alocações de código que usam os mesmos dados podem aumentar o tempo dos builds. No entanto, com um serviço de dados como o Red Hat® OpenShift® Container Storage, você reduz as dependências de tempo em builds simultâneos.

Armazenamento tradicional vs. serviços de dados

Armazenamento tradicional

É a coleta e retenção real de informações digitais brutas: os bits e bytes das aplicações, protocolos de rede, documentos, mídias, catálogos de endereços, preferências dos usuários e muito mais. Quando você salva um documento e escolhe um local, este é o processo de armazenamento de dados. Ele é exibido ao usuário geralmente no nível da infraestrutura. Além disso, essa visualização nem sempre vincula os volumes de armazenamento. Por exemplo, não costuma haver uma maneira nativa de exibir cada arquivo, bloco ou objeto salvo em uma estação de trabalho, provedor de armazenamento em nuvem e disco rígido externo. Por isso, a ação de explorar o armazenamento de dados é muito manual e monolítica.

Serviços de dados

Software que utiliza os dados salvos em volumes de armazenamento tradicionais como entradas para criar saídas específicas, ou que aumenta a resiliência, a disponibilidade e a validade para amplificar os dados tradicionais. Geralmente, os usuários interagem com os serviços de dados como parte de uma aplicação, o que torna o processo muito flexível e personalizável. Por exemplo, o Red Hat OpenShift Container Storage oferece um serviço de dados que abstrai a infraestrutura de armazenamento para que os dados sejam mantidos em diversos lugares diferentes. No entanto, a solução funciona como um único repositório persistente.

Quem usa serviços de dados?

A Massachusetts Open Cloud (MOC) usa serviços de dados. A MOC é uma iniciativa sem fins lucrativos de universidades, organizações governamentais e empresas. Seu objetivo é desenvolver uma infraestrutura comum e baseada em nuvem para a análise de big data , destinada a empresas, órgãos governamentais e organizações sem fins lucrativos. A MOC usou o Red Hat Ceph Storage, nosso serviço de armazenamento definido por software, para organizar e compartilhar grandes quantidades de dados com várias entidades que executam plataformas de análises personalizadas.

Por que escolher a Red Hat?

Porque nossos serviços de dados são compatíveis com todos os provedores de armazenamento e criados para complementar o desenvolvimento de aplicações nativas em nuvem

Use o datacenter ou a nuvem que quiser e comece a implantar todos esses dados nas suas aplicações nativas em nuvem em constante evolução. Com os nossos serviços de dados, é possível aprimorar os dados antigos da sua empresa e transmiti-los diretamente para aplicações nativas em nuvem. Assim, você pode descobrir informações essenciais para resolver problemas do futuro.

Serviços de dados para você começar

Red Hat OpenShift Container Storage product logo

Armazenamento definido por software para ambientes de container.

Saiba muito mais sobre serviços de dados