Account Login
Jump to section

Introdução aos serviços de dados

Copiar URL

Os serviços de dados agregam valor de negócios às informações, por isso eles podem ser implementados como parte das aplicações nativas em nuvem, em outras palavras, como um elemento integral da sua estratégia de TI para nuvem híbrida aberta.

Os serviços de dados (ou dados como serviço) são conjuntos de pequenas funções independentes e levemente acopladas que aprimoram, organizam, compartilham ou processam as informações coletadas e salvas em volumes de armazenamento. Eles otimizam a resiliência, a disponibilidade e a validade dos dados tradicionais para amplificá-los, além de incorporar novas características, como os metadados.

 

 

Os serviços de dados são unidades autônomas de funções de software que incorporam novas características aos dados. Eles aumentam a disponibilidade, a resiliência e a abrangência dos dados, o que os torna mais úteis para usuários e aplicações.

As funções dos serviços de dados transformam as entradas em saídas. As entradas são conjuntos variados de dados brutos, que não foram processados para uma finalidade específica. Eles estão configurados no formato nativo e são salvos em volumes de armazenamento baseados em nuvem, sejam virtuais ou físicos. Geralmente, as saídas são:

  • Organizacionais: a consolidação, o agrupamento e a estrutura dos dados, geralmente extraídos de fontes estruturadas (bancos de dados), semiestruturadas (data warehouses) ou não estruturadas (data lakes).
  • Transferíveis: o deslocamento dos dados por uma rede, indo da origem até um ponto final, como uma aplicação ou plataforma.
  • Processuais: o processamento dos dados, geralmente como parte do software de inteligência artificial/machine learning (AI/ML), análise ou modelagem.

Dados em repouso

Dados salvos em volumes de armazenamento. Primeiro, os dados brutos – como registros de clientes em bancos de dados de processamento de transações online (OLTP), informações de danos à propriedade obtidos de data warehouses e imagens ou vídeos vindos de data lakes – são extraídos das fontes. Depois, são aplicados princípios de manutenção, organização e governança para torná-los úteis para as aplicações e acessíveis para os usuários. Os serviços de dados são uma parte importante das estratégias de big dataporque ajudam a compreender conjuntos enormes de dados estruturados, semiestruturados e não estruturados armazenados em todos os lugares.

 

Dados em trânsito

Dados que são transferidos do armazenamento de origem para uma aplicação ou plataforma, geralmente em tempo real. Com os serviços de dados, é possível criar pipelines para que a transferência aconteça de maneira contínua entre vários endpoints. Por exemplo, ao operar os dados assim que eles são gerados, as organizações podem trocar o processamento de dados orientado a lotes pelo modelo orientado a eventos. Além disso, os dados nunca são removidos da origem, possibilitando que vários endpoints os usem simultaneamente. Isso ajuda a criar arquiteturas escaláveis e orientadas a eventos.

 

Dados em ação

Dados ativos agrupados em conjuntos que são usados por softwares de modelagem, análise e ciência. Os serviços de dados aprimoram o acesso a plataformas de processamento inteligentes e de alto desempenho, como ferramentas de aprendizado profundo e AI/ML. Dependendo do serviço, os dados em ação envolvem conjuntos de serviços pequenos, independentes e levemente acoplados – geralmente, empacotados em containers e orquestrados por uma plataforma Kubernetes.

 

É impossível criar aplicações nativas em nuvem sem serviços que ajudem os cientistas e desenvolvedores a trabalharem juntos, à medida que os dados são transferidos pelos sistemas. Várias alocações de código que usam os mesmos dados podem aumentar o tempo de criação. No entanto, com um serviço de dados como o Red Hat® OpenShift® Data Foundation, você reduz as dependências de tempo em criações simultâneas.

Armazenamento tradicional

É a coleta e retenção real de informações digitais brutas: os bits e bytes das aplicações, protocolos de rede, documentos, mídias, catálogos de endereços, preferências dos usuários e muito mais. Quando você salva um documento e escolhe um local, este é o processo de armazenamento de dados. Ele é exibido ao usuário geralmente no nível da infraestrutura. Além disso, essa visualização nem sempre vincula os volumes de armazenamento. Por exemplo, não costuma haver uma maneira nativa de exibir cada arquivo, bloco ou objeto salvo em uma estação de trabalho, provedor de armazenamento em nuvem e disco rígido externo. Por isso, a ação de explorar o armazenamento de dados é muito manual e monolítica.

 

Serviços de dados

Software que utiliza os dados salvos em volumes de armazenamento tradicionais como entradas para criar saídas específicas, ou que aumenta a resiliência, a disponibilidade e a validade para amplificar os dados tradicionais. Geralmente, os usuários interagem com os serviços de dados como parte de uma aplicação, o que torna o processo muito flexível e personalizável. Por exemplo, o Red Hat OpenShift Data Foundation oferece um serviço de dados que abstrai a infraestrutura de armazenamento para que os dados sejam mantidos em diversos lugares diferentes. No entanto, a solução funciona como um único repositório persistente.

A Massachusetts Open Cloud (MOC) usa serviços de dados. A MOC é uma iniciativa sem fins lucrativos de universidades, organizações governamentais e empresas. Seu objetivo é desenvolver uma infraestrutura comum e baseada em nuvem para a análise de big data , destinada a empresas, órgãos governamentais e organizações sem fins lucrativos. A MOC usou o Red Hat Ceph Storage, nosso serviço de armazenamento definido por software, para organizar e compartilhar grandes quantidades de dados com várias entidades que executam plataformas de análises personalizadas.

Mesmo sem ter experiência no OpenShift Container Storage, nossa equipe conseguiu configurar dois clusters diferentes do OpenShift e validar o desempenho do Db2 Warehouse em menos de duas semanas.

Piotr Mierzejewski

Diretor de desenvolvimento do Db2, AI e dados da IBM

Porque nossos serviços de dados são compatíveis com todos os provedores de armazenamento e criados para complementar o desenvolvimento de aplicações nativas em nuvem

Use o datacenter ou a nuvem que quiser e comece a implantar todos esses dados nas suas aplicações nativas em nuvem em constante evolução. Com os nossos serviços de dados, é possível aprimorar os dados antigos da sua empresa e transmiti-los diretamente para aplicações nativas em nuvem. Assim, você pode descobrir informações essenciais para resolver problemas do futuro.

Veja como foi o desempenho do Red Hat Ceph Storage no teste de 10 bilhões de objetos da Evaluator Group.

Leia mais

Tópico

O que é big data?

O termo "Big Data" refere-se a dados tão volumosos e complexos que não são mais processáveis por métodos tradicionais.

Artigo

Por que escolher a Red Hat para soluções de armazenamento?

Saiba o que é o armazenamento definido por software e como implantar uma solução Red Hat que ofereça flexibilidade para gerenciar, armazenar e compartilhar dados como você preferir.

Artigo

O que é o armazenamento em nuvem?

Armazenamento em nuvem é a organização de dados mantidos em um local que pode ser acessado por qualquer um na Internet que tenha as permissões necessárias. Saiba como ele funciona

Leia mais sobre armazenamento

Soluções Red Hat

Red Hat OpenShift Data Foundation

Solução de armazenamento definido por software que reserva um lugar permanente para os dados, enquanto containers são iniciados e encerrados entre ambientes diferentes.

Red Hat Gluster Storage

Uma plataforma de armazenamento definido por software que pode ser implantada em ambientes bare-metal, virtual, de container e de nuvem.

Red Hat Ceph Storage

Um sistema de armazenamento definido por software aberto e altamente escalável que gerencia petabytes de dados.

Red Hat Hyperconverged Infrastructure

Computação e armazenamento definidos por software, co-localizados, escaláveis e executados em hardware econômico padrão do setor.

Conteúdo adicional

Datasheet

Datasheet do Red Hat Ceph Storage

VÍDEO - THE SOURCE TV

Reinvenção para alavancar os negócios

Uma conversa sobre a importância de uma cultura corporativa consolidada para ir além no mercado.

Illustration - mail

Quer receber mais conteúdo deste tipo?

Cadastre-se para receber a nossa newsletter Red Hat Shares.