Ir para seção

O que é deep learning?

Copiar URL

Deep learning é uma técnica de inteligência artificial (IA) que ensina computadores a processar dados usando um algoritmo inspirado no cérebro humano. 

O deep learning usa inteligência artificial e machine learning (IA/ML) para ajudar cientistas de dados a coletar, analisar e interpretar grandes volumes de dados. O processo de deep learning, também conhecido como aprendizado neural profundo ou rede neural profunda, ensina computadores a aprender por meio de observação, imitando a maneira como os humanos adquirem conhecimento. 

O cérebro humano contém diversos neurônios interconectados que atuam como mensageiros quando o cérebro processa informações (ou dados). Esses neurônios usam impulsos elétricos e sinais químicos para se comunicarem entre si e transmitir informações em diferentes áreas do cérebro. 

As redes neurais artificiais (ANNs), que são a arquitetura subjacente por trás do deep learning, são baseadas nesse fenômeno biológico, mas formadas por neurônios artificiais criados a partir de módulos de software chamados de nós. Esses nós usam cálculos matemáticos (em vez de sinais químicos, como no cérebro) para se comunicarem e transmitirem informações. Essa rede neural simulada (SNN) processa dados ao agrupar em clusters os pontos de dados e fazer predições.

Para visualizar melhor, o deep learning é como se fosse um tipo de gráfico de fluxo, começando com uma camada de entrada e terminando com uma camada de saída. Entre essas duas camadas estão as "camadas ocultas", que processam informações em diferentes níveis, ajustando e adaptando seu comportamento à medida que recebem novos dados. Os modelos de deep learning podem ter centenas de camadas ocultas, cada uma delas desempenhando um papel para descobrir relações e padrões dentro de um conjunto de dados. 

Começando pela camada de entrada, que é composta por vários nós, os dados são adicionados ao modelo e categorizados de acordo com suas características antes de serem movidos para a próxima camada. O caminho que os dados percorrem através de cada camada se baseia nos cálculos definidos em cada nó. Em algum momento, os dados atravessam cada camada, coletando observações pelo caminho até criar a saída, ou análise final, dos dados.

As aplicações que utilizam o deep learning já estão integradas ao nosso dia a dia e são usadas em vários setores diferentes. A IA generativa, que impulsiona diversas ferramentas de IA, funciona por meio do deep learning.

Os casos de uso de deep learning estão sempre em evolução, mas três das tecnologias mais conhecidas utilizadas hoje são: visão computacional, reconhecimento de fala e processamento de linguagem natural (NLP). 

  • Visão computacional: os computadores podem usar técnicas de deep learning para compreender imagens da mesma maneira que os humanos. Por exemplo, moderação de conteúdo automatizada, reconhecimento facial e classificação de imagens. 
  • Reconhecimento de fala: é possível analisar tom, idioma e sotaque pelos modelos de deep learning. Isso pode ser usado não só para aprimorar a experiência do cliente, como também ajuda na acessibilidade em casos que exigem transcrição em tempo real.
  • Processamento de linguagem natural (NLP): os computadores usam algoritmos de deep learning para analisar e coletar insights de documentos e dados de texto. Isso pode auxiliar no resumo de documentos longos, indexação de frases-chave que indiquem sentimento (como comentários positivos e negativos) e geração de insights para assistentes virtuais automatizados e chatbots. O NPL é um campo mais amplo que inclui o desenvolvimento e a aplicação de Large Language Models (LLMs) para compreender e gerar linguagem humana.
     

Confira alguns exemplos de como os setores estão usando os princípios do deep learning:

  • Serviço personalizado: chatbots, assistentes virtuais e portais de atendimento ao cliente por telefone utilizam ferramentas como reconhecimento de fala. 
  • Serviços financeiros: a análise preditiva direciona a negociação algorítmica de ações, avalia riscos comerciais de uma aprovação de empréstimo, detecta fraudes e ajuda a gerenciar portfólios de crédito e investimentos.
  • Saúde: com a digitalização dos registros médicos, as aplicações de reconhecimento de imagem podem oferecer suporte aos especialistas em imagens médicas ao aprender a identificar automaticamente sinais de alerta que indicam um potencial diagnóstico médico. Confira como a HCA Healthcare usa análise preditiva para estabelecer uma abordagem digital e padronizada para detectar a presença de sepse. 
  • Mídia e entretenimento: de compras online até serviços de streaming, o deep learning é usado para rastrear a atividade do usuário e desenvolver recomendações personalizadas.
  • Automação industrial: em fábricas e armazéns, as aplicações de deep learning podem detectar automaticamente quando pessoas ou objetos estão a uma distância insegura de maquinário, ou então podem ajudar com o controle de qualidade e manutenção preditiva. 
  • Carros autônomos: pesquisadores de automóveis usam o deep learning para treinar carros a fim de detectar objetos como placas de pare, semáforos, calçadas e pedestres.
  • Aplicação da lei: reconhecimento de fala, visão computacional e processamento de linguagem natural (NLP) podem economizar tempo e recursos ao auxiliar na análise de grandes volumes de dados. 
  • Setor aeroespacial e militar: as entidades que monitoram grandes áreas geográficas podem usar o deep learning para detectar objetos, identificar áreas de interesse mesmo de longe e verificar se uma zona é segura ou não para as tropas. 

A Red Hat se uniu à IBM para criar o Red Hat® Ansible® Lightspeed com IBM watsonx Code Assistant: um serviço de IA generativa que ajuda desenvolvedores a criar conteúdos do Ansible com mais eficiência.

O deep learning é uma forma especializada do machine learning, e a diferença entre eles está no tipo de dados processados e nos métodos de aprendizagem.

Os algoritmos de machine learning clássicos exigem intervenção humana com pré-processamento de conjunto de dados antes de serem adicionados ao modelo. Isso significa que funcionalidades específicas são definidas e classificadas na entrada dos dados e, depois, organizadas em tabelas antes de serem adicionadas ao modelo de machine learning. Já os algoritmos de deep learning não precisam do mesmo nível de pré-processamento e conseguem entender dados não estruturados, como documentos de texto, imagens de dados em pixels ou arquivos com dados de áudio. 

É recomendável usar o deep learning em vez de machine learning clássico nos casos em que há um grande volume de dados, uma lacuna de conhecimento básico sobre o assunto ou então uma tarefa complexa e demorada.

Sabemos que o deep learning funciona utilizando uma estrutura de nós que se comunicam entre si em uma rede neural artificial. Para criar uma ANN, os cálculos e parâmetros devem ser incluídos no modelo com os dados fornecidos, sendo preciso garantir que esses cálculos considerem vieses e variações. 

No contexto de machine learning, viés refere-se à capacidade do seu modelo de fazer suposições ou generalizações sobre os dados para facilitar o aprendizado da função desejada. Um viés elevado significa que o modelo está simplificando e criando atalhos (até causar uma falha) enquanto processa informações. 

Variação é avaliação de quanto um ponto de dados se distancia do seu significado, ou então a avaliação estatística da dispersão entre números em um conjunto de dados. Ao contrário do viés, a variação refere-se ao quão sensível um modelo é aos dados de treinamento. Uma alta variação (ou sensibilidade) significa que o modelo está dando atenção demais aos detalhes e negligenciando os padrões subjacentes no conjunto de dados. 

Na aprendizagem supervisionada, quando a variação é alta e o viés é baixo, chamamos isso de sobreajuste. Quando o viés é alto e a variação é baixa, chamamos de subajuste. Criar o ajuste perfeito pode ser uma tarefa difícil, e esse fenômeno é geralmente conhecido como bias-variance tradeoff (dilema entre viés e variância). 

Os parâmetros definem os limites, essenciais para analisar o grande volume de dados que os algoritmos de deep learning precisam processar. Isso significa que, em muitos casos, é possível corrigir o sobreajuste ou o subajuste usando menos, ou mais parâmetros, respectivamente. 

Como lidar com viés humano 

Se um modelo de deep learning for treinado usando dados estatisticamente enviesados ou não fornecer uma representação precisa da população, o resultado pode apresentar falhas. Infelizmente, é comum que o viés humano seja transferido para a inteligência artificial, o que pode criar algoritmos discriminatórios e resultados enviesados. 

À medida que as organizações continuam a explorar a IA para melhorar o desempenho e a produtividade, é fundamental implementar estratégias para minimizar os vieses. Isso começa com processos de design inclusivos e uma consideração mais cuidadosa da diversidade representativa nos dados coletados. 

O que é uma caixa preta?

"Caixa preta" é quando um programa de IA executa uma tarefa em sua rede neural, mas não mostra o processo de trabalho. Isso cria um cenário em que ninguém, incluindo os cientistas e engenheiros de dados que criaram o algoritmo, consegue explicar como o modelo chegou a um resultado específico. A ausência de interoperabilidade em modelos de caixa preta pode gerar consequências graves em cenários de tomada de decisões importantes, especialmente em setores como saúde, justiça criminal ou financeiro. 

Os modelos de deep learning são capazes de executar tarefas computacionais mais complexas sem intervenção humana, mas isso significa que exigem mais capacidade de processamento, infraestrutura suficiente e grandes conjuntos de dados de treinamento. A cloud computing permite que as equipes acessem vários processadores de uma vez, como clusters de GPUs (unidades de processamento gráfico) e CPUs (unidades de processamento central). Isso cria um ambiente ideal para a execução de operações matemáticas complexas.

Ao criar, desenvolver e treinar modelos de deep learning na nuvem, as equipes de desenvolvedores podem expandir e distribuir cargas de trabalho com rapidez e precisão e, ao mesmo tempo, reduzir os custos operacionais. 

 

Deep learning e machine learning na edge

Trabalhar na nuvem cria possibilidades para o uso de machine learning na edge. Ao estabelecer hubs de edge computing conectados a recursos de nuvem pública, é possível coletar e analisar informações em tempo real para ajudar em diversas operações, como atualizações de status da cadeia de suprimentos e informações sobre locais de evacuação devido a um desastre. 

Com o OpenShift Data Science, o Red Hat® OpenShift® AI oferece bases comuns para sua equipe criar e implantar aplicações de IA e modelos de machine learning (aprendizado de máquina) com transparência e controle. 

A plataforma Red Hat OpenShift Data Science pode treinar, realizar a engenharia de prompt, fine-tunning e oferecer modelos de IA para seu caso de uso exclusivo e usando seus próprios dados.

Para grandes implantações de IA, o Red Hat OpenShift oferece uma plataforma de aplicações escalável e adequada para cargas de trabalho de IA, incluindo acesso a aceleradores de hardware conhecidos.

A Red Hat vêm utilizando as soluções de inteligência artificial disponíveis no Red Hat OpenShift para aprimorar o software open source. O primeiro projeto é a integração do Red Hat Ansible Lightspeed com IBM watsonx Code Assistant. Esse serviço ajuda as equipes de automação a aprender, criar e manter os conteúdos do Ansible com mais eficiência. Ele aceita entradas inseridas pelo usuário e interage com modelos de base do IBM watsonx para produzir recomendações de código usadas para criar playbooks do Ansible.

Além disso, as integrações de parceiros da Red Hat oferecem acesso a um ecossistema de ferramentas de IA confiáveis, projetadas para serem compatíveis com plataformas open source

Leitura recomendada

ARTIGO

Stateful x stateless

Para determinar se algo é stateful ou stateless, basta considerar o tempo em que seu estado de interação é registrado e como essas informações precisam ser armazenadas.

ARTIGO

O que é Quarkus?

Quarkus é um stack Java nativo em Kubernetes que foi desenvolvido para máquinas virtuais Java (JVMs) e compilação nativa, otimizando essa linguagem especificamente para containers.

ARTIGO

O que é serverless?

Serverless é um modelo de desenvolvimento nativo em nuvem para criação e execução de aplicações sem o gerenciamento de servidores.

Leia mais sobre aplicações nativas em nuvem

Soluções Red Hat

Uma plataforma de aplicações para empresas que oferece serviços testados para lançar aplicações na infraestrutura de sua escolha.

 

Conteúdo adicional

Caso de sucesso

Banco Galicia, da Argentina, integra novos clientes corporativos em minutos com sua plataforma de NLP inteligente.

VÍDEO - THE SOURCE TV

O futuro da nuvem: a evolução das soluções cloud

Aprenda mais sobre a evolução e o futuro das soluções em nuvem com os especialistas da Red Hat

E-book

O caminho para a adoção de aplicações nativas em nuvem

Caso de sucesso

KPMG

A KPMG melhora os resultados dos serviços estaduais ao cidadão por meio de uma moderna plataforma de integração de sistemas.

Treinamentos Red Hat

Treinamento gratuito

Developing Cloud-Native Applications with Microservices Architectures