O que é deep learning?

Publicado 22 de janeiro de 2024•8 minutos (tempo de leitura)

Deep learning é uma técnica de inteligência artificial (IA) que ensina computadores a processar dados usando um algoritmo inspirado pelo cérebro humano.

O deep learning usa inteligência artificial e machine learning (IA/ML) para ajudar cientistas de dados a coletar, analisar e interpretar grandes volumes de dados. O processo de deep learning, também conhecido como aprendizado neural profundo ou rede neural profunda, ensina computadores a aprender por meio de observação, imitando a maneira como os humanos adquirem conhecimento.

O cérebro humano contém diversos neurônios interconectados que atuam como mensageiros na hora de processar as informações (ou dados). Esses neurônios usam impulsos elétricos e sinais químicos para se comunicarem e transmitirem informações entre diferentes áreas do cérebro.

As Redes Neurais Artificiais (RNAs), arquitetura subjacente do deep learning, são baseadas nesse fenômeno biológico, porém são formadas por neurônios artificiais criados em módulos de software chamados de nós. Esses nós usam cálculos matemáticos (em vez de sinais químicos, como no cérebro) para se comunicarem e transmitirem informações. Essa Rede Neural Simulada (RNS) processa dados ao agrupar em clusters os pontos de dados e fazer predições.

Para visualizar melhor, o deep learning é como se fosse um tipo de gráfico de fluxo, começando com uma camada de entrada e terminando com uma camada de saída. Entre essas duas camadas estão as "camadas ocultas", que processam informações em diferentes níveis, ajustando e adaptando seu comportamento à medida que recebem novos dados. Os modelos de deep learning podem ter centenas de camadas ocultas, cada uma delas desempenhando um papel para descobrir relações e padrões dentro de um conjunto de dados.

Começando pela camada de entrada, que é composta por vários nós, os dados são adicionados ao modelo e categorizados de acordo com suas características antes de serem movidos para a próxima camada. O caminho que os dados percorrem através de cada camada se baseia nos cálculos definidos em cada nó. Em algum momento, os dados atravessam cada camada, coletando observações pelo caminho até criar a saída, ou análise final, dos dados.

Explore o Red Hat AI

As aplicações que utilizam o deep learning já estão integradas ao nosso dia a dia e são usadas em vários setores diferentes. A IA generativa, que impulsiona diversas ferramentas de IA, funciona por meio do deep learning.

Os casos de uso de deep learning estão sempre em evolução, mas três das tecnologias mais conhecidas utilizadas hoje são: visão computacional, reconhecimento de fala e PLN (Processamento de Linguagem Natural).

Visão computacional: os computadores podem usar técnicas de deep learning para compreender imagens da mesma maneira que os humanos. Por exemplo, moderação de conteúdo automatizada, reconhecimento facial e classificação de imagens.
Reconhecimento de fala: é possível analisar tom, idioma e sotaque pelos modelos de deep learning. Isso pode ser usado não só para aprimorar a experiência do cliente, como também ajuda na acessibilidade em casos que exigem transcrição em tempo real.
PLN (Processamento de Linguagem Natural): os computadores usam algoritmos de deep learning para analisar e coletar insights de documentos e dados de texto. Isso pode ajudar no resumo de documentos longos, indexação de frases-chave que indiquem sentimento (como comentários positivos e negativos) e geração de insights para assistentes virtuais automatizados e chatbots. O PLN é um campo mais amplo que inclui o desenvolvimento e a aplicação de Large Language Models (LLMs) para compreender e gerar linguagem humana.

Confira alguns exemplos de como os setores estão usando os princípios do deep learning:

Serviço personalizado: chatbots, assistentes virtuais e portais de atendimento ao cliente por telefone utilizam ferramentas como reconhecimento de fala.
Serviços financeiros: a análise preditiva direciona a negociação algorítmica de ações, avalia riscos comerciais de uma aprovação de empréstimo, detecta fraudes e ajuda a gerenciar portfólios de crédito e investimentos.
Saúde: com a digitalização dos registros médicos, as aplicações de reconhecimento de imagem podem oferecer suporte aos especialistas em imagens médicas ao aprender a identificar automaticamente sinais de alerta que indicam um potencial diagnóstico médico. Confira como a HCA Healthcare usa análise preditiva para estabelecer uma abordagem digital e padronizada para detectar a presença de sepse.
Mídia e entretenimento: de compras online até serviços de streaming, o deep learning é usado para rastrear a atividade do usuário e desenvolver recomendações personalizadas.
Automação industrial: em fábricas e armazéns, as aplicações de deep learning podem detectar automaticamente quando pessoas ou objetos estão a uma distância insegura de maquinário, ou então podem ajudar com o controle de qualidade e manutenção preditiva.
Carros autônomos: pesquisadores de automóveis usam o deep learning para treinar carros a fim de detectar objetos como placas de pare, semáforos, calçadas e pedestres.
Aplicação da lei: reconhecimento de fala, visão computacional e PLN (Processamento de Linguagem Natural) podem economizar tempo e recursos ao auxiliar na análise de grandes volumes de dados.
Setor aeroespacial e militar: as entidades que monitoram grandes áreas geográficas podem usar o deep learning para detectar objetos, identificar áreas de interesse mesmo de longe e verificar se uma zona é segura ou não para as tropas.

Conheça os casos de uso de inteligência artificial e machine learning

O deep learning é uma forma especializada do machine learning, e a diferença entre eles está no tipo de dados processados e nos métodos de aprendizagem.

Os algoritmos de machine learning clássicos exigem intervenção humana com pré-processamento de conjunto de dados antes de serem adicionados ao modelo. Isso significa que funcionalidades específicas são definidas e classificadas na entrada dos dados e, depois, organizadas em tabelas antes de serem adicionadas ao modelo de machine learning. Já os algoritmos de deep learning não precisam do mesmo nível de pré-processamento e são capazes de entender dados não estruturados, como documentos de texto, imagens de dados em pixels ou arquivos com dados de áudio.

É recomendável usar o deep learning em vez de machine learning clássico nos casos em que há um grande volume de dados, uma lacuna de conhecimento básico sobre o assunto ou então uma tarefa complexa e demorada.

Veja como o Red Hat OpenShift oferece suporte para operações de machine learning

Sabemos que o deep learning funciona utilizando uma estrutura de nós que se comunicam entre si em uma rede neural artificial. Para criar uma ANN, os cálculos e parâmetros devem ser incluídos no modelo junto com os dados fornecidos, e é preciso garantir que esses cálculos considerem vieses e variações.

No contexto de machine learning, viés refere-se à capacidade do seu modelo de fazer suposições ou generalizações sobre os dados para facilitar o aprendizado da função desejada. Um viés elevado significa que o modelo está simplificando e criando atalhos (até causar uma falha) enquanto processa informações.

Variação é avaliação de quanto um ponto de dados se distancia do seu significado, ou então a avaliação estatística da dispersão entre números em um conjunto de dados. Ao contrário do viés, a variação refere-se ao quão sensível um modelo é aos dados de treinamento. Uma alta variação (ou sensibilidade) significa que o modelo está dando atenção demais aos detalhes e negligenciando os padrões subjacentes no conjunto de dados.

Na aprendizagem supervisionada, quando a variação é alta e o viés é baixo, chamamos isso de sobreajuste. Quando o viés é alto e a variação é baixa, chamamos de subajuste. Criar o ajuste perfeito pode ser uma tarefa difícil, e esse fenômeno geralmente é conhecido como dilema entre viés e variância.

Os parâmetros definem limites, que são essenciais para analisar o grande volume de dados que os algoritmos de deep learning precisam processar. Isso significa que, em muitos casos, é possível corrigir o sobreajuste ou o subajuste usando menos ou mais parâmetros, respectivamente.

Como lidar com viés humano

Se um modelo de deep learning for treinado usando dados estatisticamente enviesados ou não oferecer uma representação precisa da população, o resultado pode apresentar falhas. Infelizmente, é comum que o viés humano seja transferido para a inteligência artificial, o que pode criar algoritmos e resultados discriminatórios.

À medida que as organizações continuam a explorar a IA para melhorar o desempenho e a produtividade, é fundamental implementar estratégias para minimizar os vieses. Isso começa com processos de design inclusivos e uma consideração mais cuidadosa sobre a representação da diversidade nos dados coletados.

O que é uma caixa preta?

"Caixa preta" é quando um programa de IA executa uma tarefa em sua rede neural, mas não mostra como chegou ao resultado. Isso cria um cenário em que ninguém, incluindo os cientistas e engenheiros de dados que criaram o algoritmo, consegue explicar como o modelo chegou a um resultado específico. A ausência de interpretabilidade em modelos de caixa preta pode gerar consequências graves em cenários de tomada de decisões importantes, especialmente em setores como saúde, justiça criminal ou financeiro.

Para entender melhor as caixas pretas, as técnicas de IA explicável podem ser aplicadas no ciclo de vida de machine learning. A IA explicável deve demonstrar habilidades e conhecimentos, explicar ações passadas, processos em andamento e próximos passos, além de referenciar as informações relevantes que fundamentam suas decisões. Ou seja, a IA explicável incentiva os sistemas de IA a “mostrar o que fizeram”.

Mais informações sobre a IA explicável (XAI)

Treinamento e desenvolvimento

Os modelos de deep learning são capazes de executar tarefas computacionais mais complexas sem intervenção humana, mas isso significa que exigem mais capacidade de processamento, infraestrutura suficiente e grandes conjuntos de dados de treinamento. A cloud computing permite que as equipes acessem vários processadores de uma vez, como clusters de GPUs (unidades de processamento gráfico) e CPUs (unidades de processamento central). Isso cria um ambiente ideal para a execução de operações matemáticas complexas.

Ao criar, desenvolver e treinar modelos de deep learning na nuvem, as equipes de desenvolvedores podem escalar e distribuir cargas de trabalho com rapidez e precisão e, ao mesmo tempo, reduzir os custos operacionais.

Inferência e implantação

Depois que o modelo é treinado, ele entra na fasede inferência. Neste ponto, o modelo de deep learning já é capaz de processar dados em tempo real e fazer previsões imediatas. É neste momento que um servidor de inferência se torna crítico. Executado em infraestrutura de nuvem, o servidor de inferência tem a função de atuar como uma ponte entre o hardware e a aplicação de usuário. Sua principal função é otimizar o modelo e, ao mesmo tempo, gerenciar as solicitações de recursos para assegurar um processamento ágil.

Uma ferramenta líder nesse campo é o vLLM. O vLLM é um mecanismo e servidor de inferência com eficiência de memória desenvolvido para melhorar a velocidade e a capacidade de processamento de Large Language Models em ambientes de nuvem híbrida.

Mais informações sobre o vLLM

Deep learning e machine learning na edge

Trabalhar na nuvem cria possibilidades para o uso de machine learning na edge. Ao estabelecer hubs de edge computing conectados a recursos de nuvem pública, é possível coletar e analisar informações em tempo real para ajudar em diversas operações, como atualizações de status da cadeia de suprimentos e informações sobre locais de evacuação devido a um desastre.

O Red Hat® AI pode ajudar suas equipes a aproveitar todos os recursos que discutimos acima, como visão computacional, reconhecimento de fala, processamento de linguagem natural e muito mais.

Nosso portfólio de soluções de IA é baseado em soluções que nossos clientes já confiam. Com essa base, nossas soluções permanecem consistentes, flexíveis e escaláveis.

O Red Hat AI pode ajudar as organizações a:

Adotar a IA e inovar rapidamente.
Reduzir as complexidades da entrega de soluções de IA.
Implantar em qualquer lugar.

Conheça o Red Hat AI

Uma caixa de ferramentas para conhecer o deep learning

Se você quer desenvolver algoritmos de machine learning ou criar modelos preditivos do zero, o Red Hat OpenShift AI tem várias ferramentas diferentes para ajudar você a começar.

A plataforma de IA oferece ferramentas como interfaces interativas baseadas no JupyterLab, acesso simplificado às bibliotecas principais de inteligência artificial e machine learning, além de frameworks amplamente utilizados. Além disso, oferece um editor visual para criar e automatizar pipelines de ciência de dados. Combinado com pipelines de CI/CD, as equipes podem aprimorar seu MLOps para aumentar a eficiência operacional e colocar mais modelos de IA em produção de forma mais rápida.

Conheça o Red Hat OpenShift AI

Parceiros de IA da Red Hat

Além disso, nosso ecossistema de parceiros de IA está crescendo. Diversos parceiros de tecnologia estão trabalhando com a Red Hat para obter a certificação de compatibilidade com o Red Hat AI. Tudo isso, para que você tenha liberdade de escolha.

Conheça nossos parceiros

O que é deep learning?

Acesse a biblioteca de conteúdos da Red Hat

Como lidar com viés humano

O que é uma caixa preta?

Treinamento e desenvolvimento

Inferência e implantação

Deep learning e machine learning na edge

Uma caixa de ferramentas para conhecer o deep learning

Parceiros de IA da Red Hat

Introdução à IA empresarial: um guia para iniciantes

Teste as soluções Red Hat gratuitamente

Leia mais

LLMs (Large Language Models): o que são e como funcionam?

O que é inferência de IA?

O que são modelos fundamentais para IA?

Inteligência artificial: conteúdo adicional

Plataformas

Ferramentas

Experimente, compre e venda

Comunicação

Sobre a Red Hat

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links