AI010

Red Hat AI Inference Server Technical Overview

Visão geral

Otimize suas cargas de trabalho de IA e reduza custos com o Red Hat AI Inference Server.

Descrição do curso

  • Conheça os principais insights sobre a implantação de IA com esta visão geral técnica do Red Hat AI Inference Server. Aprenda a lidar com as complexidades e os custos da execução de modelos de IA na produção. Descubra como a solução da Red Hat, com tecnologia vLLM, otimiza o desempenho e oferece economia em ambientes de nuvem, on-premise, virtualizados e de edge. Explore técnicas avançadas, como quantização e decodificação especulativa, para aprimorar seus recursos de inferência de IA. Este vídeo sob demanda mostra como implantar e gerenciar modelos no OpenShift AI de forma simples e como alcançar eficiência e flexibilidade incomparáveis para suas cargas de trabalho de IA.

Resumo do conteúdo do curso

  • O que é inferência?
  • Desafios da inferência
  • Solução Red Hat AI Inference Server
  • Integração ao portfólio do Red Hat AI
  • Flexibilidade de implantação
  • Ferramenta de compactação LLM (quantização)
  • Técnicas de otimização de desempenho (KV cache, decodificação especulativa, inferência paralela de tensores)
  • Estudos de caso
  • Implantação e gerenciamento de modelos
  • Conexões de armazenamento para modelos
  • Métricas e monitoramento
  • Integração do Hugging Face

Público-alvo do curso

  • Profissionais e engenheiros de inteligência artificial e machine learning
  • Engenheiros de DevOps
  • Arquitetos e engenheiros de nuvem
  • Tomadores de decisões técnicas

Treinamentos recomendados

  • Não há pré-requisitos para esta visão geral técnica.
Tópicos

Tópicos do curso

  • O que é inferência?
  • Desafios da inferência
  • Solução Red Hat AI Inference Server
  • Integração ao portfólio do Red Hat AI
  • Flexibilidade de implantação
  • Ferramenta de compactação LLM (quantização)
  • Técnicas de otimização de desempenho (KV cache, decodificação especulativa, inferência paralela de tensores)
  • Estudos de caso
  • Implantação e gerenciamento de modelos
  • Conexões de armazenamento para modelos
  • Métricas e monitoramento
  • Integração do Hugging Face
Resultados

Próximos exames ou cursos recomendados

Para iniciar, selecione seu país:

Mais maneiras de desenvolver suas habilidades

O melhor dos dois mundos em um só lugar: treinamento virtual com especialistas, aprendizado individualizado, suporte especializado e exame de certificação. Tudo incluso no Red Hat Learning Subscription.

Disponibilidade para treinamento no local

Se você quer que toda a sua equipe receba treinamento, podemos fazer no seu local, pessoalmente ou de forma remota.

Red Hat Learning Subscription

Trajetórias de aprendizagem e treinamentos abrangentes sobre as soluções Red Hat, certificações reconhecidas pelo setor e uma experiência de aprendizado de TI dinâmica e flexível.