Programa do Curso

Introdução à aprendizagem multimodal

  • Panorama da IA multimodal
  • Desafios no processamento de dados multimodais
  • Vantagens dos LLM multimodais

Compreender os grandes modelos de linguagem

  • Arquitetura dos LLMs mais avançados
  • Treinar LLMs com dados multimodais
  • Estudos de casos: Aplicações multimodais de LLM bem sucedidas

Processamento de dados multimodais

  • Técnicas de pré-processamento de dados para texto, imagem e áudio
  • Extração de características e aprendizagem de representação
  • Integração de dados multimodais em LLMs

Desenvolvimento de aplicações LLM multimodais

  • Conceção de interfaces de utilizador para interação multimodal
  • LLMs em assistentes virtuais e chatbots
  • Criar experiências imersivas com LLMs

Avaliação e otimização de sistemas multimodais

  • Métricas de desempenho para LLMs multimodais
  • Estratégias de otimização para uma melhor precisão e eficiência
  • Abordagem de preconceito e justiça em sistemas multimodais

Laboratório prático: Criar um projeto de LLM multimodal

  • Configurar um conjunto de dados multimodal
  • Implementação de uma LLM multimodal para um caso de utilização específico
  • Testar e aperfeiçoar o sistema

Resumo e próximos passos

Requisitos

  • Conhecimento da aprendizagem automática e das redes neuronais
  • Experiência em programação Python
  • Familiaridade com o pré-processamento de dados para vários tipos de dados (texto, imagem, áudio)

Público-alvo

  • Cientistas de dados
  • Engenheiros de aprendizagem automática
  • Programadores de software
  • Investigadores que se dedicam à IA e ao processamento de linguagem natural
 14 Horas

Próximas Formações Provisórias

Categorias Relacionadas