Programa do Curso

Introdução a Large Language Models (LLMs)

  • Visão geral dos LLMs
  • Definição e significado
  • Aplicações actuais em IA

Arquitetura de Transformadores

  • O que é um transformador e como funciona?
  • Principais componentes e características
  • Incorporação e codificação posicional
  • Atenção a várias cabeças
  • Rede neural feed-forward
  • Normalização e ligações residuais

Modelos de transformação

  • Mecanismo de auto-atenção
  • Arquitetura codificador-descodificador
  • Embeddings posicionais
  • BERT (Bidirectional Encoder Representations from Transformers)
  • GPT (Transformador generativo pré-treinado)

Otimização do desempenho e armadilhas

  • Comprimento do contexto
  • Mamba e modelos de espaço de estado
  • Atenção ao flash
  • Transformadores esparsos
  • Transformadores de visão
  • Importância da quantização

Melhorar os transformadores

  • Geração de texto aumentado para recuperação
  • Mistura de modelos
  • Árvore de pensamentos

Afinação fina

  • Teoria da adaptação de baixo grau
  • Ajuste fino com QLora

Leis de escala e otimização em LLMs

  • Importância das leis de escala para LLMs
  • Escalonamento do tamanho dos dados e do modelo
  • Escalonamento computacional
  • Escalonamento da eficiência dos parâmetros

Otimização

  • Relação entre tamanho do modelo, tamanho dos dados, orçamento de computação e requisitos de inferência
  • Otimização do desempenho e da eficiência das LLMs
  • Melhores práticas e ferramentas para treino e afinação de LLMs

Treinamento e ajuste fino de LLMs

  • Passos e desafios da formação de LLMs a partir do zero
  • Aquisição e manutenção de dados
  • Requisitos de dados, CPU e memória em grande escala
  • Desafios de otimização
  • Panorama das LLMs de código aberto

Fundamentos de Reinforcement Learning (RL)

  • Introdução a Reinforcement Learning
  • Aprendizagem através de reforço positivo
  • Definição e conceitos fundamentais
  • Processo de Decisão de Markov (MDP)
  • Programação dinâmica
  • Métodos de Monte Carlo
  • Aprendizagem por diferença temporal

Profundo Reinforcement Learning

  • Redes Q profundas (DQN)
  • Otimização da política proximal (PPO)
  • Elements de Reinforcement Learning

Integração de LLMs e Reinforcement Learning

  • Combinação de LLMs com Reinforcement Learning
  • Como a RL é utilizada em LLMs
  • Reinforcement Learning com Feedback Humano (RLHF)
  • Alternativas à RLHF

Casos de estudo e aplicações

  • Aplicações do mundo real
  • Histórias de sucesso e desafios

Tópicos avançados

  • Técnicas avançadas
  • Métodos de otimização avançados
  • Investigação e desenvolvimentos de ponta

Resumo e próximos passos

Requisitos

  • Conhecimento básico de Machine Learning

Público

  • Cientistas de dados
  • Engenheiros de software
 21 Horas

Próximas Formações Provisórias

Categorias Relacionadas