Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução a Large Language Models (LLMs)
- Visão geral dos LLMs
- Definição e significado
- Aplicações actuais em IA
Arquitetura de Transformadores
- O que é um transformador e como funciona?
- Principais componentes e características
- Incorporação e codificação posicional
- Atenção a várias cabeças
- Rede neural feed-forward
- Normalização e ligações residuais
Modelos de transformação
- Mecanismo de auto-atenção
- Arquitetura codificador-descodificador
- Embeddings posicionais
- BERT (Bidirectional Encoder Representations from Transformers)
- GPT (Transformador generativo pré-treinado)
Otimização do desempenho e armadilhas
- Comprimento do contexto
- Mamba e modelos de espaço de estado
- Atenção ao flash
- Transformadores esparsos
- Transformadores de visão
- Importância da quantização
Melhorar os transformadores
- Geração de texto aumentado para recuperação
- Mistura de modelos
- Árvore de pensamentos
Afinação fina
- Teoria da adaptação de baixo grau
- Ajuste fino com QLora
Leis de escala e otimização em LLMs
- Importância das leis de escala para LLMs
- Escalonamento do tamanho dos dados e do modelo
- Escalonamento computacional
- Escalonamento da eficiência dos parâmetros
Otimização
- Relação entre tamanho do modelo, tamanho dos dados, orçamento de computação e requisitos de inferência
- Otimização do desempenho e da eficiência das LLMs
- Melhores práticas e ferramentas para treino e afinação de LLMs
Treinamento e ajuste fino de LLMs
- Passos e desafios da formação de LLMs a partir do zero
- Aquisição e manutenção de dados
- Requisitos de dados, CPU e memória em grande escala
- Desafios de otimização
- Panorama das LLMs de código aberto
Fundamentos de Reinforcement Learning (RL)
- Introdução a Reinforcement Learning
- Aprendizagem através de reforço positivo
- Definição e conceitos fundamentais
- Processo de Decisão de Markov (MDP)
- Programação dinâmica
- Métodos de Monte Carlo
- Aprendizagem por diferença temporal
Profundo Reinforcement Learning
- Redes Q profundas (DQN)
- Otimização da política proximal (PPO)
- Elements de Reinforcement Learning
Integração de LLMs e Reinforcement Learning
- Combinação de LLMs com Reinforcement Learning
- Como a RL é utilizada em LLMs
- Reinforcement Learning com Feedback Humano (RLHF)
- Alternativas à RLHF
Casos de estudo e aplicações
- Aplicações do mundo real
- Histórias de sucesso e desafios
Tópicos avançados
- Técnicas avançadas
- Métodos de otimização avançados
- Investigação e desenvolvimentos de ponta
Resumo e próximos passos
Requisitos
- Conhecimento básico de Machine Learning
Público
- Cientistas de dados
- Engenheiros de software
21 Horas