Cursos de DeepSpeed for Deep Learning
DeepSpeed é uma biblioteca de otimização de aprendizagem profunda que facilita o escalonamento de modelos de aprendizagem profunda em hardware distribuído. Desenvolvido por Microsoft, o DeepSpeed se integra ao Py Torch para fornecer melhor dimensionamento, treinamento mais rápido e melhor utilização de recursos.
Este treinamento ao vivo conduzido por instrutor (no local ou remoto) é destinado a cientistas de dados de nível iniciante a intermediário e engenheiros de aprendizado de máquina que desejam melhorar o desempenho de seus modelos de aprendizado profundo.
Ao final deste treinamento, os participantes serão capazes de:
- Entenda os princípios do aprendizado profundo distribuído.
- Instale e configure o DeepSpeed.
- Escale modelos de aprendizado profundo em hardware distribuído usando DeepSpeed.
- Implemente e experimente os recursos do DeepSpeed para otimização e eficiência de memória.
Formato do curso
- Palestra interativa e discussão.
- Muitos exercícios e prática.
- Implementação prática em um ambiente de laboratório ao vivo.
Opções de personalização do curso
- Para solicitar uma formação personalizada para este curso, por favor contacte-nos para combinar.
Programa do Curso
Introdução
- Visão geral dos desafios de escalonamento da aprendizagem profunda
- Visão geral do DeepSpeed e seus recursos
- DeepSpeed vs. outras bibliotecas de aprendizagem profunda distribuídas
Primeiros passos
- Configurando o ambiente de desenvolvimento
- Instalando PyTorch e DeepSpeed
- Configurando o DeepSpeed para treinamento distribuído
Recursos de otimização do DeepSpeed
- Pipeline de treinamento do DeepSpeed
- ZeRO (otimização de memória)
- Checkpointing de ativação
- Checkpointing de gradiente
- Paralelismo do pipeline
Escalonamento de modelos com DeepSpeed
- Escalonamento básico usando DeepSpeed
- Técnicas avançadas de escalonamento
- Considerações de desempenho e práticas recomendadas
- Técnicas de depuração e solução de problemas
Tópicos avançados do DeepSpeed
- Técnicas avançadas de otimização
- Usando DeepSpeed com treinamento de precisão mista
- DeepSpeed em diferentes hardwares (por exemplo, GPUs, TPUs)
- DeepSpeed com múltiplos nós de treinamento
Integrando DeepSpeed com PyTorch
- Integrando DeepSpeed com fluxos de trabalho PyTorch
- Usando DeepSpeed com PyTorch Lightning
Solução de problemas
- Depurando problemas comuns do DeepSpeed
- Monitoramento e registro
Resumo e próximos passos
- Recapitulação dos principais conceitos e recursos
- Práticas recomendadas para usar o DeepSpeed em produção
- Outros recursos para aprender mais sobre o DeepSpeed
Requisitos
- Conhecimento intermédio dos princípios da aprendizagem profunda
- Experiência com PyTorch ou estruturas de aprendizagem profunda semelhantes
- Familiaridade com a programação Python
Público-alvo
- Cientistas de dados
- Engenheiros de aprendizagem automática
- Programadores
Precisa de ajuda para escolher o curso certo?
Cursos de DeepSpeed for Deep Learning - Enquiry
DeepSpeed for Deep Learning - Solicitação de Consultoria
Solicitação de Consultoria
Próximas Formações Provisórias
Cursos Relacionados
Advanced Stable Diffusion: Deep Learning for Text-to-Image Generation
21 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados de nível intermediário a avançado, engenheiros de aprendizado de máquina, pesquisadores de aprendizado profundo e especialistas em visão computacional que desejam expandir seus conhecimentos e habilidades em aprendizado profundo para geração de texto para imagem.
No final deste treinamento, os participantes serão capazes de:
- Compreender arquiteturas e técnicas avançadas de aprendizado profundo para geração de texto para imagem.
- Implementar modelos complexos e otimizações para síntese de imagens de alta qualidade.
- Otimize o desempenho e a escalabilidade para grandes conjuntos de dados e modelos complexos.
- Ajustar hiperparâmetros para melhor desempenho e generalização do modelo.
- Integrar Stable Diffusion com outras estruturas e ferramentas de aprendizagem profunda
Applied AI from Scratch
28 HorasEste é um curso de 4 dias que apresenta a IA e a sua aplicação. Existe a opção de ter um dia adicional para realizar um projeto de IA após a conclusão deste curso.
Deep Learning para Vision com Caffe
21 HorasCaffe é uma estrutura de aprendizagem profunda feita com expressão, velocidade e modularidade em mente.
Este curso explora a aplicação do Caffe como uma estrutura de aprendizagem profunda para o reconhecimento de imagens usando o MNIST como um exemplo
Público
Este curso é adequado para pesquisadores e engenheiros do Deep Learning interessados em utilizar o Caffe como um framework.
Depois de concluir este curso, os delegados poderão:
- entender a estrutura e os mecanismos de implantação do Caffe
- realizar tarefas de instalação / ambiente de produção / arquitetura e configuração
- avaliar a qualidade do código, executar a depuração, monitoramento
- implementar produção avançada como modelos de treinamento, implementação de camadas e registro
Deep Learning Neural Networks with Chainer
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a pesquisadores e desenvolvedores que desejam usar Chainer para construir e treinar redes neurais em Python, tornando o código fácil de depurar.
No final desta formação, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para começar a desenvolver modelos de redes neurais.
- Definir e implementar modelos de redes neurais usando um código fonte compreensível.
- Execute exemplos e modifique os algoritmos existentes para otimizar os modelos de treinamento de aprendizado profundo, aproveitando GPU s para alto desempenho.
Using Computer Network ToolKit (CNTK)
28 HorasO Computer Network ToolKit (CNTK) é uma estrutura de aprendizagem automática de formação de RNNs de código aberto, multi-máquinas, multiGPU e altamente eficiente para voz, texto e imagens.
Público alvo
Este curso destina-se a engenheiros e arquitectos que pretendam utilizar o CNTK nos seus projectos.
Computer Vision with Google Colab and TensorFlow
21 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a profissionais de nível avançado que desejam aprofundar sua compreensão da visão computacional e explorar os recursos do TensorFlow para desenvolver modelos de visão sofisticados usando o Go ogle Colab.
No final desta formação, os participantes serão capazes de:
- Construir e treinar redes neurais convolucionais (CNNs) usando TensorFlow.
- Aproveitar o Google Colab para o desenvolvimento de modelos escaláveis e eficientes baseados em nuvem.
- Implementar técnicas de pré-processamento de imagens para tarefas de visão computacional.
- Implementar modelos de visão computacional para aplicações no mundo real.
- Utilizar a aprendizagem por transferência para melhorar o desempenho dos modelos CNN.
- Visualizar e interpretar os resultados dos modelos de classificação de imagens.
Deep Learning with TensorFlow in Google Colab
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas e desenvolvedores de dados de nível intermediário que desejam entender e aplicar técnicas de aprendizado profundo usando o ambiente Go ogle Colab.
No final deste treinamento, os participantes serão capazes de:
- Configurar e navegar no Google Colab para projetos de aprendizado profundo.
- Compreender os fundamentos das redes neurais.
- Implementar modelos de aprendizado profundo usando TensorFlow.
- Treinar e avaliar modelos de aprendizagem profunda.
- Utilize recursos avançados de TensorFlow para aprendizado profundo.
Deep Learning for NLP (Natural Language Processing)
28 HorasNeste treinamento ao vivo conduzido por instrutor em Portugal, os participantes aprenderão a usar Python bibliotecas para PNL enquanto criam um aplicativo que processa um conjunto de imagens e gera legendas.
No final desta formação, os participantes serão capazes de
- Desenhar e codificar DL para NLP usando Python bibliotecas.
- Criar Python código que lê uma coleção substancialmente enorme de imagens e gera palavras-chave.
- Criar Python Código que gera legendas a partir das palavras-chave detectadas.
Deep Learning for Vision
21 HorasPúblico
Este curso é adequado para pesquisadores e engenheiros do Deep Learning interessados em utilizar ferramentas disponíveis (principalmente código aberto) para analisar imagens de computador
Este curso fornece exemplos de trabalho.
Edge AI with TensorFlow Lite
14 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a desenvolvedores de nível intermediário, cientistas de dados e profissionais de IA que desejam aproveitar o TensorFlow Lite para aplicativos Edge AI.
No final deste treinamento, os participantes serão capazes de:
- Entenda os fundamentos do TensorFlow Lite e seu papel no Edge AI.
- Desenvolver e otimizar modelos de IA usando TensorFlow Lite.
- Implantar modelos TensorFlow Lite em vários dispositivos de borda.
- Utilizar ferramentas e técnicas para conversão e otimização de modelos.
- Implementar aplicativos práticos de IA de borda usando o TensorFlow Lite.
Accelerating Deep Learning with FPGA and OpenVINO
35 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a cientistas de dados que desejam acelerar os aplicativos de aprendizado de máquina em tempo real e implantá-los em escala.
Ao final deste treinamento, os participantes serão capazes de:
- Instalar o kit de ferramentas OpenVINO.
- Acelerar uma aplicação de visão computacional usando um FPGA.
- Executar diferentes camadas CNN no FPGA.
- Escalar o aplicativo em vários nós em um cluster Kubernetes.
Distributed Deep Learning with Horovod
7 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a desenvolvedores ou cientistas de dados que desejam usar Horovod para executar treinamentos de aprendizado profundo distribuídos e escalá-lo para ser executado em vários GPU s em paralelo.
No final deste treinamento, os participantes serão capazes de:
- Configurar o ambiente de desenvolvimento necessário para começar a executar treinamentos de aprendizado profundo.
- Instalar e configurar Horovod para treinar modelos com TensorFlow, Keras, Py Torch e Apache MXNet.
- Escalar o treinamento de aprendizado profundo com Horovod para ser executado em vários GPU s.
Deep Learning with Keras
21 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (no local ou remoto) é destinado a pessoas técnicas que desejam aplicar o modelo de aprendizado profundo a aplicativos de reconhecimento de imagem.
Ao final deste treinamento, os participantes serão capazes de:
- Instalar e configurar Keras.
- Prototipar rapidamente modelos de aprendizado profundo.
- Implementar uma rede convolucional.
- Implementar uma rede recorrente.
- Execute um modelo de aprendizado profundo em uma CPU e GPU.
Introduction to Stable Diffusion for Text-to-Image Generation
21 HorasEste treinamento ao vivo conduzido por instrutor (no local ou remoto) é destinado a cientistas de dados, engenheiros de aprendizado de máquina e pesquisadores de visão computacional que desejam aproveitar o Stable Diffusion para gerar imagens de alta qualidade para uma variedade de casos de uso.
No final deste treinamento, os participantes serão capazes de:
- Compreender os princípios de Stable Diffusion e como ele funciona para a geração de imagens.
- Construir e treinar modelos Stable Diffusion para tarefas de geração de imagens.
- Aplicar Stable Diffusion a vários cenários de geração de imagens, como inpainting, outpainting e tradução de imagem para imagem.
- Otimizar o desempenho e a estabilidade dos modelos Stable Diffusion.
Tensorflow Lite for Microcontrollers
21 HorasEste treinamento ao vivo conduzido por instrutor em Portugal (online ou no local) é destinado a engenheiros que desejam escrever, carregar e executar modelos de aprendizado de máquina em dispositivos incorporados muito pequenos.
No final desta formação, os participantes serão capazes de
- Instalar TensorFlow Lite.
- Carregar modelos de aprendizado de máquina em um dispositivo incorporado para permitir que ele detecte fala, classifique imagens, etc.
- Adicionar IA a dispositivos de hardware sem depender de conetividade de rede.