Programa do Curso
Introdução
Esta seção fornece uma introdução geral sobre quando usar o 'aprendizado de máquina', o que deve ser considerado e o que isso significa, incluindo os prós e os contras. Tipos de dados (estruturados/não estruturados/estáticos/transmitidos), validade/volume de dados, análise orientada por dados versus análise orientada pelo usuário, modelos estatísticos versus modelos de aprendizado de máquina/desafios de aprendizagem não supervisionada, compensação de viés-variância, iteração/avaliação, abordagens de validação cruzada , supervisionado/não supervisionado/reforço.
PRINCIPAIS TEMAS
1. Compreendendo o ingênuo Bayes
- Conceitos básicos de métodos bayesianos
- Probabilidade
- Probabilidade conjunta
- Probabilidade condicional com teorema de Bayes
- O ingênuo algoritmo de Bayes
- A ingênua classificação de Bayes
- O estimador de Laplace
- Usando recursos numéricos com Bayes ingênuo
2. Compreender as árvores de decisão
- Dividir e conquistar
- O algoritmo de árvore de decisão C5.0
- Escolhendo a melhor divisão
- Podando a árvore de decisão
3. Compreendendo as redes neurais
- Dos neurônios biológicos aos artificiais
- Funções de ativação
- Topologia de rede
- O número de camadas
- A direção da viagem de informação
- O número de nós em cada camada
- Treinando redes neurais com retropropagação
- Deep Learning
4. Compreendendo as máquinas de vetores de suporte
- Classificação com hiperplanos
- Encontrando a margem máxima
- O caso de dados linearmente separáveis
- O caso de dados não linearmente separáveis
- Usando kernels para espaços não lineares
5. Compreendendo o clustering
- Clustering como uma tarefa de aprendizado de máquina
- O algoritmo k-means para clustering
- Usando distância para atribuir e atualizar clusters
- Escolhendo o número apropriado de clusters
6. Medindo o desempenho para classificação
- Trabalhando com dados de previsão de classificação
- Uma análise mais detalhada das matrizes de confusão
- Usando matrizes de confusão para medir o desempenho
- Além da precisão – outras medidas de desempenho
- A estatística kappa
- Sensibilidade e especificidade
- Precisão e recall
- A medida F
- Visualizando compensações de desempenho
- Curvas ROC
- Estimando o desempenho futuro
- O método de resistência
- Validação cruzada
- Bootstrap amostragem
7. Ajustando modelos de estoque para melhor desempenho
- Usando o cursor para ajuste automatizado de parâmetros
- Criando um modelo simples e ajustado
- Personalizando o processo de ajuste
- Melhorando o desempenho do modelo com meta-aprendizado
- Compreendendo conjuntos
- Ensacamento
- Impulsionando
- Florestas aleatórias
- Treinando florestas aleatórias
- Avaliando o desempenho aleatório da floresta
TÓPICOS MENORES
8. Compreender a classificação usando os vizinhos mais próximos
- O algoritmo kNN
- Cálculo de Distância
- Escolhendo um k apropriado
- Preparando dados para uso com kNN
- Por que o algoritmo kNN é preguiçoso?
9. Compreender as regras de classificação
- Separar e conquistar
- O algoritmo de uma regra
- O algoritmo RIPPER
- Regras das árvores de decisão
10. Compreendendo a regressão
- Regressão linear simples
- Estimativa de mínimos quadrados ordinários
- Correlações
- Regressão linear múltipla
11. Compreendendo árvores de regressão e árvores modelo
- Adicionando regressão às árvores
12. Compreender as regras de associação
- O algoritmo Apriori para aprendizagem de regras de associação
- Medindo o interesse das regras – apoio e confiança
- Construindo um conjunto de regras com o princípio Apriori
Extras
- Spark/PySpark/MLlib e bandidos multi-armados
Declaração de Clientes (5)
Manter a informação curta e simples. Criar intuição e modelos visuais em torno dos conceitos (gráfico de árvore de decisão, equações lineares, cálculo manual de y_pred para provar como o modelo funciona).
Nicolae - DB Global Technology
Curso - Machine Learning
Máquina Traduzida
Ajudou-me a atingir o meu objetivo de compreender o ML. Tenho muito respeito pelo Pablo por ter dado uma introdução adequada a este tópico, uma vez que se torna óbvio após 3 dias de formação o quão vasto é este tópico. Também gostei MUITO da ideia das máquinas virtuais que forneceu, que tinham uma latência muito boa! Permitiu que cada formando fizesse experiências ao seu próprio ritmo.
Silviu - DB Global Technology
Curso - Machine Learning
Máquina Traduzida
The way practical part, seeing the theory materializing into something practical is great.
Lisa Fekade - Vodacom
Curso - Machine Learning
It's just great that all material including the exercises is on the same page and then it gets updated on the fly. The solution is revealed at the end. Cool! Also, I do appreciate that Krzysztof took extra effort to understand our problems and suggested us possible techniques.
Attila Nagy - L M ERICSSON LIMITED
Curso - Machine Learning
I liked the lab exercises.