Programa do Curso

I. Introdução e preliminares

1. Panorâmica geral

  • Tornar o R mais amigável, R e GUIs disponíveis
  • Rstudio
  • Software e documentação relacionados
  • R e estatística
  • Utilização interactiva do R
  • Uma sessão introdutória
  • Obter ajuda com funções e caraterísticas
  • Comandos do R, sensibilidade às maiúsculas e minúsculas, etc.
  • Recuperação e correção de comandos anteriores
  • Execução de comandos a partir de um ficheiro ou desvio da saída para um ficheiro
  • Permanência de dados e remoção de objectos
  • Prática de programação Go: Scripts autónomos, boa legibilidade, por exemplo, scripts estruturados, documentação, markdown
  • Instalação de pacotes; CRAN e Bioconductor

2. Ler dados

  • Ficheiros Txt (read.delim)
  • Ficheiros CSV

3. Manipulações simples; números e vectores + matrizes

  • Vectores e atribuição
  • Aritmética de vectores
  • Geração de sequências regulares
  • Vectores lógicos
  • Valores em falta
  • Vectores de caracteres
  • Vectores de índice; seleção e modificação de subconjuntos de um conjunto de dados
    • Matrizes
  • Indexação de matrizes. Subsecções de uma matriz
  • Matrizes de índice
  • A função array() + operações simples em matrizes, por exemplo, multiplicação, transposição
  • Outros tipos de objectos

4. Listas e quadros de dados

  • Listas
  • Construção e modificação de listas
    • Concatenação de listas
  • Estruturas de dados
    • Criar quadros de dados
    • Trabalhar com quadros de dados
    • Anexar listas arbitrárias
    • Gerir o caminho de pesquisa

5. Manipulação de dados

  • Seleção, subconjunto de observações e variáveis
  • Filtragem, agrupamento
  • Recodificação, transformações
  • Agregação, combinação de conjuntos de dados
  • Formação de matrizes particionadas, cbind() e rbind()
  • A função de concatenação, (), com arrays
  • Manipulação de caracteres, pacote stringr
  • breve introdução ao grep e ao regexpr

6. Mais sobre a leitura de dados

  • Ficheiros XLS, XLSX
  • pacotes readr e readxl
  • SPSS, SAS, Stata,... e outros formatos de dados
  • Exportação de dados para txt, csv e outros formatos

6. Agrupamento, loops e execução condicional

  • Expressões agrupadas
  • Instruções de controlo
  • Execução condicional: instruções if
  • Execução repetitiva: loops for, repeat e while
  • introdução a apply, lapply, sapply, tapply

7. Funções

  • Criar funções
  • Argumentos opcionais e valores por defeito
  • Número variável de argumentos
  • Âmbito e suas consequências

8. Gráficos simples em R

  • Criar um gráfico
  • Gráficos de densidade
  • Gráficos de pontos
  • Gráficos de barras
  • Gráficos de linhas
  • Gráficos de pizza
  • Boxplots
  • Gráficos de dispersão
  • Combinação de gráficos

II. Análise estatística em R

1. Distribuições de probabilidade

  • O R como um conjunto de tabelas estatísticas
  • Examinar a distribuição de um conjunto de dados

2. Teste de hipóteses

  • Testes sobre a média de uma população
  • Teste do rácio de verosimilhança
  • Testes com uma e duas amostras
  • Teste do Qui-Quadrado Go de adequação
  • Estatística de uma amostra de Kolmogorov-Smirnov
  • Teste de Wilcoxon de postos sinalizados
  • Teste de duas amostras
  • Teste de soma de postos de Wilcoxon
  • Teste de Mann-Whitney
  • Teste de Kolmogorov-Smirnov

3. Testes múltiplos de hipóteses

  • Erro de tipo I e FDR
  • Curvas ROC e AUC
  • Procedimentos de testes múltiplos (BH, Bonferroni, etc.)

4. Modelos de regressão linear

  • Funções genéricas para extração de informação de modelos
  • Atualização de modelos ajustados
  • Modelos lineares generalizados
    • Famílias
    • A função glm()
  • Classificação
    • Regressão logística
    • Análise discriminante linear
  • Aprendizagem não supervisionada
    • Análise de componentes principais
    • Métodos de agrupamento (k-means, agrupamento hierárquico, k-medoids)

5. Análise de sobrevivência (pacote de sobrevivência)

  • Objectos de sobrevivência no r
  • Estimativa Kaplan-Meier, teste log-rank, regressão paramétrica
  • Bandas de confiança
  • Análise de dados censurados (censurados por intervalo)
  • Modelos PH de Cox, covariáveis constantes
  • Modelos de Cox PH, covariáveis dependentes do tempo
  • Simulação: Comparação de modelos (Comparação de modelos de regressão)

6. Análise de variância

  • ANOVA unidirecional
  • Classificação de ANOVA de duas vias
  • MANOVA

III. Problemas práticos em bioinformática

  • Breve introdução ao pacote limma
  • Fluxo de trabalho de análise de dados de microarray
  • Descarregamento de dados do GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Processamento de dados (controlo de qualidade, normalização, expressão diferencial)
  • Gráfico de vulcão
  • Exemplos de agrupamento + mapas de calor
 28 Horas

Declaração de Clientes (5)

Próximas Formações Provisórias

Categorias Relacionadas