Programa

- Introdução do curso;

- Objetivos da análise de dados (descrição, exploração, inferência, regressão, previsão, interpretação e classificação);

- O ambiente R project e R Studio (instalação, pacotes e noções básicas de programação);

- Análise exploratória de dados (estatística descritiva, visualização de dados, boxplot);

- Teoria das probabilidades (probabilidade, eventos independentes e mutuamente exclusivos, probabilidade condicionada, teorema de Bayes, variável aleatória, distribuições de probabilidade Bernoulli, Binomial, Normal);

- Inferência estatística (inferência indutiva, estimadores, intervalo de confiança, teste de hipóteses, teste de igualdades de médias, ANOVA,  teste qui-quadrado, testes de aderência);

Técnicas de regressão:

 - Modelos de regressão linear simples e múltipla, variáveis dummy;

 - Redes neurais artificiais supervisionadas (rede feedforward);

Técnicas de classificação supervisionada:

 - Modelos de escolha binária (regressão logística, inferência do modelo, curva ROC);

 - Redes neurais artificiais supervisionadas (rede feedforward);

Técnicas de interdependência:

 - Análise de componentes principais;

 - Análise fatorial (análise fatorial exploratória);

 - Análise fatorial de correspondência (simples e múltipla);

Técnicas de classificação não supervisionada (clustering):

 - Análise de agrupamentos (k Means e Ward);

 - Redes neurais artificiais não supervisionadas (SOM = "self organizing maps");

Apresentação final do caso prático.