Programa

Modulo 1:
Estado da arte em NLP
Aplicações na indústria
Características
Ferramentas para análise de Dados
Bibliotecas e infraestrutura Nuvem
Jupyter Notebook
Introdução à NLP
Text Mining
Tokenização
Stopwords
Lemetização e Steming
Análise de frequência WordCloud
Representações
Bibliotecas: instalação e utilização
Limpeza e preparação dados
Exercícios Tutorados

Modulo 2:
Modelos de Representação
Bag of words
TF-IDF
Similaridade do cosseno
Aplicações de similaridade
Recomendação de produtos
Similaridade de textos jurídicos
Exercícios Tutorados

Modulo 3:
Modelos de Representação de
Contexto Embeddings
Word2vector
Glove
Doc2Vector
Aplicações com Embeddings e
supervisionados
Modelos de contexto
Aplicações na indústria
Modelos dimensionais

Modulo 4:
Análise Não supervisionada de
dados
Analise de tópicos LDA
T-SNE clusterização por
vizinhança
Geração de gráficos de
interpretação
PCA
Aplicações Hands-On

Modulo 5:
Deep Learning
Modelos de aprendizado
profundo LSTM
Modelos pré-trinados
Geração de texto
Persistência de Dados