Cursos‎ > ‎

Mineração Massiva de Dados 2018.2

Objetivos do Curso

O objetivo do curso é apresentar técnicas de Mineração de Dados para uma quantidade muito grande de informações, virtualmente infinita. O curso visa apresentar uma introdução às técnicas mais conhecidas de mineração de dados e aplica-las em uma infraestrutura de computação de alto desempenho. O curso foi desenhado para receber alunos de várias áreas do conhecimento que necessitem realizar análise de grandes volumes de dados com ferramenta para suas pesquisas. Sendo uma disciplina aplicada, ela tem uma composição de 50% de aula teórica e 50% de aula prática. 

Como trabalho final da disciplina deverá ser escrito um texto, em formato de artigo, com uma experiência de mineração de dados na área de interesse do aluno. No curso é estimulado a interação entre alunos de cursos diferentes com alunos da computação para despertar novos temas de pesquisa para todas as áreas.

Conteúdo programático

  1. Introdução à Mineração de Dados
  2. Aprendizagem de Máquina
  3. Algoritmos de classificação, clusterização e de tomada de decisão.
  4. Introdução a redes neurais.
  5. Aplicações prática em sistema distribuído.

Material do curso

Livro Texto

O livro texto do curso pode ser baixado em Mining of Massive Datasets

Slides do curso

Slides do curso Mineração Massiva de Dados 

Leitura Complementar

 Este curso é baseado no curso Mining of Massive Datasets dos professores Jure Leskovec, Anand Rajaraman e Jeff Ullman  da Universidade de Stanford. Os slides originais do curso, o material didático e videoaulas podem ser acessadas em MMDS.

Recursos computacionais

ATENÇÃO: Os recursos computacionais estão disponíveis para acesso apenas das redes  de dentro da UECE ou através de uma VPN.
 
O link para acessar o sistema Jupyter Notebook é: Jupyter LASID

A página com a relação dos Datasets disponíeis para uso estão em: Datasets

Para configurar o acesso externo ao servidor do LASID veja Configuração de acesso VPN do LASID.

Os notebooks usados nas aulas práticas estão em Mineração Massiva de Dados 

Guia de programação

Exemplos de código Python para desenhar gráficos: The Python Graph Gallery

Trabalho Final

Como trabalho final cada aluno deverá apresentar uma proposta e implementação de sistema de mineração de dados a sua escolha.

Deverá ser preparado um documento em formato "artigo" com os seguintes tópicos:

  1. Título
  2. Resumo/Abstract
  3. Introdução/Motivação
  4. Trabalhos Relacionados
  5. Fundamentação Teórica
  6. Apresentação da Proposta
  7. Sugestão de implementação e validação
  8. Conclusão
  9. Bibliografia

Calendário de apresentações do Trabalho Final

xx/xx:
Fulano: Título do trabalho

Avaliação

A avaliação do curso se dará pela média da nota atribuída à apresentação dos seminários e do trabalho final.

Caso o aluno não consiga aprovação com essas duas notas, poderá fazer uma Prova Final (dissertativa) versando sobre um tema sugerido pelo professor que foi discutido durante o curso.

Calendário

Início do curso: 03/08/2018
Datas de apresentação do Trabalho Final: vide programação acima
Data de entrega do texto escrito do Trabalho Final: xx/xx/20xx
Fim do curso: 05/12/2018
Comments