Skip to content

Trabalho de Conclusão de Curso da Pós-graduação Lato Sensu em Ciência de Dados e Big Data - PUCMG

License

Notifications You must be signed in to change notification settings

prbpedro/tcc_puc

Repository files navigation

tcc_puc

Contextualização

Este repositório tem como objetivo implementar o trabalho de conclusão de curso da Pós-graduação Lato Sensu em Ciência de Dados e Big Data (PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS) feito por mim, Pedro Ribeiro Baptista.

O mesmo pode ser encontrada no sítio https://github.com/prbpedro/tcc_puc/blob/main/TCC%20Ci%C3%AAncia%20de%20Dados%20PUCMG%20-%20Pedro%20Ribeiro%20Baptista.pdf.

Link da apresentação do trabalho: https://docs.google.com/presentation/d/1mvcSchv_iVVqAWq7_riKRVtEwP4YFqnvh7de9hdofjk/edit?usp=sharing

Objetivo

O trabalho se consiste em um estudo sobre análise preditiva classificatória de notícias falsas.

O repositório contém os seguintes Notebooks Jupyter implementados com a linguagem Python na versão 3.6.9:

  • pre_processing_fake_news.ipynb
  • pre_processing_real_news.ipynb
  • running_machine_learning_models.ipynb

Todos os arquivos, imagens, etc. gerados pelos Notebooks Jupyter citados estão armazenados na pasta generated deste repositório.

pre_processing_fake_news.ipynb

Notebook Jupyter responsável por criar um conjunto de dados de notícias falsas, preparado para a aplicação de algoritmos classificatórios de aprendizado de máquina.

pre_processing_real_news.ipynb

Notebook Jupyter responsável por criar um conjunto de dados de notícias verdadeiras, preparado para a aplicação de algoritmos classificatórios de aprendizado de máquina.

running_machine_learning_models.ipynb

Notebook Jupyter responsável executar o treinamento, teste e impressão de resultados dos modelos classificatórios Logistic Regression, Support Vector Machines e Decision trees.

Execução dos Notebooks Jupyter

Siga os seguintes passos para a execução dos Notebooks Jupyter citados:

  1. Instale o Python na versão 3.6.9
  2. Instale a biblioteca virtualenv -> pip install virtualenv
  3. Crie um novo ambiente de execução virtual Python -> virtualenv venv
  4. Instale as bibliotecas necessárias -> pip install -r requirements.txt
  5. Execute os Notebooks