Este repositório tem como objetivo implementar o trabalho de conclusão de curso da Pós-graduação Lato Sensu em Ciência de Dados e Big Data (PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS) feito por mim, Pedro Ribeiro Baptista.
O mesmo pode ser encontrada no sítio https://github.com/prbpedro/tcc_puc/blob/main/TCC%20Ci%C3%AAncia%20de%20Dados%20PUCMG%20-%20Pedro%20Ribeiro%20Baptista.pdf.
Link da apresentação do trabalho: https://docs.google.com/presentation/d/1mvcSchv_iVVqAWq7_riKRVtEwP4YFqnvh7de9hdofjk/edit?usp=sharing
O trabalho se consiste em um estudo sobre análise preditiva classificatória de notícias falsas.
O repositório contém os seguintes Notebooks Jupyter implementados com a linguagem Python na versão 3.6.9:
- pre_processing_fake_news.ipynb
- pre_processing_real_news.ipynb
- running_machine_learning_models.ipynb
Todos os arquivos, imagens, etc. gerados pelos Notebooks Jupyter citados estão armazenados na pasta generated deste repositório.
Notebook Jupyter responsável por criar um conjunto de dados de notícias falsas, preparado para a aplicação de algoritmos classificatórios de aprendizado de máquina.
Notebook Jupyter responsável por criar um conjunto de dados de notícias verdadeiras, preparado para a aplicação de algoritmos classificatórios de aprendizado de máquina.
Notebook Jupyter responsável executar o treinamento, teste e impressão de resultados dos modelos classificatórios Logistic Regression, Support Vector Machines e Decision trees.
Siga os seguintes passos para a execução dos Notebooks Jupyter citados:
- Instale o Python na versão 3.6.9
- Instale a biblioteca virtualenv -> pip install virtualenv
- Crie um novo ambiente de execução virtual Python -> virtualenv venv
- Instale as bibliotecas necessárias -> pip install -r requirements.txt
- Execute os Notebooks