Este repositório armazena scripts em python utilizados para:
- Classificar mensagens de desenvolvedores de software (como dos grupos Boost e OpenJDK) com relação à sua relevância ao tema de Rejuvenescimento de Código Fonte.
- Prover conveniências lidando com os índices (equivalentes às chaves primárias no banco de dados) dos emails classificados.
O código do classificador se encontra disponível no portal colab com explicações mais a fundo sobre os arquivos de entrada. É possível executá-lo diretamente no colab, mas para datasets de classificação grandes recomenda-se utilizar o módulo classifier.py e executá-lo localmente.
Python utilizado no desenvolvimento desses scripts: Versão 3.8.10