Este repositório armazena os dados, códigos e outras informações sobre o SigefScraper, nome que eu coloquei no meu trabalho final para a disciplina de Pensamento Computacional do master em Jornalismo de Dados, Automação e Data Storytelling do Insper. A documentação também é projeto da disciplina de Transparência, Reprodutibilidade e Uso Ético dos Dados.
Criar um programa que executa um processo de ETL - Extract, Transform, Load. Essas 3 etapas são a base para programas que lidam com dados e são encontradas em diversos tipos de programas. O SigefScraper é um programa que, a partir dos atributos de arquivos shapefiles do Sistema de Gestão Fundiária (Sigef) do Instituto Nacional de Colonização e Reforma Agrária (Incra), extrai do sistema o nome e o documento dos detentores das parcelas presentes no arquivo.
Os arquivos utilizados estão dividos em duas pastas: dados (com os dados e seu dicionário) e códigos (contém notebooks e exemplo de uso/output).
Pode me contatar por e-mail ou twitter :)
Quer contribuir diretamente aqui no GitHub?
- Faça o fork do projeto, crie uma branch (ramificação) para a sua modificação, faça o comitt e submeta um pull request!
- Você também pode abrir uma issue com a sua sugestão ou comentário.
- Adicionar o nome e o documento no dataframe
- Baixar o memorial descritivo da parcela