Este é o relatório final que entreguei como trabalho de conclusão do curso "R para Ciência de Dados II", oferecido pela Curso-R. Utilizando as bases de dados do site IMDB, contendo informações a respeito de diversos filmes, respondi a cinco perguntas propostas. Em minhas resoluções, tentei empregar os conteúdos de programação em R aprendidos durante o curso, como, por exemplo, os pacotes lubridate, forcats, purrr e os princípios de regex.
Além disto, a própria organização deste projeto seguiu as orientações dadas no início do curso. Posto isto, na próxima seção, descreverei o conteúdo das pastas, aqui, disponíveis, caso, no futuro, precise consultá-las.
Na pasta data_raw, estão disponíveis as bases de dados originais utilizadas neste projeto, em formato ".csv", enquanto, na pasta data, estão as bases de dados modificadas ao longo de seu desenvolvimento, em formato ".rds". Como alguns dos arquivos eram maiores do que o github suportava, foi necessário utilizar a ferramenta "git large files". Caso necessário, consulte os links abaixo:
Configurando armazenamento de git large file
Erro "refusing to merge unrelated histories no git"
Esta pasta contem o script correspondente às soluções das perguntas propostas. Como algumas delas foram formatadas para a elaboração do relatório em RMarkdown, tal script serviu como uma espécie de rascunho.
Nesta pasta, estão os arquivos correspondentes à versão final do relatório, nos formatos ".rmd" (RMardown) e "html".
Por enquanto, esta pasta ainda não foi utilizada, porém deverá conter todos os arquivos que não se encaixarem nas demais pastas.