Esse repositório guarda uma série de scripts básicos para o auxílio à pesquisa em Sociologia Digital. O objetivo dessa iniciativa é facilitar o acesso às técnicas computacionais a pesquisadores não familiarizados com essas técnicas, a iniciantes, assim como a usuários avançados que queiram construir técnicas mais complexas em cima das mais básicas aqui disponíveis. O foco do sdbase
é o auxílio computacional à pesquisa qualitativa, mineração de texto para as humanidades e áreas relacionadas.
O rdqda
é um módulo e script pythônico para a formatação e exportação de dados da rede social Reddit próprio para a análise qualitativa e a codificação. O formato de saída dos dados privilegia, portanto, a fidelidade à forma como os dados são exibidos na rede social, aproximando a prática da codificação à experiência da plataforma no browser. Recomendamos ao usuário que clone o repositório para usá-lo, tal como explicado abaixo, na seção de instalação. Para usuários mais avançados, basta adicionar o módulo ao PYTHONPATH
e importá-lo em seu código.
Por enquanto, o módulo e script do WhatsApp oferece apenas a conversão para csv
de dados de conversas em txt
exportados diretamente pelo aplicativo. Veja abaixo instruções para o modo de uso.
- Python 3.8
- pandas (biblioteca para manipulação de dados via DataFrames)
- PRAW (biblioteca que facilita o acesso à API do Reddit)
O arquivo requirements.txt
contém todas essas informações, o que permite uma instalação fácil, como indicado na seção abaixo.
Basta clonar o repositório, criar um ambiente virtual, instalar as bibliotecas indicadas acima com o pip
e rodar os scripts com o Python, como no exemplo abaixo:
cd diretorio-de-instalacao
git clone https://github.com/vmussa/sdbase.git
cd sdbase
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
Para o usar módulo do Reddit:
python reddit\submissions_para_txt.py
Para o usar módulo do WhatsApp:
python whatsapp\conversas_para_csv.py
Esse repositório está sendo desenvolvido no contexto de uma pesquisa de mestrado financiada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) realizada no Programa de Pós-Graduação em Sociologia e Antropologia (PPGSA) da Universidade Federal do Rio de Janeiro (UFRJ). O desenvolvimento desse pacote deve muito ao apoio dessas instituições.