Skip to content

Webscraping dos dados do site Mercado Livre. Esses dados são exportados para uma base de dados BigQuery e algumas informações relevantes são obtidas através de consultas SQL.

Notifications You must be signed in to change notification settings

iamcarolalbuquerque/WebScraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WebScraper

Essa aplicação em Python realiza o webscraping a partir de um link de uma busca de produto no site Mercado Livre. Os dados coletados são armazenados num arquivo .csv para, em seguida, serem carregados em uma base de dados BigQuery (o carregamento destes foi feito via console do Google Cloud). Também são realizadas consultas nesses dados para obter-se informações relevantes sobre a busca realizada.

Pré-requisitos

Considerando que o Python e o pip estão devidamente instalados e em suas versões atualizadas, é necessário instalar as seguintes bibliotecas:

pip install requests

pip install beautifulsoup4

pip install pandas

e para quem vai realizar as consultas via Python:

pip install google-cloud-storage

pip install google-cloud-bigquery

Execução

Para o webscraping, basta executar Application/main.py.

Para as consultas, podem ser feitas de duas formas:

  • executando o arquivo Queries/queries.py ou
  • executando as consultas salvas nos arquivos .sql diretamente no console do BigQuery no Google Cloud.

About

Webscraping dos dados do site Mercado Livre. Esses dados são exportados para uma base de dados BigQuery e algumas informações relevantes são obtidas através de consultas SQL.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages