Skip to content

Web Scraper used to get real data of supermarket products

License

Notifications You must be signed in to change notification settings

fastPay-pi2/web-scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Web Scraper

O Web Scraper tem a função de coletar produtos para popular nosso banco de dados da API de Produtos. Os dados coletados serão armazenados apenas para fins de demonstração do protótipo com dados reais.

Como executar

Clone o repositório

$ git clone https://github.com/fastPay-pi2/web-scraper

Baixe as dependências

Recomendamos a criação de um virtualenv para baixar as dependências do sistema. Certifique-se de possuir o virtualenv instalado no seu pc.

$ cd web-scraper/
$ virtualenv env -p python3
$ source env/bin/activate
$ pip install -r requirements.txt

Para que o scraper interprete o Javascript dinâmico usado pelas páginas web, foi utilizada uma ferramenta chamada Splash. Mais informações podem ser encontradas em The Scraping Blog. Para executar o splash:

$ docker pull scrapinghub/splash
$ docker run -p 5023:5023 -p 8050:8050 -p 8051:8051 scrapinghub/splash

Inicie o scraper

$ cd fastpay_scraper/
$ scrapy crawl fast_spider -o all_prods.jl

About

Web Scraper used to get real data of supermarket products

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages