Skip to content

learning-crawlers/Raspagem-de-dados-para-iniciantes

 
 

Repository files navigation

Raspagem de dados para iniciantes 📄

Esse repositório foi construido para ajudar qualquer interessado pela área de Raspagem de dados, todo o repositório será em PT-BR, mas os links/documentação podem estar em inglês (compartilhe se você possuir algo traduzido).

Instalação 💾

Uso Python versão 3.7

As principais libs que vamos usar aqui são:

  • requests
  • bs4 (BeautifulSoup)
  • Scrapy

Para isso você só precisa instalar algumas bibliotecas, no seu Terminal escreva:

pip install requests bs4 scrapy

Jupyter notebooks

Iremos usar Jupyter notebooks aqui, então se você não tem com a ferramenta, visite a documentação.

Trilha para o tutorial: 🎓

  1. Aprendendo a extrair o texto de um Site
  2. Primeira Spider
  3. Raspagem múltipla
  4. Navegando entre paginas
  5. Coletando mais detalhes
  6. Raspagem em site com Infinite Scroll
  7. Rodando Spider na nuvem

Materiais de estudo:

Blogs: 💻

Livros: 📚

Documentação: 📜

Podcasts: 🎧 🎵

Vídeos: 📺

About

Raspagem de dados para iniciante usando Scrapy e outras libs básicas

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 63.8%
  • Jupyter Notebook 36.2%