Repositório principal do curso Web Scraping.
Inscreva-se no curso: https://www.curso-r.com/cursos/web-scraping
Acesse o material completo do curso escolhendo uma das turmas abaixo.
Turma | Material | Github |
---|---|---|
setembro de 2023 | https://curso-r.github.io/202309-web-scraping | https://github.com/curso-r/202309-web-scraping |
junho de 2023 | https://curso-r.github.io/202306-web-scraping | https://github.com/curso-r/202306-web-scraping |
- Introdução
- O que é e quando fazer web scraping
- O ciclo do web scraping
- Utilizando o Inspetor do navegador
- Utilizando APIs
- Acessando dados de APIs
- APIs escondidas em sites
- APIs com autenticação
- Baixando dados em HTML ou XML
- Imitando a requisição do inspetor
- O pacote httr
- Requisições GET e POST
- Construindo um parser
- O pacote xml2
- Introdução ao XPath
- Estruturando os dados brutos
- Aprimorando seu algoritmo
- Como iterar algoritmos no R
- Tratamento de erros
- Paralelização
- Raspagem de páginas complexas
- View states
- Páginas dinâmicas com Selenium
- Lidando com Captchas