G1 News Scraping

Este é um projeto simples de web scraping desenvolvido em Python para extrair as últimas notícias do site G1 (globo.com). Ele utiliza as bibliotecas requests e BeautifulSoup para coletar informações das páginas web.

Objetivo

O objetivo principal deste projeto é fornecer uma ferramenta de scraping para coletar notícias do G1 de maneira automatizada. Esse código pode ser usado como base para projetos mais avançados ou para entender os conceitos básicos de scraping.

Como Usar

Para utilizar este projeto, siga os passos abaixo:

Crie e acesse um ambiente virtual

python -m venv .venv
source .venv/bin/activate

Instalação das Dependências:

Certifique-se de ter o Python instalado em seu ambiente. Este projeto foi desenvolvido usando Python 3.x.

Utilize o comando abaixo para instalar as dependências necessárias:

pip3 install -r requirements.txt

Execução do Scraping:

Após a instalação das dependências, você pode executar o arquivo scrapper.py para iniciar o scraping das notícias.

python3 G1-News/scraper.py

Resultado:

O código irá coletar as últimas notícias do G1, exibindo os títulos das notícias obtidas no console.

Estrutura de Pasta

A estrutura de pastas do projeto está organizada da seguinte maneira:

G1_News_Scraper/
│
├── src/
│ ├── main.py # Arquivo principal onde você inicia o web scraping
│ └── scraper.py # Arquivo onde a função de scraping (get_news) está definida
│
├── requirements.txt # Arquivo que lista todas as dependências do projeto
└── README.md # Este arquivo, contendo informações sobre o projeto e instruções de uso

src/: Pasta que contém o código fonte do projeto.
requirements.txt: Lista todas as dependências do projeto para facilitar a instalação.
README.md: Documentação explicando o projeto, instruções de uso e informações gerais.

Avisos Importantes

Uso Responsável: Este projeto foi desenvolvido para fins educacionais e de aprendizado. Sempre respeite os termos de serviço dos sites ao realizar web scraping.
Limitações e Restrições: O scraping de sites pode ser contra os termos de serviço de alguns sites. Verifique as políticas de uso e os limites de solicitação do site alvo antes de executar o código.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
G1-News		G1-News
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

G1 News Scraping

Objetivo

Como Usar

Crie e acesse um ambiente virtual

Instalação das Dependências:

Execução do Scraping:

Resultado:

Estrutura de Pasta

Avisos Importantes

About

Releases

Packages

Contributors 3

Languages

leviobrabo/G1-news-scraping

Folders and files

Latest commit

History

Repository files navigation

G1 News Scraping

Objetivo

Como Usar

Crie e acesse um ambiente virtual

Instalação das Dependências:

Execução do Scraping:

Resultado:

Estrutura de Pasta

Avisos Importantes

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages