Skip to content

AbbadonAA/scrapy_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Scrapy PEP Parser

Описание

Учебный проект для практики создания асинхронных парсеров и работы во фреймворке Scrapy.

Парсится список Python Enhancement Proposals (PEP). С каждой страницы PEP парсер собирает номер, название, статус и формирует два файла в формате .csv:

  • Список PEP с указанием статуса;
  • Сводка по статусам.

Ключевые технологии и библиотеки:

Установка

  1. Склонируйте репозиторий:
git clone git@github.com:AbbadonAA/scrapy_parser_pep.git
  1. Активируйте venv и установите зависимости:
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
  1. Проект готов к запуску.

Управление:

Запуск парсера:

scrapy crawl pep

После завершения работы парсера файлы с результатами доступны в директории /results:

  • pep_YYYY-mm-DDTHH-MM-SS.csv
  • status_summary_YYYY-mm-DD_HH-MM-SS.csv

Лицензия

  • MIT License

Автор

Pushkarev Anton

pushkarevantona@gmail.com

Releases

No releases published

Packages

No packages published

Languages