Данный парсер умеет:
- Собирать данные обо всех документах PEP.
- Сравнивать статус на странице PEP со статусом в общем списке и в случае разницы выводить в логи.
- Считать количество PEP в каждом статусе и общее количество PEP.
- Выводить результат в консоль в обычном формате, в виде таблицы или в файл csv.
- Python 3.10.11
- beautifulsoup4 4.12.3
- tqdm 4.66.4
- prettytable 2.1.0
- Cклонировать проект:
git clone git@github.com:JustLight1/parser_docs_pep.git
- Создать виртуальное окружение и активировать:
python -m venv venv
source venv/Scripts/activate - windows
- Установить библиотеки из файла requirements.txt:
pip install -r requirements.txt
- Перейти в директорию src для дальнейшей работы:
cd src/
Парсер может работать в разных режимах с разными аргументами:
usage: main.py [-h] [-c] [-o {pretty,file}]
{whats-new,latest-versions,download,pep}
-
Режимы работы парсера:
positional arguments: whats-new - Парсинг новостей latest-versions - Парсинг версий download - Загрузка архива с документацией в формате pdf pep - Парсинг PEP
-
Дополнительные аргументы:
optional arguments: -h, --help "show this help message and exit" -c, --clear-cache "Очистка кеша" -o {pretty,file}, --output {pretty,file} "Дополнительные способы вывода данных"
Форов Александр