Skip to content

Nurbek878/bs4_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Парсер сайтов

Описание

Собирает ссылки на статьи о нововведениях в Python, переходит по ним и забирает информацию об авторах и редакторах статей. Собирает информацию о статусах версий Python. Скачивает архив с актуальной документацией. Собирает данные обо всех докментах PEP, подсчитывает количество PEP в каждом статусе и общее количество PEP.

Установка и настройки

  • Шаг первый: клонируем репозиторий
git clone git@github.com:Nurbek878/bs4_parser_pep.git
  • Переходим в папку с проектом
cd bs4_parser_pep
  • Создаем и активируем виртуальное окружение
python -m venv venv 
source venv/bin/activate 
  • Обновляем менеджер пакетов pip
pip install --upgrade pip 
  • Устанавливаем необходимые зависимости
pip install -r requirements.txt
  • Переходим в папку src/
cd src/

Выбираем режим работы парсера:

Выбираем опциональные аргументы :

optional arguments:
  -h, --help            show this help message and exit
  -c, --clear-cache     Очистка кеша
  -o {pretty,file}, --output {pretty,file}
                        Дополнительные способы вывода данных

Например, для того чтобы запустить парсер в режиме PEP с очистко кеша и с выводом в файл, вводим команду:

python main.py pep -c --output file

Стек

Автор