Построен на базе фреймворка Scrapy и предназначен для парсинга информации о PEP с официального сайта Python. Парсит следующую информацию о PEP:
- номер
- название
- текущий статус
Результаты парсинга сохраняются в несколько мест:
- детальная информация о PEP выгружается в базу SQlite и в results/pep_<дата/время>.csv
- в results/status_summary_<дата/время>.csv выводится стаистика по статусам PEP
- Установите и активируйте виртуальное окружение
- Установите зависимости из файла requirements.txt
pip install -r requirements.txt
scrapy crawl pep