Содержание
Парсер документов PEP на базе фреймворка Scrapy.
- Для каждого документа PEP получить информацию: номер, название, статус.
- Узнать общее количество документов PEP в каждом статусе.
Формат выходных данных: .csv
Чтобы запустить локальную копию проекта, следуй инструкциям ниже.
-
Клонируй репозиторий
git clone https://github.com/tvules/PEPScrapy.git cd PEPScrapy
-
Установи зависимости проекта
pip install -r requirements.txt
-
Выполни скрипт парсинга
scrapy crawl pep
Собранная информация будет доступна в директории
results/
.