Набор инструментов для сбора статей с поддерживаемых новостных сайтов или блогов и манипуляции собранными материалами.
Версия 0.6
- Python не ниже 3.11.
- Модули из requirement.txt.
- Основной код расположен в каталоге artcollector.
- Модуль demo.py демонстрирует использование кода. В том числе и все методы, позволяющие извлечь статью с сайта и получить доступ ко всем её свойствам. -- Файл demo_urls.txt содержит ссылки на поддерживаемые сайты, на которых производилось тестирование инструмента. -- example.txt содержит результат работы демки на примере указанных ссылок.
- в файле requirement.txt находится информация о модулях Python, необходимых для работы с инструментом.
Перед использованием рекомендуется создать виртуальную среду на основе дистрибутива Python 3.11 и установить все модули из requirement.txt.