Есть дамп сообщений из канала open data science (блог про data science) из Слака. Описание: Веб-приложение, позволяющее осуществлять поиск по этому блогу
Постановка задачи:
- Распарсить данные, предобработать их
- Построить поисковый индекс и сжать его для эффективного хранения информации
- Разработать веб-приложение, к которому пользователи могут слать поисковые вопросы/запросы, а на выходе получать топ N релевантных ответов
- Предусмотреть исправление опечаток в пользовательском запросе
Команда | Описание |
---|---|
style | Проверка на flake8 и pydocstyle |
load | Загрузка моделей |
load_data | Загрузка обработанных данных |
build | Сборка индекса |
test | Запуск всех тестов |
local | Локализация |
doc | Сборка документации |
run | Запуск проекта |
wheel | Запуск колеса |
clean | Чистка |
После
make build
формируется колесо, которое можно установить через
pip install
После установки приложение запускается командной:
python -m src.app.run