Skip to content

Latest commit

 

History

History
18 lines (14 loc) · 1.98 KB

README.md

File metadata and controls

18 lines (14 loc) · 1.98 KB

Структура проекта:

  • В папке config - файлы для хранения конфигурации/параметров для выполнения скриптов
  • В папке data - сырые данные, итоговый датасет для модели
  • В папке model - сохраненная текущая модель (сейчас в формате "соленый огурец")
  • В папке scripts - основные ноуты для EDA, ответа на основные вопросы задания + скрипты для запуска предсказания/добучения

Оптимизируемая метрика

MAE -- мы решили не пересчитывать модельный риск в денежный эквивалент, поскольку такую метрику будет сложно впрямую экстраполировать на аномалии и переходные периоды при разладке, где модель не советуется применять, и рекомендуется управление в ручном режиме. Тем не менее, мы не считаем выявленные аномалии при подсчете метрики, и обрабатываем их отдельно.

Пайплайн

  1. Обрабатываем полученные значения ряда за новый день
  2. Выявляем аномалии и разладку
  3. Если выявлена аномалия, выдаем предупреждение с рекомендацией ручного управления
  4. Если выявлена разладка, делаем refit -- отбираем фичи и оцениваем параметры модели на данных без аномалий, начиная с выявленного момента разладки
  5. Делаем предсказание на следующий день.