Skip to content

QSquirreld/regression_tasks

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Решение задачи регрессии для предсказания стоимости дома (in progress):

Целью этого проекта является демонстрация решения задачи регрессии для предсказания стоимости домов.

!(Это не конечная версия проекта! Сейчас он содержит все записи в ноутбуке, там уже продемонстрированы основные функции, но следующие шаги в доработке можно прочесть в одноимённом пункте)!

Описание

В работе рассмаотрены различные этапы и методы, применяющиеся в регрессии:

  • Разведывательный анализ данных (EDA);
  • Предобработка данных:
    • Работа с пропущенными значениями;
    • Преобразование категориальных признаков.
  • Работа с моделями:
    • Применение различных моделей и оценка их результатов;
    • Стандартизация данных;
    • Выбор лучшей модели, применяя кросс-валидацию;
    • Отбор признаков по "важности";
    • Отбор и настройка гиперпараметров модели;
    • Интерпретация результатов модели.
  • Предсказывание "исхода" для специального набора данных.

Следующие шаги:

  • Модели:

    • Нормализация данных для методов knn;
    • Работа с моделями градиентного бустинга и xgboost;
    • Проверка других моделей;
  • Написание функций/методов и скриптов для удобного обращения в ноутбуке;

  • Структурирование внутри проекта;

  • Построение пайплайнов;

  • feature engineering;

  • Streamlit;

  • Оформление:

    • Оформление README.md;
    • Оформление ноутбуков;

Структура

Датасет: - House Prices из Kaggle соревнования.

datasets:

notebooks:

scripts:

Требования

  • Код был написан на Python 3.13
  • Зависимости из файла requirements.txt

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published