Лаб 1. кластеризация
Набор данных - http://archive.ics.uci.edu/ml/datasets/Chemical+Composition+of+Ceramic+Samples
Проанализовать предметную область и выбрать метрику оценки качества кластеризации
Отобрать признаки
Реализовать алгоритмы k-menas++ и DBSCAN
Проверить качество кластеризации по выбранной метрике
Лаб 2. ассоциативные правила
Набор данных - http://archive.ics.uci.edu/ml/datasets/Online+Retail
Реализовать алгоритмы Apriori и FP-Growth
Оценить время обучения каждого из алгоритмов
Реализовать функцию проверки путем вывода получившихся правил как рекомендаций к текущему содержимому потребительской корзины
Лаб 3. машины опорных векторов
Набор данных - moabb (описание подключения https://gitlab.com/impulse-neiry/posts/-/blob/master/post01_simple_p300/post01ru_simple_p300.ipynb)
Проанализировать набор данных, придумать и обосновать детекцию признаков
Обучить машину опорных векторов определять потенциал P300 (выбор типа машины и функции ядра обосновать)
Посчитать accuracy, precision, recall, F1-меру
Вывести ROC-кривую
Лаб 4. градиентный бустинг
Набор данных - http://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones
Реализовать градиентный бустинг (выбор гиперпараметров обосновать)
Посчитать accuracy, precision, recall, F1-меру
Вывести ROC-кривую
Лаб 5. Random Forest
Дерево в основе Random Forest не бинарное и не сбалансированное!!!
Ограничение на глубину дерева требуется обосновать
Набор данных - https://www.kaggle.com/competitions/career-con-2019/overview
Посчитать accuracy, precision, recall, F1-меру
Вывести ROC-кривую
Лаб 6. MLP
Цель - создать архитектуру многослойного персептрона, классифицирующего грибы (mushroom_dataset).
Описание датасета - https://archive.ics.uci.edu/ml/datasets/Mushroom
2 скрытых слоя, функция активации сигмоида, градиентный спуск без оптимизаторов
Выходных нейрона 1 или 2, по количеству классов (выбор количества нейронов на усмотрение обучающегося)
Обучить нейронную сеть
Посчитать accuracy, precision, recall, F1-меру
Вывести ROC-кривую