Skip to content

Модуль 6. Навчання без вчителя.  Кластерізація. KMeans. Principal Component Analysis

License

Notifications You must be signed in to change notification settings

lexxai/goit_python_ds_hw_06

Repository files navigation

Модуль 6. Навчання без вчителя.

З циклу домашніх завдань Python Data Science.

Домашнє завдання

Завдання, що пропонуються, необхідно оформити у вигляді одного jupyter ноутбука.

Завдання 1

У цьому завданні вам потрібно завантажити ось цей датасет. Тут ви знайдете 2 файли - з двовимірним датасетом та датасетом mnist. Для кожного з них застосуйте алгоритм K-means для кластеризації. Щоб знайти оптимальну кількість кластерів, скористайтесь ліктевим методом.

Завдання 2

Візуалізуйте результат роботи кластеризації. Для випадку з mnist датасетом, вам потрібно ще скористатись алгоримтом PCA щоб зменшити розмірність вашим даних до 2-вимірного варіанту.

Результат

Завдання 1

Резульат розбитя на кластери зорбражень з бази MNIST

784 ознак, k=19

PCA (0.95), 114 ознак, k=13

Завдання 2