Skip to content

Latest commit

 

History

History
26 lines (21 loc) · 4.68 KB

README.md

File metadata and controls

26 lines (21 loc) · 4.68 KB

Курс по большим данным весна 2022

N Название Лабораторной Дедлайн мягкий и жесткий (включительно) Комментарий
1 Разворачивание и настройка рабочей среды 17.02 - 24.02 Лаба на настройку окружения
2 Обработка и визуализация данных 03.03 - 10.03 Лаба на знакомство с pandas и matplotlib
3 Титаник 24.03 - 31.03 Классическое соревнование на сайте Kaggle. Призвано познакомить с основными этапами в работе Датасаентиста
4 Нейросети (Еще нет в репозитории) 07.04 - 14.04 Знакомство с нейросетями
5 Проект До конца семестра Большой групповой проект на весь семестр.
* DVC (необязательная) До конца семестра Изучение аналога GIT'а для Датасаентистов. Упростит жизнь в работе над Проектом.

Курс рассчитан на студентов старших курсов, готовых влиться в Data - индустрию. В рамках лабораторных мы будем рассматривать применение современных инструментов в работе с данными. Большинство задач, так или иначе, будут относиться к Науке о данных (Data Science). Мы постараемся приблизиться к промышленной разработки настолько, насколько это возможно. И предоставить вам необходимые вычислительные мощности (Сервер с GPU для нейросетей и терабайтом + памяти).

Но это не точно. Возможно, придется все делать в Colab и т.п.

Дополнение

  • Склонируйте (clone) проект на свой компьютер

  • В лабах могут быть ошибки - открывайте issues на Гитхабе.

  • Готовые для выполнения лабораторные находятся в master. В других ветках преподаватели ведут работу и сливают результат в master.

  • Замечания \ предложения пишите в общий чат в Телеграмме. Будем рады услышать любую критику и адаптировать курс.

  • Приветствуется и поощряется написание научных работ, связанных с Наукой о данных (курсовых и дипломов в частности). У нас много идей (даже, немного, безумных) в совершенно разных направлениях (аналитика, компьютерная графика, звук, текст и т.п.). Подобный проект будет весомой строчкой в вашем резюме и выделит на фоне конкурентов.

По полному прохождению курса и чтения дополнительных материалов ожидается, что студент будет иметь достаточно знаний и навыков для создания своих ML\DS - проектов, успешного прохождения стажировок на позицию Junior ML\DS разработчика.