1 |
Исследование надёжности заёмщиков |
Финансы |
Предобработка и анализ данных; лемматизация; исследовательский анализ данных |
Python pymystem3 Pandas NumPy |
2 |
Исследование объявлений о продаже квартир |
Недвижимость |
Предобработка данных; поиск корреляций |
Pandas Matplotlib NumPy |
3 |
Определение перспективного тарифа для телеком компании |
Телеком |
Объединение данных из пяти таблиц в одну; изучение аномалий в данных; исследовательский анализ данных; статистический анализ данных |
Pandas Matplotlib display math NumPy SciPy Statsmodels |
4 |
Исследование рынка видеоигр |
Интернет-магазин |
Предобработка данных; анализ данных; составление портрета пользователей каждого региона; проверка гипотез; выявление параметров, определяющих успешность видеоигр в разных регионах мира; подготовка отчета в целях планирования рекламных кампаний для магазина компьютерных игр |
Matplotlib Pandas Python NumPy SciPy downcast warnings |
5 |
Обзор данных авиакомпании |
Авиация |
Предобработка данных; исследовательский анализ данных |
Pandas Matplotlib NumPy re |
6 |
Оценка источников трафика |
Интернет-сервис |
Расчет экономических показателей (метрики юнит-экономики); оценка окупаемости инвестиций в маркетинг; поиск "узкого места" в экономической модели; когортный анализ |
Pandas Matplotlib NumPy Seaborn |
7 |
Приоритизация гипотез и оценка результатов А/В-теста |
Интернет-магазин |
Приоритизация гипотез по фреймворкам ICE и RICE; оценка результатов A/B-тестирования; построение графиков: кумулятивная выручка, средний чек, конверсия по группам; расчет статистической значимости различий конверсий и средних чеков по сырым и очищенным данным |
Matplotlib Pandas Python Seaborn NumPy SciPy math |
8 |
Рынок заведений общественного питания Москвы |
Общепит |
Предобработка данных; запрос по API к Яндекс.Геокодеру; исследовательский анализ данных; подготовка презентации |
Pandas Seaborn Matplotlib Numpy re Requests io Яндекс.Геокодер API |
9 |
Событийная аналитика мобильного приложения |
Мобильное приложение |
Описание воронки событий (от первого запуска до покупки); поиск разницы между клиентской и пользовательской сессиями; когортный анализ; сравнение конверсий в группах по принципу A/B-теста |
Pandas Seaborn Matplotlib plotly math NumPy SciPy warnings |
10 |
Создание дашборда |
Интернет-сервис |
Создание пайплайна для получения данных из БД; проведение анализа взаимодействия пользователей сервиса с карточками; создание дашборда в Tableau Public; подготовка презентации |
Pandas SQLAlchemy Tableau |
11 |
Прогнозирование вероятности оттока посетителей фитнес-центра |
Ритейл |
Исследовательский анализ данных, прогнозирование с использованием моделей машинного обучения, кластеризация |
Pandas Seaborn Matplotlib Numpy sklearn SciPy |
12.1 |
Выпускной проект, часть 1. Формирование модели монетизации |
Мобильное приложение |
Анализ продуктовых и маркетинговых метрик, проверка гипотез, прогнозирование с использованием моделей машинного обучения, кластеризация, предложение модели монетизации и расчет прогнозных LTV и ROMI |
Pandas Seaborn Matplotlib Numpy sklearn SciPy |
12.2 |
Выпускной проект, часть 2. A/B-тестирование |
Интернет-магазин |
Исследовательский анализ данных, A/B-тестирование |
Pandas Seaborn Matplotlib Plotly SciPy SciPy math |
12.3 |
Выпускной проект, часть 3. SQL |
Мобильное приложение |
SQL-запросы к базе данных |
Pandas SQLAlchemy |