В рамках данного проекта целью работы является разработать модель для предсказания успешности стартапа (закроется или нет).
Для этого был предоставлен датасет состоит из двух файлов: тренировочный набор (около 53к записей) и тестовый набор (около 13к записей). Тренировочный набор содержит целевой признак status, указывающий на то, закрылся стартап или продолжает действовать. Временной период - '1970-01-01' по '2018-01-01'. Дата формирования выгрузки - '2018-01-01'.
Датасет содержит следующие признаки:
name- Название стартапаcategory_list- Список категорий, к которым относится стартапfunding_total_usd- Общая сумма финансирования в USDstatus- Статус стартапа (закрыт или действующий)country_code- Код страныstate_code- Код штатаregion- Регионcity- Городfunding_rounds- Количество раундов финансированияfounded_at- Дата основанияfirst_funding_at- Дата первого раунда финансированияlast_funding_at- Дата последнего раунда финансированияclosed_at- Дата закрытия стартапа (если применимо)lifetime- Время существования стартапа в днях