Skip to content

Semana 7

Ricardo Alanis edited this page Aug 18, 2016 · 9 revisions

Data Science Retreat

El eje rector de la hacker school es el proceso de Data Science:

Data Science Process

En este proceso, Elegiremos a un boss.

  • Titanic Dataset (Entry-level): Encontrar un modelo que permita predecir, de acuerdo a las características de un pasajero, si sobrevive o no el accidente del titanic link
  • Shelter Animal Outcomes (Intermediate-level): Encontrar un modelo que permita predecir el futuro de un animalito al ser recibido link
  • Bimbo Inventory Demand (Advanced-level): Encontrar un modelo para predecir la demanda desde el histórico de ventas link

¿Qué vamos a calificar?

¡Si, vamos a calificar esta actividad! Vamos a evaluar el uso de las herramientas que vimos durante este curso:

  • Preparación de Datos: El alumno demuestra la capacidad de usar las estructuras de datos necesarias para trabajar con un conjunto de datos. El alumno hace las modificaciones a los datos necesarias para trabajar con la base.
  • Exploración de Datos: El alumno demuestra la capacidad de explorar las características de un conjunto de datos, usando estadísticos descriptivos y análisis gráfico (Histogramas, Scatter Plots)
  • Formulación de Modelos: El alumno demuestra la capacidad de poder explorar modelos adecuados para encontrar la relación entre las variables independientes y la dependiente. El Alumno itera para extraer las features necesarias y realizar la ingeniería necesaria para sacarle la mayor cantidad de información. El alumno prueba sus modelos usando el sistema de Kaggle.
  • Visualización de Datos: El alumno demuestra la capacidad de comunicar los resultados de su exploración y de su modelo por medio de las herramientas adecuadas de visualización de datos.

Por supuesto, a quien intente un dataset más avanzado, se le calificará de manera más favorable.

Tips

Reglas del Juego

  • No puedes hacer más de 3 preguntas al instructor durante la sesión
  • Puedes bajar de dificultad en el momento que quieras, puedes subir de dificultad cuando completes el reto al que entraste.
  • Cada hora y media tendremos un standup rápido en el que compartirás que hiciste, que vas a hacer y que te detiene.
  • Al final, tendremos una sesión de peer programming para comparar exploración, antes de la presentación
  • Definiremos la hora de salida el miércoles en la noche
  • Recuerda que independientemente del flujo de datos que tengas, tendrás que demostrar la capacidad de guardar tus datos en una base y hacer queries.
Clone this wiki locally