-
Notifications
You must be signed in to change notification settings - Fork 13
Semana 7
Ricardo Alanis edited this page Aug 18, 2016
·
9 revisions
El eje rector de la hacker school es el proceso de Data Science:
En este proceso, Elegiremos a un boss.
- Titanic Dataset (Entry-level): Encontrar un modelo que permita predecir, de acuerdo a las características de un pasajero, si sobrevive o no el accidente del titanic link
- Shelter Animal Outcomes (Intermediate-level): Encontrar un modelo que permita predecir el futuro de un animalito al ser recibido link
- Bimbo Inventory Demand (Advanced-level): Encontrar un modelo para predecir la demanda desde el histórico de ventas link
¡Si, vamos a calificar esta actividad! Vamos a evaluar el uso de las herramientas que vimos durante este curso:
- Preparación de Datos: El alumno demuestra la capacidad de usar las estructuras de datos necesarias para trabajar con un conjunto de datos. El alumno hace las modificaciones a los datos necesarias para trabajar con la base.
- Exploración de Datos: El alumno demuestra la capacidad de explorar las características de un conjunto de datos, usando estadísticos descriptivos y análisis gráfico (Histogramas, Scatter Plots)
- Formulación de Modelos: El alumno demuestra la capacidad de poder explorar modelos adecuados para encontrar la relación entre las variables independientes y la dependiente. El Alumno itera para extraer las features necesarias y realizar la ingeniería necesaria para sacarle la mayor cantidad de información. El alumno prueba sus modelos usando el sistema de Kaggle.
- Visualización de Datos: El alumno demuestra la capacidad de comunicar los resultados de su exploración y de su modelo por medio de las herramientas adecuadas de visualización de datos.
Por supuesto, a quien intente un dataset más avanzado, se le calificará de manera más favorable.
- http://es.slideshare.net/mkajava/how-to-get-started-in-kaggle-competition
- Puedes ver como evaluar tus modelos en https://www.kaggle.com/c/shelter-animal-outcomes/submit-as
- Puedes hacer equipo para hacer tu proyecto.
- Cada reto tiene mucho trabajo de la comunidad en la sección de Kernels, ¡Úsalo!
- No puedes hacer más de 3 preguntas al instructor durante la sesión
- Puedes bajar de dificultad en el momento que quieras, puedes subir de dificultad cuando completes el reto al que entraste.
- Cada hora y media tendremos un standup rápido en el que compartirás que hiciste, que vas a hacer y que te detiene.
- Al final, tendremos una sesión de peer programming para comparar exploración, antes de la presentación
- Definiremos la hora de salida el miércoles en la noche
- Recuerda que independientemente del flujo de datos que tengas, tendrás que demostrar la capacidad de guardar tus datos en una base y hacer queries.