National Research University Higher School of Economics Educación gratuita en línea

Cómo ganar un concurso de ciencia de datos: aprenda de los mejores Kagglers

Descripción

Si quieres entrar en la ciencia de datos competitiva, ¡este curso es para ti! Participar en concursos de modelado predictivo puede ayudarlo a adquirir experiencia práctica, mejorar y aprovechar sus habilidades de modelado de datos en varios dominios, como crédito, seguros, marketing, procesamiento del lenguaje natural, pronóstico de ventas y visión por computadora, por nombrar algunos. Al mismo tiempo, puede hacerlo en un contexto competitivo contra miles de participantes donde cada uno intenta construir el algoritmo más predictivo. Empujarse al límite puede dar como resultado un mejor rendimiento y errores de predicción más pequeños. Ser capaz de alcanzar altos rangos consistentemente puede ayudarlo a acelerar su carrera en ciencia de datos.

En este curso, aprenderá a analizar y resolver competitivamente tales tareas de modelado predictivo.

Cuando termines esta clase, podrás:

- Comprender cómo resolver concursos de modelado predictivo de manera eficiente y aprender cuáles de las habilidades obtenidas pueden ser aplicables a tareas del mundo real.
- Aprenda a preprocesar los datos y generar nuevas funciones a partir de diversas fuentes, como texto e imágenes.
- Aprenda técnicas avanzadas de ingeniería de características como generar codificaciones de medias, utilizar medidas estadísticas agregadas o encontrar vecinos más cercanos como un medio para mejorar sus predicciones.
- Ser capaz de crear metodologías confiables de validación cruzada que lo ayuden a comparar sus soluciones y evitar el sobreajuste o el desajuste cuando se prueban con datos no observados (de prueba).
- Adquirir experiencia en el análisis e interpretación de datos. Se dará cuenta de las inconsistencias, los altos niveles de ruido, los errores y otros problemas relacionados con los datos, como las fugas, y aprenderá a superarlos.
- Adquirir conocimientos de diferentes algoritmos y aprender a ajustar de manera eficiente sus hiperparámetros y lograr el máximo rendimiento.
- Domina el arte de combinar diferentes modelos de aprendizaje automático y aprende a combinar.
- Conozca soluciones y códigos anteriores (ganadores) y aprenda a leerlos.

Descargo de responsabilidad: este no es un curso de aprendizaje automático en el sentido general. Este curso le enseñará cómo obtener soluciones de alto rango contra miles de competidores con enfoque en el uso práctico de métodos de aprendizaje automático en lugar de los fundamentos teóricos detrás de ellos.

Requisitos previos:
- Python: trabajar con DataFrames en pandas, trazar figuras en matplotlib, importar y entrenar modelos de scikit-learn, XGBoost, LightGBM.
- Machine Learning: comprensión básica de modelos lineales, K-NN, bosque aleatorio, aumento de gradiente y redes neuronales.

¿Tienes problemas técnicos? Escríbanos: coursera@hse.ru

Precio: ¡Inscríbase gratis!

Idioma: Inglés

Subtítulos: Ingles coreano

Cómo ganar un concurso de ciencia de datos: aprenda de los mejores Kagglers - Escuela Superior de Economía de la Universidad Nacional de Investigación