Educación en línea gratis

Ciencia de datos: disputas

Descripción

En este curso, parte de nuestro Programa de Certificado Profesional en Ciencia de Datos, cubrimos varios pasos estándar del proceso de disputa de datos, como importar datos a R, ordenar datos, procesar cadenas, analizar HTML, trabajar con fechas y horas, y extraer texto. En raras ocasiones, todos estos pasos de discusión son necesarios en un solo análisis, pero un científico de datos probablemente los enfrentará a todos en algún momento. Muy rara vez se puede acceder fácilmente a los datos en un proyecto de ciencia de datos. Es más probable que los datos estén en un archivo, una base de datos o se extraigan de documentos como páginas web, tweets o PDF. En estos casos, el primer paso es importar los datos a R y ordenarlos usando el paquete tidyverse. Los pasos que convierten los datos de su forma sin procesar a la forma ordenada se denominan disputa de datos. Este proceso es un paso crítico para cualquier científico de datos. Saber cómo disputar y limpiar los datos le permitirá obtener información crítica que de otro modo estaría oculta.

Precio: GRATIS para auditar!

Data Science: Wrangling through edX, una plataforma para la educación fundada por Harvard y MIT.

Ciencia de datos: disputas