Semana #1 – Intro a la Ciencia de Datos

La Ciencia de Datos comienza, casi como cualquier ciencia, motivada por un deseo de curiosidad. En este caso preguntas que hacerle a los datos. 

Es posible que los datos no contengan la respuesta, pero el deseo de preguntar junto con el entendimiento de la naturaleza de los mismos nos puede ayudar a obtener respuestas y descubrimientos.

Los tipos de análisis de datos que se pueden hacer podrían clasificarse como

  • Descriptivo
  • Exploratorio
  • Inferencial
  • Predictivo
  • Casual
  • Mecanístico

Algo básico para cualquier persona que comience en este área es entender que hay que evitar caer en los siguientes errores

  1. Correlación no implica causalidad
  2. Sobreajuste: interpretar un análisis exploratorio como predictivo
  3. Análisis descriptivo que no se puede inferir
  4. Interpretar un análisis exploratorio como inferencial

Por otra parte hemos aprendido a preparar nuestro entorno de trabajo con R usando R-Studio y dejar nuestras cuentas de Github listas para empezar a trabajar.

Este primer curso está planificado en cuatro semanas pero la verdad es que ha resultado bastante fácil avanzar ya que queda todo en el ámbito introductorio. A la espera de que me evalúen el primer ejercicio me he apuntado al segundo curso de la especialización: R Programming (seguro que éste sí requiere de más tiempo).

Lecturas recomendas para el comienzo del curso

Curso especializado de Data Science en Coursera

Hoy comienzo el primero de los cursos dentro del Programa Especializado de Data Science que ofrece la Universidad Jhons Hopkins a través de la plataforma de formación Coursera.

Es un programa para principiantes que puede dar buena base sobre los conceptos, disciplinas y tecnologías que se usan cuando se quiere hacer de los datos información.

Considero fundamental entender y dominar las habilidades relacionadas con la manipulación de datos para poder modelar sistemas de información y, posteriormente, diseñar componentes visuales que representen conceptos inteligibles, interpretables e interactivos.

Así que voy a intentar con este programa ordenar todas las ideas con las que en el último año vengo trabajando como parte del equipo de Valo.