La ciencia de datos es una ciencia que surge con el proceso de digitalización de las organizaciones.

La física es la ciencia que emerge al observar por la ventana, ya sea al cielo (astronomía), al movimiento (mecánica), al suelo (geofísica), y al resto del universo y los objetos y fenómenos que en él habitan. La física intenta describir los fenómenos que ve, armando modelos que comprendan ese comportamiento.

De la misma manera, la ciencia de datos mira los datos (todavía no información) de los sistemas –de instrumentos de medición, de redes sociales, de organizaciones – e intenta darles sentido, utilizando y creando métodos y algoritmos que:

  • permitan visualizarlos
  • analicen su estructura, por ejemplo, dando métricas que los describan
  • entiendan su distribución y puedan generar datos similares, o predecir nuevos valores

Con esa misión, buscamos tanto analizar y entender datos como desarrollar los métodos, algoritmos y estructuras de datos que permitan dar ese soporte.

¿Qué pueden ser los datos? Una serie de amistades en Facebook, unos cuadros de Rembrandt, un manuscrito indescifrable, o las obras de Shakespeare

Por su naturaleza, es un campo interdisciplinario, integrando:

  • estadística
  • inteligencia artificial (machine learning)
  • ciencias de la computación
  • visualización

más, desde luego, el dominio en el que se aplica. Incluso cuando se realiza de la forma más pura, es decir, desarrollando nuevos métodos o ajustando otros ya existentes, se debe probar sobre algún data set. Entonces, es una disciplina que para realizarse requiere un objeto dónde aplicarse.

De esto surge una característica fundamental del laboratorio: intentar lograr relaciones con otros laboratorios, facultades y organizaciones.