Los datos están en todas partes. De hecho, en los últimos tiempos están creciendo a un ritmo vertiginoso. Duplicándose cada año, transformándolo todo a su paso y dando lugar a términos como big data vs data science.
Un artículo de Forbes afirma que los datos no dejarán de multiplicarse y que para el próximo año se generarán en torno a 1,7 megabytes de datos por segundo.
Una realidad que desemboca en la necesidad de contar con profesionales que se encarguen de transformar la gran cantidad de información en valor corporativo. En definitiva, en datos que favorezcan la toma de decisiones dentro de las empresas.
Big data y data science emergieron para transformar y dotar de sentido al panorama digital y tecnológico actual. Ambos términos están estrechamente relacionados entre sí, pero, ¿qué son, para qué sirven y en qué se diferencian?
Big data es un término en desarrollo que describe un gran volumen de datos. Datos estructurados, semiestructurados y no estructurados cuyo potencial se fundamenta en el papel que desarrollan en proyectos de aprendizaje automático o de análisis avanzado.
Estos datos masivos a menudo se caracterizan por las 3V:
Elementos que fueron identificados por uno de los analistas de la consultora Gartner, concretamente, Doug Laney. Esta información se publicó por primera vez en el año 2001.
Sin embargo, otras V se han ido agregando a medida que el término ha ido evolucionando. Sirva como ejemplo, la veracidad, el valor y la variabilidad.
El procesamiento de grandes datos no se puede lograr fácilmente empleando métodos de análisis tradicionales.
Por lo tanto, se requieren técnicas, herramientas y sistemas de modelado de datos especializados para extraer información que sea valiosa para las organizaciones. Para conseguirlo surgió data science.
Data science es un estudio detallado del flujo de información a partir de cantidades ingentes de datos presentes en el repositorio de una organización.
Se trata de obtener información significativa a partir de datos sin procesar y no estructurados que se analizan a través de habilidades analíticas, de programación y de negocios.
Para ello hace falta reunir muchas de las habilidades que impulsan a las compañías. Perfiles muy concretos que ayuden a:
Por lo tanto, independientemente de la verticalidad de la industria, es probable que esta ciencia de datos juegue un papel clave en el éxito futuro de cualquier organización.
A continuación, se presentan algunas de las principales diferencias ambos conceptos:
De las diferencias anteriores se puede observar que el concepto data science se engloba dentro del concepto de big data. En este sentido, la ciencia de datos juega un papel importante en muchas áreas de aplicación.
En resumidas cuentas, data science se desenvuelve dentro del ámbito del big data para obtener información útil a través del análisis predictivo, donde los resultados se utilizan para tomar decisiones inteligentes. De esta forma, sin big data no existiría el concepto de data science. Y sin el segundo, el primero no tendría (u obtendría) tanto valor.
En consecuencia, es fácil entender que el perfil de científico de datos sea uno de los más demandados actualmente en el mercado, tal y como concluye el informe EPYCE 2017: posiciones y competencias más demandadas, que realiza anualmente la EAE Business School.