Empresa

Profesiones con mucho futuro: el científico de datos

El llamado científico de datos o data scientist suele estar entre los puestos tecnológicos más buscados por las empresas, y también entre los mejor pagados. Sacar partido a la creciente cantidad de información en internet y en las empresas convierte a estos profesionales en protagonistas.

La necesidad de ordenar y sobre todo monetizar la información es imperiosa. Se suele insistir en que el dato es el petróleo del siglo XXI. Sin embargo, según Dell Technologies, en estos momentos se está analizando menos del 0,5% de los datos mundiales. La ola de digitalización que recorre todo el tejido empresarial, y que ha estado favorecida por la COVID-19, ha puesto definitivamente a los científicos de datos en el punto de mira de las compañías, sobre todo de las medianas y grandes corporaciones. 

Big Data: cómo se pasa de cantidades ingentes de datos a información valiosa que ayude en la toma de decisiones

Pero ¿qué es un científico de datos? En esencia, es el responsable de recolectar, analizar e interpretar la ingente cantidad de información (nueva y heredada) en una organización. Estos profesionales aplican sus conocimientos en programación, matemáticas y estadística a enormes bases de datos, muchas veces desestructurados, es decir, irreconocibles para las herramientas informáticas clásicas de las compañías. Hablamos, por ejemplo, del contenido de un correo electrónico, de un PDF, de una hoja de cálculo o de un archivo de vídeo. Datos difíciles de ordenar, pero que pueden dar pistas sobre cuáles serán los productos y servicios más demandados por los consumidores.   

Hay que distinguir al científico de datos del analista de datos o data analyst. Es cierto que ambos perfiles tienen aspectos en común, pero hay diferencias importantes. El analista también recolecta datos y hace análisis estadísticos, pero suele usar herramientas estándar. Su objetivo también es mejorar procesos, productos y servicios de la compañía. Sin embargo, el científico de datos va más allá y recurre a herramientas avanzadas de análisis y se espera de él que genere algoritmos para solucionar problemas específicos o dar respuestas a preguntas nuevas por parte de los gestores empresariales. 

La formación de un científico de datos

No está clara la formación que necesita un científico de datos porque es solo ahora cuando empiezan a aparecer en algunas universidades grados de titulación en esta materia. Josh Wills, estadístico que trabajó al máximo nivel para Slack, ve la profesión de este modo: el científico de datos es alguien “que es mejor en estadística que cualquier programador, y mejor programador que cualquier estadístico”.

Pero sí se puede decir que el data scientist deberá compaginar conocimientos matemáticos, estadísticos y de programación. Y añadirle unas buenas dosis de curiosidad intelectual y capacidad de comunicación. Y, por supuesto, deberá conocer bien el negocio de la empresa que le contrata. De otra manera, nunca podrá sacar todo el partido a los datos que tiene entre manos. 

Además, un buen científico de la información corporativa deberá conocer los aspectos legales relacionados con los datos y con su protección. Conviene tener en cuenta que ni la mejor tecnología ni los algoritmos más avanzados servirán de nada si no se comprenden los datos que van a ser analizados. Por eso, en este sentido, un buen científico de datos deberá mostrar cierta audacia. 

Como la que tenía aquel peculiar experto en datos interpretado por Christian Bale en la película ‘La gran apuesta’ (‘The big short’), que un buen día se dedicó a mirar en detalle y a cotejar el comportamiento de las hipotecas en los años previos a la crisis inmobiliaria en Estados Unidos. Y que, cómo no, llegó a la conclusión de que era cuestión de tiempo que el sistema colapsara. 

Una parte fundamental en la formación de un científico de datos es la programación. Lenguajes para escribir código hay muchos, y además están cambiando y evolucionando constantemente. Según un estudio de 2018, el más popular y el que más aceptación tiene entre los científicos de datos es, con diferencia, Python (83% lo usaban). Seguido de SQL (44%) y R (36%).  

Por el momento no abundan los grados universitarios de científico de datos. Y hasta la fecha los especialistas, mayormente titulados de matemáticas, estadística o informática, se han formado de manera autodidacta. En cualquier caso, ya hay estudios oficiales y planificados de data scientist en universidades como la Universitat Obert de Catalunya (UOC), la Politécnica de Valencia, o la Universidad Europea, entre otras. También los interesados pueden encontrar formación complementaria en másteres de big data o en las certificaciones de compañías como Cloudera o IBM, que está en la plataforma Coursera.

Déficit de profesionales y salarios altos

Hay un tremendo déficit de profesionales tecnológicos en España y en el mundo occidental. Según varios estudios, en el continente europeo hay sin cubrir varios cientos de miles de puestos de trabajo en el mundo de las tecnologías de la información precisamente por la falta de candidatos. Y no parece ser un problema que se vaya a resolver a corto plazo. 

Esta diferencia entre oferta y demanda está tirando para arriba de los salarios. Y eso está beneficiando también a los aspirantes a científicos de datos y a los que ya desempeñan esta labor en las compañías. Según el portal de empleo Glassdoor, en España el sueldo base de un especialista en datos supera ligeramente los 33 000 euros al año. En el caso de un perfil sénior, la retribución puede llegar a los 50 000 euros más bonus. Se trata de un salario que dobla la retribución media de España, que se sitúa en estos momentos en los 24 000 euros brutos anuales.  

Imágenes | iStock.com/Viacheslav Peretiatko,  iStock.com/GaudiLab, iStock.com/AndreyPopov

Subir