Empresa

Pablo Haya: «Tenemos tecnología y datos, pero nos falta más alfabetización en ‘big data»

Con cada paso que damos con nuestro móvil en el bolsillo, con cada clic que hacemos en la red, con cada conversación con Google Home o Siri llenamos el mundo, un poco más, de big data. En el análisis de estos datos se esconden multitud de oportunidades para todo tipo de sectores. Para el retail, para la industria automovilística, para la agricultura o el marketing. Y también sirve para dar forma a las ciudades del presente y del futuro.

Pablo Haya, director de Social Business Analytics en el Instituto de Ingeniería del Conocimiento (IIC), es una de esas personas que trabaja en transformar la avalancha de datos en valor concreto para los negocios y para las personas.

En tu web te defines como apasionado de la ciencia de datos y de su poder para asegurar el éxito de nuestras sociedades. ¿Por qué esa confianza en los datos?

A Arquímedes se le atribuye la frase “Dadme un punto de apoyo y moveré el mundo”. Se refiere al progreso que supuso poder utilizar palancas y poleas para mover objetos. Si hubiera nacido en esta época, creo que diría algo como “Dadme un conjunto de datos y moveré el mundo”. El uso de los datos para conocer el mundo viene siendo fundamental para el avance de la ciencia y el progreso tecnológico desde hace siglos.

El uso adecuado de los datos permite tomar mejores decisiones informadas, lo cual va más allá de un eslogan. Es una realidad contrastada por los logros que ha aportado la estadística y las ciencias de la computación. Ahora estamos en un momento donde está calando este mensaje en la sociedad.

Me parece muy ilusionante todo el movimiento que está habiendo en torno al open data, y lo que puede suponer: una revolución de cómo entender la relación entre las administraciones públicas y los ciudadanos. Poco a poco se están transformando las administraciones para publicar en abierto todos los datos resultado de su gestión.

entrevista a Pablo Haya IIC

¿Son todos los datos igualmente útiles? ¿Cómo discriminar correctamente?

Todos los datos son útiles en principio. Creo más bien que su utilidad se mide en función de su calidad y su facilidad de acceso. En este sentido, nos estamos encontrando organizaciones en distintos niveles de madurez, dependiendo de cómo han gestionado sus datos.

Para una empresa que se esté planteando reconvertir sus procesos para que estén guiados por los datos, desde el Instituto de Ingeniería del Conocimiento recomendamos empezar por disponer de un inventario de fuentes de datos y realizar una auditoría de su calidad. Lo habitual es que se parta de una situación en la que se tengan múltiples silos de información, donde los datos son gestionados de manera distinta para cada área o departamento.

Unificar criterios, de manera que se establezcan políticas comunes que permitan disponer de datos de calidad, no es ni mucho menos una tarea trivial. Facilita bastante el trabajo disponer de una infraestructura que permita acceder a los datos de manera centralizada. Es decir, como si hubiera una ventanilla única que permitiera preguntar por los mismos independientemente de dónde hayan sido generados.

Al final, la misión del equipo de big data  es proponer e implantar metodologías y algoritmos que permitan sacar valor a los datos. Desde mi punto de vista, esta labor es esencialmente transversal. Gran parte de las ventajas de estas nuevas tecnologías es combinar datos que vengan de distintos departamentos.

Millones de clientes gestionados por Big Data: estas son las ventajas de ser una compañía ‘data driven’

¿De qué manera aporta el análisis de big data valor de negocio? ¿Cómo compensa la inversión necesaria en tecnología/talento?

Cualquier empresa trabaja con conocimiento hoy en día. Más allá de las empresas que lo utilizan como materia prima, cualquier empresa necesita gestionar activos, recursos y personas. Y gestionar es, esencialmente, tomar decisiones.

La manera más adecuada de tomar una decisión es apoyándote en los datos. Esto, a día de hoy, le puede afectar desde al agricultor que quiere saber cuándo, dónde, cómo y qué cosechar, hasta a una multinacional del sector retail que quiera optimizar su cadena logística para conseguir ajustar la producción con la demanda del mercado.

Las tecnologías big data han hecho posible que se pueda analizar información que antes parecía impensable o que estaba al alcance de un reducido número de organizaciones. Por ejemplo, ahora podemos estar hablando de ir más allá del agregado de los datos sociodemográficos de nuestros clientes. Podemos incorporar a nuestros análisis datos comportamentales de millones de clientes a través de la huella digital como, por ejemplo, la navegación web, el uso de aplicaciones móviles, el consumo energético, las transacciones realizadas, o el comportamiento en redes sociales.

Es más, este interés que se ha suscitado en torno al término big data me parece que ha producido algo así como el renacimiento del análisis de datos. Empresas o departamentos que no utilizaban los datos para tomar decisiones, de repente, se han subido a este fervor por extraer el máximo valor a los mismos e independientemente del volumen que tengan.

Respecto a la inversión, un punto importante es que es cada vez más barato implantar estas tecnologías, ya que el incremento de la capacidad de cómputo y almacenamiento ha venido acompañado de un abaratamiento del acceso al hardware. Gracias a la nube, ahora una empresa que precisa tratar datos puede conseguir máquinas sin tener que comprar ni mantener un solo ordenador. Esto permite una flexibilidad de operación impensable hace unos años.

entrevista a Pablo Haya IIC

¿Y cómo pueden las empresas beneficiarse de estas herramientas a nivel interno?

Parece que cuando se habla de tecnologías big data estamos pensando en analítica del cliente. Pero una organización dispone también de información sobre sus empleados o tiene medios para preguntarles. Sean datos masivos o no, se puede extraer mucho valor para beneficio del propio empleado y de la organización.

En el IIC llevamos desarrollando proyectos desde hace años con una metodología propia, que denominamos AROS (herramienta de Análisis de Redes Organizativas y Sociales), en la que analizamos las interacciones y relaciones entre los empleados. Y mediante técnicas de análisis de grafos descubrimos esos influencers internos. Los resultados de este tipo de estudio pueden impactar a nivel individual, a modo de reconocimiento, visibilidad y crecimiento del empleado. Y también a nivel organizacional, mejorando la gestión del talento en áreas como la formación o las políticas de retención.

El éxito de estas tecnologías pasa por su democratización. ¿Cuáles son hoy las barreras de entrada? ¿Cómo crees que cambiará el acceso a la tecnología de big data en los próximos años?

Tenemos tecnología y datos, aunque no siempre con la calidad que nos gustaría. Lo que nos falta es más alfabetización en ciencia de datos, esto es, en estadística y programación. Me refiero no solo a más profesionales, sino a crear una sensibilidad y formación básica en la sociedad sobre esta materia.

La buena noticia es que nunca antes hubo un acceso a la formación de calidad más fácil y barata. La oferta de cursos online de calidad es inmensa. Por ejemplo, ahora mismo puedes estar formándote en deep learning con los mayores expertos mundiales sin moverte de casa.

El procesamiento del lenguaje natural ha avanzado mucho en los últimos años. Algoritmos que “entienden” a las personas cada vez mejor. ¿En qué sentido va a cambiar esto nuestra relación con las máquinas?

Creo que los beneficios del PLN los podemos ver en tres áreas principalmente. La primera sería el procesamiento automático de documentos donde entraría la revisión para la extracción de información. Esta tarea permite identificar los temas más importantes, realizar resúmenes o identificar partes que son incorrectas. También se puede derivar una organización automática de los documentos, porque se encuentren grupos de documentos similares, o porque se clasifiquen según criterios temáticos. En general, estamos delegando tareas tediosas, repetitivas y poco creativas a las máquinas.

«Estamos asistiendo a una expansión en el desarrollo de agentes conversacionales, como son los chatbots, que facilitan la contratación de servicios o la búsqueda información»

Otra área donde se está produciendo un cambio importante es en la traducción automática. Está permitiendo acometer traducciones masivas de documentos entre múltiples pares de idiomas. Ya no es tan raro que los traductores profesionales se apoyen en esta tecnología, realizando una postedición de un primer resultado obtenido por el algoritmo. En textos o conversaciones sencillas ya existen prototipos que te permiten una traducción en tiempo real bastante fidedigna.

Finalmente, tenemos el uso de PLN para conseguir una interacción persona-ordenador más natural. En los últimos años, estamos asistiendo a una expansión en el desarrollo de agentes conversacionales, como son los chatbots, que facilitan la contratación de servicios o la búsqueda información. Estas tecnologías posibilitan poder atender a muchos más clientes para resolver las consultas o dudas más habituales.

¿Cuál es el potencial disruptivo del procesamiento del lenguaje natural en los negocios? ¿Qué sectores/campos podrán beneficiarse más de ello?

Si tuviera que seleccionar una sola ventaja, creo que lo más destacado es poder extraer conclusiones sobre grandes volúmenes de texto, que de otra manera sería muy costoso.

Cualquier campo es susceptible de beneficiarse, ya que el lenguaje es consustancial a cualquier actividad humana. Aunque podría destacar que hay grandes áreas con mayor potencial, como puede ser justicia, el turismo o el sector de la salud.

El sector legal está desbordado de documentos: leyes, sentencias, contratos, hipotecas, notas simples, etc. Es, sin duda, uno de los grandes beneficiarios de la revisión automática de documentos que he mencionado anteriormente.

En el caso del turismo, la barrera idiomática es cada vez menor gracias a las tecnologías de traducción automática. Esta tecnología se puede convertir en compañera indispensable para el turista antes, durante, y después de viaje.

En el sector salud, la documentación escrita la podemos encontrar en múltiples fuentes, desde el historial clínico hasta artículos científicos. La revisión automática posibilita encontrar relaciones entre síntomas, medicamentos y enfermedades, que de otra manera sería muy complicado dado la cantidad de información y la rapidez con la que se genera.

entrevista a Pablo Haya big data

¿Qué información útil para un negocio se puede obtener del análisis de redes sociales?

Las redes sociales son un gran focus group de millones de usuarios. Allí se expresan espontáneamente sobre múltiples aspectos que pueden afectar a un negocio. Un análisis correcto permite extraer, por ejemplo, las tendencias de un sector o industria, lo que puede dar pistas para la conceptualización de un nuevo producto. También puede aportar lo que opinan los usuarios sobre productos. O cómo están reaccionando ante una determinada estrategia de marketing.

¿Llegará el big data a mejorar tanto el conocimiento del cliente que lo que siempre se llamó intuición quedará obsoleto?

No estoy muy seguro… En contextos limitados puede llegar a ocurrir, siempre que se disponga de suficiente información. Por ejemplo, en un negocio que tenga un volumen importante de transacciones y en el que tenga cabida realizar acciones automáticas que afecten a la decisión de compra de un cliente.

Aterrizando más el ejemplo, en la venta a través de internet se dispone de datos de todas las acciones del cliente. Se puede actuar sobre la publicidad que se le muestra, las páginas que se le recomienda, o incluso, la disposición de los elementos en la página. Un algoritmo puede llegar a aprender cuáles son las siguientes acciones a realizar para maximizar la probabilidad de compra del usuario, y todo ello, en tiempo real y sin intervención humana.

¿Será el clásico vendedor estrella sustituido por un analista detrás de una pantalla?

Hay muchos escenarios donde el vendedor estrella seguirá siendo estrella por mucho algoritmo que se implante. En este caso, me viene a la cabeza la venta B2B [business-to-business], donde la labor comercial es clave para la contratación de un producto o un servicio. La venta es una cuestión donde entra en juego una serie de habilidades, como las sociales y de comunicación, que creo que estamos lejos de poder emularlas. Sí es cierto que estos vendedores se pueden beneficiar de la analítica para mejorar su pipeline y cerrar más oportunidades.

Desde el lado del cliente, se teme que el análisis de datos pueda llegar a poner su privacidad en peligro. ¿Cómo se explica eso de lograr segmentar una audiencia individualmente mientras se mantiene el anonimato?

Totalmente de acuerdo. A medida que tenemos más información sobre los clientes, más sabemos, y con más precisión. Aquí viene en nuestra ayuda el nuevo Reglamento General de Protección de Datos (RGPD). Es una oportunidad para comprender mejor la relación entre las empresas y sus clientes, recopilando la información necesaria solo de aquellos que estén realmente interesados en nuestros productos. Así, se les puede ofrecer una oferta más adecuada a sus necesidades. Y, por otro lado, no saturar de información a los que no la solicitan.

La personalización es la clave para aportar valor al cliente: dar la oferta correcta a la persona correcta. Tenemos que hacer que nuestros clientes se sientan importantes, haciéndoles sentir que son verdaderamente valorados y únicos. Tenemos que respetar que algunas personas no quieran interactuar con nosotros. Por otro lado, existen clientes con mucho engagement con nuestra empresa, que quieren la oferta correcta, en cualquier momento y lugar.

Imágenes | IIC, Unsplash/rawpixel,

Subir