Organizaciones data-driven, conflicto cultural y virtualización de datos
En los primeros años del dospuntocerismo se inició y creció en popularidad el Quantified Self. Capturar datos sobre uno mismo de cualquier tipo y clase: desde el número de pasos al día, el tiempo de casa a la oficina o, claro, parámetros vinculados a la salud: desde horas de sueño a la evolución de los niveles de colesterol. Todo es medible: las apps de los relojes deportivos tienen un campo para vincular las zapatillas que se usan al trotar y por tanto medir el número de kilómetros de su vida útil o, por lo menos, lo que dura el capricho.
Nadie como los aficionados a la carrera para observar la fruición por conocer tiempo total, ritmo por kilómetro y tiempos de paso. Es decir, por medir el resultado y (este “y” es importante) lo que ha sucedido para que lleguemos al tiempo final. La necesidad de comprender es tan amplia que se comparten datos en público sobre recorridos, tiempos y ránkings. El ímpetu por mejorar el desempeño del trote no tiene temor a ser transparente ni compartir datos.
Con nuestras primeras demostraciones utilizábamos un caso de uso en el que, después de mostrar el primer “descubrimiento” del funcionamiento de las operaciones siguiendo el rastro de las actividades, modificábamos el punto de vista y convertíamos un atributo (un metadato: quién había ejecutado casa paso) en actividad: ahora podría consultarse el flujo de trabajo viendo por quiénes pasaba el trabajo y no viendo qué se hacía.
Ya no es fácil recordar si éramos nosotros los que nos poníamos la venda antes de la herida o si, al ver la cara del interlocutor, corríamos a aclarar que, datos y personas, tienen que tener el cuidado tratamiento que no sólo exige la ley, sino la pura prudencia: si quieres mejorar un proceso, empezar con la búsqueda de culpables es una apuesta segura al desastre. Nada como la orfandad del fracaso.
Pero el ejemplo pone en evidencia el valor y la plasticidad del uso de los datos mediante minería de procesos para comprender todos los ángulos de cómo se ejecutan las operaciones, el simple trabajo cotidiano. Lástima que la cultura corporativa no nos deje o no seamos capaces de modificarla para convertir en normal lo que es normal en la vida cotidiana de los que trabajan con nosotros.
Ser data-driven es la lucha contra la ausencia de los datos correctos, el conocimiento básico de cómo se deben mirar los datos (por ejemplo: eso tan viejo de que correlación no implica causalidad entre otros clásicos) y el ambiente -la cultura- de que hablar sobre datos y no sobre opiniones y con ello dar luz a los errores no es ni contraproducente ni vergonzante, es sólo el rastro para saber cómo mejorar. Fijémonos que es casi un camino a la inversa: si la cultura reclama el dato, se buscará cómo disponer de ellos y entender cómo tratarlos.
Una tendencia de nuestro tiempo es la construcción del Logical Data Warehouse (LDW). Es fácil constatar que las necesidades de análisis desbordan las capacidades de lo que ofrece una única de las herramientas informáticas que empleamos y que la complejidad de las arquitecturas de software y servicios de las empresas de hoy incrementa la complejidad del tratamiento de datos.
De ahí que estemos trabajando con Denodo para llevar la virtualización de datos a la minería de procesos. La virtualización de datos forma parte de los esquemas de construcción del LDW. Hay una entrada en el blog de Denodo que advierte: “por sí mismo, emplear virtualización de datos no te hará data-driven. Pero puede proporcionar las funcionalidades críticas para serlo”.
Con herramientas de virtualización de datos seremos capaces de poder construir mapas de procesos que puedan seguir las cadenas de valor internas, cuya huella digital está esparcida entre herramientas, hacerlo en tiempos cómodos (muy cómodos, de hecho) y modificar y ampliar dónde empieza y termina un proceso en cada momento y para cada necesidad.
Ser data-driven implica poder acceder a los datos originales, a datos enriquecidos, poder acceder a ellos para realizar informes nuevos rápidos, con cero latencia, a salvo de cambios en las bases de datos, capaces de absorber nuevas fuentes de datos y dar visiones de 360 grados de cada necesidad de información: minar cambiando atributos por actividades, es una forma de hacerlo. Que sea flexible, requiere una capa lógica adecuada. Minar nos llevará a observar las operaciones verdaderamente a través de lo que dicen los datos y no sólo por los resultados, sino también por cómo se llega a ellos.
La virtualización de datos se convierte, por tanto, en una herramienta de cambio cultural y de perspectivas. Y nos permite desarrollar una minería de procesos profunda.