Los Datos son la sangre de una Organización
Por Robin Bloor
Usted puede pensar que los datos son la sangre que le da vida a una organización. La mayoría de las organizaciones, el detener el flujo de datos es bien sensible y puede afectar el desempeño de la misma.
No siempre ha sido así. Pero en la medida que avanzan los años más y más de datos de una organización encuentran su camino en los sistemas informáticos y comenzaron a vivir la vida dentro de un universo digital – que ahora se extiende desde los servidores localizados en la empresa hacia los servidores en la nube, en los equipos de escritorio y dispositivos móviles de todo el mundo. Este universo digital pronto se ampliará en los dispositivos de todo tipo.
Si seguimos la analogía de “datos como la sangre” tenemos que pensar en los datos en bruto como “alimentos” que se digiere en una serie de “procesos” hasta que esté lo suficientemente puro para “atravesar las paredes del estómago” y entrar en el torrente sanguíneo. Una vez en el torrente sanguíneo, dependiendo de su naturaleza, puede ser almacenado en lugares diferentes. Puede ser enviado a unos almacenes de datos, lo cual es un poco como un hígado humano. Sirve la organización con datos en muchos contextos, al igual que el hígado se involucra en la prestación de toda una serie de cosas útiles para el resto del cuerpo. Almacena glucógeno, se involucra en la síntesis de proteínas, produce hormonas, limpia la sangre, ayuda en la digestión de los lípidos.
Al igual que la comida, los materiales vitales (vitaminas) y las hormonas (mensajes) transportados ronda por el torrente sanguíneo, los datos cumplen con una amplia variedad de papeles en el funcionamiento de cualquier organización. Pero no importa lo que los sistemas que da soporte, si los datos no son puros y no se maneja bien en su uso, “enfermedades y dolencias” tienden a desarrollarse.
El punto
La analogía torrente sanguíneo parece sugerir que la ingesta de datos (digestión) es un proceso mucho más complejo de lo que generalmente pensamos que es. Sin duda, es el caso que la digestión del hombre de la comida es también un proceso muy complejo, y vale la pena tomar nota.
En términos de TI, estamos acostumbrados a vivir en un mundo donde la información fue capturada directamente por la organización, fluye por los digitadores cuyo rol consiste en aplicar una serie de reglas de validación que aseguraran que los datos sean bastante limpios y reluciente, que cuando entraron en la organización. Construimos sistemas que también capturó la estructura de datos a la perfección. En resumen, cuando los datos entraron en la organización, que sabíamos dónde viene, exactamente lo que era y pudimos gestionar su ciclo de vida – a pesar de que, es triste decirlo – pocas organizaciones ponen mucho esfuerzo en la gestión del ciclo de vida de los datos. Ellos prefirieron “hágase la entropía.”
Ese acogedor mundo enclaustrado hace tiempo que ha desaparecido, y aunque todavía puede haber aplicaciones en las que se toma como un excelente cuidado de los datos, que no son la norma; en realidad son poco frecuentes. Hemos entrado en la era de los grandes datos, gracias a la potencia de procesamiento disponible a un costo relativamente bajo, una organización puede ingerir los datos de casi cualquier fuente. Esto incluye los archivos de registro internos que registran fielmente las actividades de los dispositivos de red, sistemas operativos, bases de datos, sitios web y muchas otras cosas. También incluye archivos de registro externas sobre las que la organización tiene muy poco control, que pueden emanan de dispositivos móviles o procesadores embebidos o etiquetas RFID o, para ser honesto, cualquier procesador en cualquier lugar haciendo algo “interesante” para la organización.
La digestión de los datos no estructurados
También tenemos el fenómeno de los llamados “datos no estructurados.” Como el término “estructurado” nunca ha sido bien definido en los diccionarios de TI, tenemos que usar la palabra con cierto cuidado. Nosotros, personalmente, pensamos de los datos no estructurados como si nosotros (la organización) no determinó definir su estructura totalmente. Todos los datos digitales en realidad tienen algo de estructura, de lo contrario no se habría producido. Pero muy pocos datos declaran su estructura abiertamente.
El total de los datos de medios sociales (los tweets, publicaciones en Facebook, blogs, comentarios en foros, etc.) es estructurado y tiene que tener la estructura añadido a la misma con el fin de ser procesados. Del mismo modo, los archivos de registro son no estructurados. Datos de libre acceso o incluso comprar de fuentes públicas es a veces sólo semi-estructurado. Y una buena parte de los datos internos (correos electrónicos, mensajes de texto, etc.) no está bien estructurada.
Una base de datos y siguiendo la analogía, pudiera ser el estómago y el intestino delgado. Es inundada de enzimas (procesos) que limpian los datos, aseguran los datos, determinar los metadatos y en general asegurar que los datos extranjeros, alimentos para la organización, se digiere adecuadamente antes de entrar en el torrente sanguíneo. Y lo que no se requiere puede ser desechado.
El punto es el siguiente: si los datos constituyen la sangre de una organización, los nuevos datos deben ser adecuadamente “digerido” antes de que nos dejamos en el torrente sanguíneo.
Acerca de Robin Bloor
Robin es cofundador y analista jefe de The Bloor Group. Cuenta con más de 30 años de experiencia en el mundo de la gestión de datos e información. Él es el creador de la Arquitectura Orientada a la Información, que es a los datos lo que la SOA es a los servicios. Es autor de varios libros, entre ellos, The Electronic B @ zaar, From the Silk Road to the eRoad; un libro sobre comercio electrónico y tres libros de TI en la serie Dummies sobre SOA, Service Management y The Cloud. Es un orador internacional en temas de gestión de la información. Como analista de Bloor Research y The Bloor Group, Robin escribió decenas de informes, informes de investigación y columnas sobre una amplia gama de temas, desde la evaluación de la base de datos hasta las opciones de redes y las comparaciones con la empresa en transición.