Modelado Documental – Implantar un gestor documental en una entidad
Modelado Documental – Implantar un gestor documental en una entidad
Siguiendo con el escenario propuesto de un ciclo de entradas en torno a la implantación de un gestor documental en una entidad tenemos ya elegido el producto en el que almacenaremos todos los documentos de nuestra empresa o institución, pero ahora llega un proceso crítico, el modelado.
Aunque he visto muchos proyectos desastrosos, donde se utiliza el gestor documental como una simple “carpeta de red”, donde se “tira” los documentos sin prácticamente metadatos, solo con el nombre del fichero, hay que recordar que hacerlo así es un derroche de recursos (para eso puede utilizarse una carpeta de red o un servidor ftp). Sobre todo es un derroche enorme de esfuerzo humano (ya que luego los documentos no se encuentran nunca), así que merece la pena dedicar tiempo a modelar la información adecuadamente.
Por qué modelar
Como dice la frase tradicional “Garbage In – Garbage Out” (“Si entra basura, sale basura”). Esto parece evidente, pero es habitual “dejarse llevar por las prisas” o dar poco importancia a un correcto modelado, argumentado razones como:
- “Luego lo puedo buscar por las palabras contenidas en el documento”
- “No se puede perder tiempo describiendo cada documento”
- “Ya tengo los datos del documento en la aplicación que los recibe, no necesito incluirlos además en el gestor documental”
- “Me gustaría modelar pero será un proceso demasiado largo”
Si repasamos estos argumentos, veremos que son erróneos:
- “Luego lo puedo buscar por las palabras contenidas en el documento”: Esto implica que TODOS los documentos son un formato de documento de texto, no imagen u otros formatos (si no son TODOS perderemos algunos documentos y mucho tiempo buscándolos) o que haremos OCR (reconocimiento óptico de caracteres) sobre la imagen. Sin embargo cualquier OCR tiene un porcentaje de fallos que puede afectar a los caracteres que nos interesan precisamente (una letra de un nombre, de un DNI o de una fecha). Además muchos de los datos por los que necesitamos buscar no están en el documento, sino que son parte de nuestro proceso interno (códigos de expediente, de contrato, fechas, etc.). Finalmente, la búsqueda por contenido con un motor de búsqueda no permite estructurar y filtrar adecuadamente, como experimentamos (¿nos desesperamos?) habitualmente cuando utilizamos cualquier buscador Web. No es lo mismo que un nombre aparezca, por ejemplo, como representante o como representado, o que buscando por “Toledo”, recuperemos tanto localidades como apellidos o marcas.
- “No se puede perder tiempo describiendo cada documento”: Siempre se contabiliza el coste de describir adecuadamente los documentos, pero nunca se tiene en cuenta:
- los costes por usuario de buscar los documentos (se emplea muchísimo tiempo buscando información y, si está mal estructurada, pueden doblarse o triplicarse),
- costes de no encontrar la información necesaria (legales, de imagen, de oportunidad),
- lo que cuesta la infraestructura (servidores, comunicaciones, etc) innecesaria (debido a que hay que abrir/descargar muchos documentos y revisarlos para ver si es el que buscamos, al no estar adecuadamente descritos).
- “Ya tengo los datos del documento en la aplicación que lo recibe, no necesito incluirlos además en el gestor documental”: Ese modelo donde los datos se guardan en un aplicación, y no en el gestor documental, presentan varios problemas:
- Asume que los documentos no serán utilizables en otros procesos de la institución, obligando a recoger los documentos múltiples veces, doblando ocupación, degradando la velocidad de los procesos y prestando peor servicio a los usuarios. (todos hemos sufrido tener que entregar repetidas veces el mismo documento a una empresa o institución que ya lo tiene, simplemente porque “sus sistemas no se comunican entre ellos”).
- Si cambia la aplicación, debemos migrar los datos de esos documentos a una nueva aplicación
- Puede provocar incumplimientos legales (GDPR, LOPD,..), al tener que implementar procesos de borrado o seguridad de documentos en múltiples sistemas en lugar de un único repositorio central.
Además, si la información ya esta en un aplicación, es trivial almacenarla TAMBIÉN en el gestor documental asociada al documento.
- “Me gustaría modelar pero será un proceso demasiado largo”: Es cierto que un análisis completo y en profundidad de toda una empresa o institución puede ser largo, pero puede plantearse un análisis gradual e iterativo (por procesos o departamentos) que permita empezar a manejar documentos adecuadamente sin necesidad de tener totalmente analizados todos los procesos y documentos.
Cómo modelar
El modelado documental no se parece al modelado de bases de datos tradicionales, donde definimos entidades y relaciones, aunque tiene elementos en común con ellas, así como con las nuevas bases de datos NoSQL.
En un gestor documental básicamente debe modelarse las tipologías de documentos, con sus metadatos o campos, así como las tipologías de carpetas/contenedores/expedientes con sus metadatos correspondientes. (Adicionalmente habrá que modelar aspectos como la conservación, el almacenamiento, la seguridad y los procesos documentales, elementos cada uno de ellos que requerirían artículos específicos).
Además de definir los metadatos (Nombre, autor, fecha, título,..) que describirán el documento con sus tipos de datos (cadena, fecha, entero, lógico,..), una diferencia importante con una BB.DD. es que algunos metadatos de un documento puedan tener múltiples ocurrencias. Por ejemplo autores, palabras claves, responsables,..
Adicionalmente, también es habitual que el modelado sea “orientado a objetos”, es decir poder definir tipos o clases de documentos (Documento Identidad, Informe, Contrato,..) y subtipos de cada uno de ellos (DNI, Pasaporte,…; Informe Técnico, Informe Financiero,..; contrato Laboral, Contrato Mercantil,..) que heredan metadatos y otras características de los tipos “padre” (seguridad, conservación, almacenamiento,..). Esto permite representar adecuadamente los distintos tipos de información y además realizar un análisis iterativo y gradual (lo que reduce el problema anteriormente citado de tiempo de análisis)
En el caso del modelado de las carpetas las posibilidades son similares, con la complejidad adicional de que cada carpeta podría contener otras carpetas o tipos de documentos. Se creará así una jerarquía describiendo la estructura organizativa de una institución (direcciones, departamentos, equipos, etc.) así como limitando los tipos de carpetas o documentos que pueden insertarse en ellos (indicando por ejemplo, “no puede crearse una carpeta de tipo Dirección dentro de una carpeta de tipo Departamento” o “no puede insertarse un documento de tipo Baja Médica dentro de una carpeta de tipo Expediente Personal sino en carpetas de tipo Seguimiento Salud”).
Con qué modelar
Hasta donde conozco no existen herramientas especializadas en modelado de documentos, así que hay que utilizar alternativas más o menos adecuadas.
Es habitual utilizar hojas de cálculo o documentos de texto, que lógicamente no son la mejor opción y no son recomendables.
Una posibilidad es utilizar herramientas de modelado de base de datos, como Draw.io o DBDesigner. Este tipo de herramientas no permiten reflejar toda la complejidad de relaciones y elementos de un modelado documental. No obstante pueden ser una opción mejor que un formato de documento ofimático.
Como herramientas de modelado de documentos puede ser recomendable utilizar alguna herramienta de modelado UML (siempre que el gestor documental incluya orientación a objetos entre sus capacidades), entre las que podemos citar productos open source como Modelio o ArgoUML. Probablemente es la mejor opción para reflejar la complejidad de relaciones, la herencia y los metadatos de cada tipología.
Por último, aunque no sean herramientas de modelado, una opción interesante es, en lugar de modelar, “maquetar”. Es decir crear las definiciones realmente en un entorno reducido donde pueda probarse el comportamiento con todas las características de un gestor documental.
Para ello puede utilizarse algún gestor documental portable o personal como OpenProdoc o Krystal. Esta maqueta puede utilizarse para probar el comportamiento, mostrarlo a las personas que lo utilizarán y luego exportar las definiciones e importarlas en el gestor documental del entorno elegido.
Con la herramienta más adecuada que pueda utilizarse en cada caso, el diseño y modelado de la información siempre nos ahorrará trabajo. Además, devolverá con creces el esfuerzo inicial invertido.