El Mapa de Datos Sensibles es el resultado de la búsqueda de información sensible que hemos explicado en las últimas entradas. Ofrece un modelo de campos candidatos a la disociación y una ayuda imprescindible para la configuración posterior, así como información relevante sobre el contenido de las bases de datos.
Esta entrega detalla la última etapa de la detección de información sensible presente en las bases de datos a tratar. Durante la entrega anterior mostramos cómo y por qué analizar los distintos campos de las bases de datos puede resultar una tarea compleja y, a su vez, es específica para cada organización. Consecuentemente propusimos una solución donde inspectores de campos de bases de datos pueden configurarse de forma rápida y simple con el fin de adaptarse a las diferentes particularidades detectadas durante el proceso.
Una vez finalizada la configuración inicial de los inspectores, el proceso de análisis puede ejecutarse de forma periódica en los diferentes entornos de trabajo para obtener nuevas versiones del Mapa de Datos Sensibles. Si la forma en la que se introducen los datos y los criterios de nombrado de los campos no varían en gran medida, los algoritmos de búsqueda seguirán siendo válidos. Además, en el post anterior comentamos que es recomendable la ejecución periódica de este proceso ya que las bases de datos evolucionan y se modifican a través del tiempo de acuerdo con las necesidades de la organización que las administra.
En el momento en el que se dispone de un Mapa con información válida es momento de proceder a un análisis mayor de la misma. Para cumplir con este objetivo se requiere principalmente información sobre los esquemas, tablas, campos, inspectores, disociadores a aplicar y la confianza que arroja el análisis realizado sobre cada columna. icaria TDM permite visualizar esta información de dos modos distintos, o bien por pantalla directamente en el aplicativo, o bien exportando los resultados a fichero de tal modo que se pueda anotar sobre ellos, enviarlos, etc.
¿Para qué se usan estos datos? Bien, cada uno de ellos tiene un propósito específico, el esquema, la tabla y el campo indican dónde se encuentra la información. El inspector refiere a qué agente realizó el análisis que resultó en la detección del campo como posible candidato a disociador, si varios análisis hubiesen dado resultados se tomará aquel que arroje resultados con mayor nivel de confianza.
La sugerencia de disociador, como su nombre indica, refiere aconseja qué algoritmo de disociación se debe aplicar sobre la información contenida en ese campo. Y, finalmente, la temperatura muestra cuan probable es que, efectivamente, se trate de información sensible o qué porcentaje de los registros leídos tienen las condiciones necesarias para ser considerados datos sensibles por ese inspector.
Por otra parte, es importante recordar que la detección de información sensible puede realizarse a través del campo en particular y a través de campos de la misma tabla que presentan indicios de información sensible en la tabla. Por ejemplo, cuando existe una dirección postal en una tabla usualmente viene acompañada de la ciudad, provincia y/o código postal en otros campos de la misma. Como consecuencia de esta asociación, el Mapa de Datos Sensibles también lista aquellos campos que dan indicios de cierto tipo de información sensible. De este modo podemos conocer indirectamente la posibilidad de contener información sensible.
Por nuestra parte, han sido continuos los avances que hemos incluido en las últimas versiones del Mapa, sin embargo, sabemos que aún nos queda camino por recorrer. Los próximos puntos en los que ya estamos trabajando son: la mejora de los diferentes inspectores y la extracción de una pequeña muestra de los datos que pueda permitir directamente evaluar la confianza en el análisis sin acudir a la base de datos o la presentación de algunos datos adicionales de los campos (como su tamaño) que puedan ser de guía para el análisis del mapa.
Finalmente, una vez disponible una versión válida del mapa de datos sensibles termina el análisis de datos sensibles. En este punto comienza la siguiente fase del Proyecto de Disociación, la configuración de los algoritmos de disociación dentro de los modelos de bases de datos sincronizados previamente para después continuar con las disociaciones. Esta tarea es la que detallaremos en la próxima entrega.