segmentacion de datos
26/09/2022

Segmentación de datos: todo lo que necesitas saber

La segmentación de datos surge ante la necesidad en los entornos de prueba de conseguir dos objetivos. Por un lado, ahorrar espacio en esos entornos y, en consecuencia, el coste por ellos. Y por otro lado, el objetivo de cumplir con la normativa. Una normativa que recoge que no solo hay que proteger los datos sino que, además, hay que llevarse el mínimo imprescindible de ellos. 

Sigue leyendo para comprobar conocer más en profundidad la segmentación de datos y las valiosas novedades que integra para el tratamiento de datos en entornos de desarrollo.

Qué es la segmentación de datos

El concepto segmentación de datos define el proceso por el que se separa un conjunto de datos reducido de una base de datos de producción para trasladarla a un entorno no productivo. 

Mediante el descarte o extracción de datos, el objetivo de la segmentación de datos es reducir el tamaño de los datos para hacerlos más manejables. Eso sí, manteniendo un conjunto de datos relevantes para su uso. 

Para llevar a cabo procesos de data subsetting, se aplican filtros de datos. De este modo, es posible acceder a los datos adecuados para generar un conjunto relevante y consistente que pueda ser empleado en procesos de testeo de software. 

En cierto modo, la segmentación de datos emplea los datos de prueba desde la misma perspectiva que la ciencia estadística. Esta emplea muestras representativas en lugar de toda una población.

Algunos de los beneficios de aplicar la segmentación de datos incluyen:

  • Reducción del time-to-market de las soluciones de software, pues el tiempo necesario para los procesos de testeo se minimiza.
  • Rebaja en el espacio de almacenamiento necesario para los entornos de desarrollo. Es posible pasar de conjuntos de datos que alcanzan los terabytes a gigabytes.
  • Gestión de datos para evitar la proliferación de datos sensibles y el cumplimiento de las leyes de protección de datos.

Podría interesarte: Por qué es importante proteger los entornos de desarrollo

Ventajas de la segmentación de datos

Entregas repetitivas

Como hemos dicho anteriormente, el proceso de segmentación de datos supone la separación de un conjunto de datos reducido de una base de datos de producción para trasladarla a un entorno no productivo. 

De este modo, los datos de valor quedan disponibles directamente a través de un proceso que puede ser planificado y periódico. En otras palabras, a través del subsetting se garantiza que los datos son entregados en los entornos seleccionados cuantas veces sea necesario.

La segmentación de datos permite además que múltiples testers y desarrolladores trabajen en paralelo, ya que la entrega de datos puede hacerse sin interrumpir las operaciones en el entorno de destino. Esto contribuye a lograr aún mayor agilidad, evitando procesos que retrasan las entregas como las ediciones de los datos, su movimiento o borrado. 

Autonomía del usuario

En la medida en la que la segmentación entrega los datos que el usuario necesita a demanda, éste no depende de un tercero que realice esa función de segmentación. Uno mismo se abastece de los datos que necesite cuando lo necesite. 

Automatización de pruebas

A través de las herramientas de segmentación de datos adecuadas, las empresas pueden suprimir una gran cantidad de tareas manuales y disminuir los recursos que deben emplear en los procesos de pruebas de software. 

Podría interesarte: Anonimización y seudonimización: similitudes y diferencias

Cómo funciona la segmentación de datos

Un proceso ideal para acabar entregando al desarrollador o tester el conjunto de datos útiles, sería el siguientes:

  • Localización de datos valiosos en todos los entornos en los que puedan encontrarse.
  • Localización, a su vez, de los datos sensibles que deberán ser enmascarados.
  • Aplicación de medidas para proteger los datos sensibles.
  • Extracción y entrega de conjuntos de datos útiles a desarrolladores y testers. 

Pasos de la segmentación de datos

Teniendo en cuenta este proceso, es posible delinear los siguientes pasos:

En primer lugar, y teniendo en cuenta de que a veces es difícil saber qué necesitas mover porque los datos a encontrar cumplen criterios complejos, es importante encontrar la forma de hacerlo de manera ágil. En icaria Technology, este proceso previo de identificación de datos lo resolvemos mediante el buscador.  

Una vez localizados estos datos valiosos, se empieza con el plan de segmentación. En él se determinan las estructuras a transferir, las condiciones de las instancias a seleccionar, las entidades de transferencia completa, y las trayectorias válidas (de origen a destino).

En este punto, ya ha entrado en juego, a través del buscador y de la creación del plan de segmentación, nuestro software icaria TDM. La plataforma, orientada a simplificar la gestión de datos en entornos de prueba, es capaz de segmentar los conjuntos de datos y disociar estructuras complejas, aplicando las prácticas de segmentación de datos más avanzadas para garantizar conjuntos de datos de calidad.

Esta herramienta digital se encarga asimismo de identificar los diferentes tipos de información que debe ser localizada y, más adelante, elaborar el Mapa de Datos sensibles que guiará el proceso para cumplir con los requisitos legales.

Además, algunas de las funcionalidades adicionales de la herramienta icaria TDM incluyen las siguientes:

  • La capacidad de identificar de forma automatizada las relaciones entre entidades del modelo de datos, aunque no estén documentadas, y la posibilidad de definirlas en icaria Studio para guiar el proceso de segmentación, aunque las relaciones no existan a nivel físico de la base de datos. 
  • La posibilidad de definir distintas estrategias de entrega de datos, capacidad que resulta decisiva en las entregas repetitivas, cuando pueden producirse conflictos entre los datos existentes en el entorno de destino y los que se entregan.
  • Distintas políticas de reintentos de entrega, necesaria para asegurar la entrega de datos en bases de datos con integridad referencial activa y modelos con tendencia a las referencias circulares.

Configuración orientada a dominios de datos, que permiten gestionar la complejidad de forma incremental y reutilizar el conocimiento. De hecho MDA está siempre presente en nuestra filosofía de trabajo. Si te interesa este tema, aquí te explicamos un poco más.

Un paso clave en cualquier proceso de segmentación de datos incluye no solo la extracción de estructuras completas, sino también su disociación

La disociación consiste en reemplazar los datos sensibles con otros ficticios pero veraces, que mantienen la integridad referencial incluso entre bases de datos en distintas tecnologías, de modo que el conjunto de datos cumple con la legalidad respecto a la protección de datos pero también puede ser empleado en procesos de testeo. 

De este modo, las empresas se aseguran de cumplir con todos los requisitos del GDPR y la protección de datos en entornos de prueba.

¿El resultado del proceso de segmentación de datos a través de icaria TDM? Reducción de costes, cumplimiento de la ley y la mejora en la calidad del software de gestión de prueba. 

¿Quieres saber más sobre cómo el data subsetting está permitiendo disminuir los tiempos de espera y los costes de operación en los procesos de prueba? Ponte en contacto con el equipo icaria o solicita una demo de icaria TDM y compruébalo de primera mano.

Compartir
magnifiercrossmenuchevron-down