En el dinámico mundo de la Inteligencia Artificial (IA), la innovación nunca se detiene. En icaria Technology, continuamente exploramos nuevas fronteras en el ámbito de la seguridad de datos, el cual supone una preocupación creciente en nuestra sociedad hiperconectada.
Nuestros productos icaria TDM, icaria GDPR y, nuestro próximo lanzamiento, icaria Data Governance (icaria DG), requieren de la correcta identificación de los tipos de datos y su propósito en las bases de datos de aplicativos. Por ello, hemos evaluado múltiples modelos de IA pre-entrenados, disponibles en librerías de Natural Language Processing (NLP) como Spacy, Flair y Transformers, entre otros.
Nuestro objetivo es detectar datos sensibles en texto, como números de tarjeta de crédito, direcciones de correo electrónico o nombres. Nuestros avances revelan que estos modelos son altamente efectivos para esta tarea. Para ello, utilizando técnicas de aprendizaje de transferencia (Transfer Learning), hemos logrado reducir significativamente el tiempo y los recursos necesarios para la identificación de datos sensibles, así como mejorar la efectividad en su detección.
Para llevar nuestra investigación al siguiente nivel, hemos creado una aplicación basada en Streamlit, una herramienta de código abierto que permite crear aplicaciones web para visualizar nuestros algoritmos de aprendizaje automático de forma interactiva. Con Streamlit, hemos creado gráficos que facilitan la interpretación de los resultados y permiten una comparación más sencilla entre diferentes modelos y parámetros. Asimismo, hemos desarrollado una interfaz de usuario que permite la ejecución de reentrenos de modelos de IA, la visualización de resultados del análisis de estos y la comparativa entre varios modelos.
Un objetivo claro, continuar explorando, mejorando y desarrollando los algoritmos de descubrimientos de datos para nuestras herramientas de Gobernanza y protección de datos
Esto será muy valioso tanto para nuestro equipo de desarrollo como para los stakeholders interesados en entender mejor cómo funciona la identificación de datos sensibles.
Desde icaria Technology, creemos en la investigación y la implementación de soluciones en el campo de la IA y la seguridad de datos. La combinación de modelos de IA pre-entrenados, el reentreno de los mismos y herramientas de visualización como Streamlit nos permiten no solo desarrollar soluciones más efectivas, sino también hacer que estas soluciones sean accesibles y comprensibles para todos.
Nos complace compartir nuestros avances y continuaremos investigando y compartiendo nuestros conocimientos en el futuro. Además, pronto quedará incorporado dentro del proceso de identificación de Datos Sensibles.
Si te interesa saber más acerca de cómo podemos ayudar a tu organización en la identificación y protección de datos sensibles, no dudes en contactarnos para ver ejemplos o conversar sobre las muchas posibilidades que este mundo de Inteligencia Artificial nos ofrecen.