Oh que bueno que nadie sepa…

Sobre el complicado manejo de los datos anónimos, y una solución sorprendentemente sencilla.

Los datos personales son algo sensible. Todos queremos que se utilice únicamente para el fin para el que la proporcionamos voluntariamente. El marco legal para ello se encuentra, por ejemplo, en la Ley de Protección de Datos alemana y en la Directiva Europea de Protección de Datos.

Para muchas empresas, esto se traduce en una dicotomía. Los que cumplen meticulosamente los requisitos legales pueden verse en serios problemas precisamente por eso. O sólo puede gestionarlo entregando los datos, cuya protección está en juego, fuera de las instalaciones.

He aquí algunos ejemplos:

… para las ventas y el marketing

Un cliente se opone a que una empresa utilice sus datos, exige que se borren todos los datos personales y no desea que se le siga contactando. La empresa debe atender esta petición. Sin embargo, una implementación literal significa que la empresa no puede almacenar la información que el cliente ya no quiere que se escriba. Por lo tanto, el cliente puede recibir correo no solicitado en el futuro. Una contramedida sería añadir los datos del cliente de forma anónima a una lista negra y utilizarla para la verificación antes de futuras cartas. Sin embargo, con los procedimientos estándar actuales, esta comprobación no es tolerante a los errores. Incluso pequeñas desviaciones en la ortografía del nombre o la dirección hacen que el cliente no se encuentre en la lista negra.

… para los controles PEP y de terrorismo

La normativa legal exige la comprobación periódica de los acreedores y deudores en las llamadas listas de terroristas y de sanciones, así como la identificación de las personas expuestas políticamente (PEP). Para las pequeñas y medianas empresas (PYME), esta obligación supone un problema porque no merece la pena adquirir el software correspondiente. En cambio, estas empresas pueden utilizar las comprobaciones de la lista de PEP y de sanciones como un servicio.

Sin embargo, por razones de protección de datos, muchas empresas son reacias a ceder los datos de sus clientes fuera de sus instalaciones. La alternativa de divulgar sólo los datos anónimos no es muy práctica porque normalmente no implica comprobaciones tolerantes a errores. Pero esto es precisamente lo importante para las listas de sanciones, porque a menudo contienen errores de escritura y transmisión.

… de la investigación

Supongamos que los datos sobre una misma persona están disponibles en diferentes conjuntos de datos, por ejemplo, en los resultados de estudios médicos. La vinculación personal de estos conjuntos de datos permitiría obtener más información, pero los obstáculos para ello son muy grandes, especialmente en Alemania. Un procedimiento aceptado por la ley de protección de datos para estos casos utiliza un administrador que determina los datos personales relacionados de las diferentes poblaciones, pero los transmite al usuario de los datos sólo de forma anónima o seudonimizada. En este caso, los proveedores de datos deben extender su confianza al administrador de datos. La protección de los datos personales es aún mayor si sólo se entregan al administrador de datos de forma anónima. La ampliación del área de confianza no es necesaria en este caso. Sin embargo, el fiduciario de datos no podría entonces realizar una comparación tolerante a los errores utilizando los procedimientos habituales en la actualidad. Incluso los pequeños errores tipográficos impedirían obtener los resultados deseados al comparar los distintos conjuntos de datos.

La solución

Todos los ejemplos tienen en común que sería útil un cotejo de datos tolerante a errores, pero esto es difícil debido a la anonimización requerida.

TOLERANT Software ofrece un procedimiento de cotejo tolerante a errores de los datos anonimizados, incluso si contienen errores menores. De este modo, las personas se encuentran a pesar de la anonimización, incluso si hay desviaciones en la ortografía.

Hemos integrado un procedimiento descrito en la literatura con la palabra clave «Privacy preserving record linkage» en nuestro producto TOLERANT Match, donde ahora está disponible junto a otros procedimientos de emparejamiento. En el futuro, los usuarios de TOLERANT Match podrán vincular fácilmente la búsqueda anonimizada con la búsqueda no anonimizada en un proceso de comparación, por ejemplo, de datos personales y otra información menos sensible.

Además de la integración en TOLERANT Match se desarrolló una herramienta independiente para la anonimización de los datos. Esto permite a una parte A (proveedor de datos) realizar la anonimización y pasar los datos anonimizados a una parte B para su posterior procesamiento.

Todas las tareas descritas anteriormente pueden llevarse a cabo con la nueva función de TOLERANT Match, de manera que los datos personales de los clientes, pacientes, etc. no tienen que salir del dominio de confianza de una organización para ser comparados con otros conjuntos de datos, y sin embargo, dicha comparación puede realizarse ahora de manera tolerante a los errores.