Tant que personne ne le sait …

Sur le traitement délicat des données anonymes, et une solution étonnamment simple.

Les données personnelles sont une chose sensible. Nous voulons tous qu’elles soient utilisées uniquement dans le but pour lequel nous les avons volontairement fournies. Le cadre juridique pour cela se trouve, par exemple, dans la loi allemande sur la protection des données et dans la directive européenne sur la protection des données.
Pour de nombreuses entreprises, cela se traduit par une dichotomie. Car ceux qui respectent scrupuleusement les exigences légales peuvent s’attirer de sérieux ennuis précisément pour cette raison. Ou bien il ne peut la gérer qu’en donnant les données, dont la protection est en jeu, hors site.

Voici quelques exemples:

… pour la vente et le marketing

Un client s’oppose à ce qu’une entreprise utilise ses données, demande que toutes les données personnelles soient supprimées et ne souhaite plus être contacté. L’entreprise doit se conformer à cette demande. Toutefois, une mise en œuvre littérale signifie que l’entreprise ne peut pas stocker les informations que le client ne souhaite plus recevoir par écrit. Le client peut donc recevoir du courrier non sollicité à l’avenir. Une contre-mesure consisterait à ajouter les données des clients sous forme anonyme à une liste noire et à les utiliser à des fins de vérification avant les futurs courriers. Avec les procédures standard actuelles, ce contrôle n’est toutefois pas tolérant aux erreurs. Même de petites différences dans l’orthographe du nom ou de l’adresse signifient que le client ne se trouve pas sur la liste noire.

… pour les contrôles PEP et terrorisme

Les réglementations légales exigent la vérification régulière des créanciers et des débiteurs par rapport aux listes dites de terrorisme et de sanctions, ainsi que l’identification des personnes exposées politiquement (PEP). Pour les petites et moyennes entreprises (PME), cette obligation pose un problème car il n’est pas intéressant de se procurer le logiciel correspondant. Ces entreprises peuvent plutôt utiliser les vérifications de la PEP et des listes de sanctions comme un service.

Toutefois, pour des raisons de protection des données, de nombreuses entreprises sont réticentes à communiquer les données de leurs clients hors site. L’alternative consistant à ne communiquer que des données anonymes n’est pas très pratique car elle n’implique généralement pas de contrôles tolérant les erreurs. Mais c’est exactement ce qui est important pour les listes de sanctions, car elles contiennent souvent des erreurs de frappe et de transmission.

… de la recherche

Supposons que des données sur la même personne soient disponibles dans différents ensembles de données, par exemple dans les résultats d’études médicales. La mise en relation personnelle de ces ensembles de données permettrait d’obtenir des informations supplémentaires, mais les obstacles à surmonter sont très importants, notamment en Allemagne. Une procédure acceptée en vertu de la loi sur la protection des données pour de tels cas fait appel à un administrateur qui détermine les données personnelles connexes des différents stocks, mais ne les transmet à l’utilisateur des données que sous forme anonyme ou pseudonyme. Dans ce cas, les fournisseurs de données doivent accorder leur confiance au responsable des données. La protection des données à caractère personnel est encore renforcée si elles ne sont transmises au responsable des données que sous forme anonyme. L’extension de la zone de confiance n’est pas nécessaire dans ce cas. Toutefois, le responsable des données ne serait alors pas en mesure d’effectuer une comparaison tolérante aux erreurs en utilisant les procédures habituelles aujourd’hui. Même des erreurs de frappe mineures empêcheraient d’obtenir les résultats souhaités lors de la comparaison des différents ensembles de données.

La solution

Tous les exemples ont en commun le fait qu’un couplage de données tolérant aux erreurs serait utile, mais cela est difficile en raison de l’anonymisation requise.

TOLERANT Software offre une procédure de comparaison tolérante aux erreurs des données anonymes – même si elles contiennent des erreurs mineures. Les personnes sont donc retrouvées malgré l’anonymat, même s’il y a des écarts dans l’orthographe.

Nous avons intégré une procédure décrite dans la littérature sous le mot-clé « Privacy preserving record linkage » dans notre produit TOLERANT Match , où elle est maintenant disponible en même temps que d’autres procédures de comparaison. À l’avenir, les utilisateurs de TOLERANT Match pourront facilement établir un lien entre la recherche anonyme et la recherche non anonyme dans le cadre d’un processus de mise en correspondance, par exemple pour des données à caractère personnel et d’autres informations moins sensibles.

En plus de l’intégration dans TOLERANT Match, un outil indépendant a été développé pour l’anonymisation des données. Cela permet à une partie A (fournisseur de données) d’effectuer l’anonymisation et de transmettre les données anonymisées à une partie B pour traitement ultérieur.

Toutes les tâches décrites ci-dessus peuvent être réalisées grâce à la nouvelle fonction de TOLERANT Match de telle sorte que les données personnelles des clients, des patients, etc. ne doivent pas quitter la zone de confiance d’une organisation pour être comparées à d’autres bases de données – et pourtant, ces comparaisons peuvent désormais être effectuées de manière tolérante aux erreurs.