Comment les doublons sont-ils créés?

Les chaussettes disparaissent dans les machines à laver, les doublons sont créés dans les ordinateurs. La vie fantomatique de la matière est probablement l’un des derniers grands mystères de l’existence. Mais alors que les chaussettes manquantes restent généralement perdues à jamais dans l’orcus de l’insondable, la science moderne peut déjà comprendre assez bien l’apparition des doublons.

L’apparition de doublons est souvent liée à l’origine des adresses. La plupart des bases de données sont alimentées par trois sources:

  • Utilisateurs saisissant des adresses individuellement (par exemple, boutique en ligne ou dialogue de saisie de données)
  • Les processus qui sont censés mettre à jour l’ensemble de données sur une base régulière (par exemple, comparaison avec les données de relocalisation ou vérification de la mise à jour de la rue, du code postal ou de la ville)
  • Les stocks de tiers qui sont transférés dans l’ensemble de données par comparaison de fichiers (par exemple, achat d’adresses de tiers ou transfert à partir d’autres systèmes)

Commençons par l’utilisateur. Souvent, les doublons se produisent parce que les utilisateurs ne recherchent pas les doublons existants de manière ciblée – soit par commodité, soit parce que les procédures de recherche intelligente nécessaires font défaut. Exemple: acceptation d’une commande par téléphone:

Un client de longue date appelle, appelons-le Kowalczik. Son nom n’est pas compris correctement ou est mal saisi. Le système compare l’entrée avec la base de données des adresses et signale: pas de correspondance. Le client réel reçoit donc un sosie virtuel, que personne ne remarque, et le désastre suit son cours …

Les stocks de données deviennent obsolètes. Si vous ne les maintenez pas, vous vous retrouvez rapidement dans un fouillis désastreux d’informations à moitié correctes, à moitié fausses. Lorsqu’une municipalité change le nom des rues, par exemple, de nouvelles adresses postales apparaissent – et un client connu et enregistré depuis longtemps reçoit par erreur un sosie électronique.

Ou, tout aussi délicat: quelqu’un déménage, informe ses partenaires commerciaux et ceux-ci saisissent par erreur ses données sous la rubrique « nouveau client ». Ajoutez à cela un enregistrement de données généré automatiquement par une comparaison de déménagement, et la personne en question existe déjà trois fois dans la même base de données. On préfère ne pas imaginer le chaos qui en résulterait.

La seule façon d’éviter ce problème est d’utiliser une recherche floue et une correspondance régulière des doublons dans l’ensemble de la base de données d’adresses, en particulier après chaque mise à jour avec des données de référence externes telles que des annuaires de rues ou des données de déménagement.

La beauté de la chose, c’est que vous n’avez pas à vous débrouiller tout seul: notre logiciel fait la majeure partie du travail pour vous.