¿Cómo se crean los duplicados?

Los calcetines desaparecen en las lavadoras, los duplicados se crean en los ordenadores. La vida fantasmal de la materia es probablemente uno de los últimos grandes misterios de la existencia. Pero mientras que los calcetines perdidos suelen permanecer perdidos para siempre en el orco de lo insondable, la ciencia moderna ya puede entender bastante bien la aparición de los dobletes.

La aparición de duplicados suele tener que ver con el origen de las direcciones. La mayoría de las bases de datos se alimentan de tres fuentes:

  • Los usuarios que introducen las direcciones individualmente (por ejemplo, en la tienda web o en el diálogo de entrada de datos).
  • Procesos que deben actualizar el conjunto de datos de forma regular (por ejemplo, comparación con los datos de reubicación o comprobación de la actualización de la calle, el código postal o la ciudad)
  • Las existencias de terceros que se transfieren al conjunto de datos por comparación de archivos (por ejemplo, compra de direcciones de terceros o transferencia desde otros sistemas)

Empecemos por el usuario. A menudo, los duplicados se producen porque los usuarios no buscan los duplicados existentes de forma selectiva, ya sea por comodidad o por falta de los procedimientos de búsqueda inteligente necesarios. Ejemplo: aceptación del pedido por teléfono:

Llama un cliente de hace tiempo, llamémosle Kowalczik. Su nombre no se entiende correctamente o se introduce de forma incorrecta. El sistema compara la entrada con la base de datos de direcciones e informa: no hay respuesta. Así, el cliente real obtiene un doble virtual, del que nadie se da cuenta, y el desastre sigue su curso…

Las existencias de datos se vuelven obsoletas. Si no los mantienes, te metes rápidamente en un desastroso embrollo de información medio correcta y medio errónea. Cuando un municipio cambia el nombre de las calles, por ejemplo, aparecen nuevas direcciones postales, y un cliente conocido y registrado durante mucho tiempo recibe por error un doble electrónico.

O algo parecido: alguien se cambia de casa, informa a sus socios comerciales y éstos introducen por error sus datos en el apartado «nuevo cliente». Si a esto se le añade un registro de datos generado automáticamente a partir de una comparación de reubicación, la persona en cuestión ya existe tres veces en la misma base de datos. Uno prefiere no imaginar el caos resultante.

La única manera de evitar este problema es utilizar una búsqueda difusa y una coincidencia regular de duplicados en toda la base de datos de direcciones, especialmente después de cada actualización con datos de referencia externos, como directorios de calles o datos de reubicación.

Lo mejor de esto es que no tiene que hacerlo solo: nuestro software hace la mayor parte del trabajo por usted.