Lost in Translation: TOLERANT en Tokio

Un informe de campo

«Lost in Translation» es un largometraje de 2003 protagonizado por Bill Murray y Scarlett Johansson. En la película, Murray interpreta a un actor envejecido que está rodando un anuncio en Tokio. Las indicaciones escénicas que recibe durante el rodaje son resumidas repetidamente en una frase por el intérprete. El contenido real se pierde en el proceso. Esta escena de «Lost in Translation» determina en gran medida el título de la película.

La película retrata a Tokio como una metrópolis extranjera que convierte a los extranjeros procedentes de Europa o Estados Unidos en individuos perdidos y con jet-lag, privados del idioma. Ganó el Oscar al mejor guión original en 2004, y Murray fue galardonado con el Globo de Oro al mejor actor principal.

TOLERANT Software en Tokio

TOLERANT Software está presente en el mercado asiático desde 2014. A ello se suman las numerosas visitas de directivos y asesores a Tokio. Mientras que la película muestra una imagen bastante sombría y melancólica de Tokio, nuestras experiencias en TOLERANT son completamente diferentes.

Útil y amigable en lugar de LOST

Pero lo primero es lo primero. A menos que se conozca el idioma japonés, hay varias dificultades. Tal vez todavía no al llegar al aeropuerto, ya que las señales en inglés y un gran número de personal de servicio garantizan que no se pierda.

A mi primera llegada a Tokio, dejé mi iPad en el avión, ligeramente dormido por el largo vuelo. Un absoluto no-go en un aeropuerto europeo. En mi mente, ya podía ver a un grupo de trabajo marcial explotando el iPad. No así en Tokio. Un amable funcionario me hizo pasar de nuevo por los controles fronterizos y me condujo a un mostrador de servicio, donde me entregaron el iPad cinco minutos después. Tuve experiencias similares en el metro, en el hotel y con los socios comerciales: la mayoría de la gente habla inglés, es extremadamente amable y está encantada de ayudar.

La escritura japonesa, un obstáculo fascinante

La excepción está en el taxi. Aquí, realmente se perderá si no tiene su destino impreso en un papel en caracteres japoneses de antemano. La mayoría de los taxistas no hablan inglés y suelen tener problemas con las letras pequeñas.

Y probablemente sea la escritura japonesa la que contribuya a dar un toque exótico al estado insular para nosotros los europeos. A diferencia de la escritura china, hay que aprender no sólo una, sino tres escrituras: Kanji, Hiragana y Katakana. Por eso el japonés se considera el sistema de escritura más difícil del mundo.

El reto: la migración de datos al japonés

Si lleva a cabo un proyecto de migración de datos en Japón, como hemos hecho frecuentemente en TOLERANT en los últimos años, el primer paso es ocuparse de las características especiales de los sistemas de escritura. Normalmente, los nombres de los clientes japoneses no sólo se escriben en kanji, sino también en kana. Con la simplificación de que los datos se almacenan por separado. Por otro lado, las direcciones, especialmente las adiciones de direcciones, se encuentran en muchos conjuntos de datos en forma mixta kanji/kana.

Típico disco japonés (sólo el nombre):

Desde el punto de vista de la calidad de los datos, el almacenamiento duplicado de los nombres de los clientes en diferentes sistemas de escritura introduce toda una serie de posibles fuentes de error. Las preguntas más comunes en este contexto son:

¿Están los campos completamente rellenados?
¿Están los campos rellenados con el sistema de escritura correcto?
¿Los nombres están bien escritos?
¿Se han intercambiado los nombres y apellidos?

Comprobación de duplicados también para kanji y kana
Como puede ver «fácilmente», el nombre y el apellido en el ejemplo anterior están intercambiados en el sistema de escritura Kana. Para una comprobación convencional de duplicados o incluso para el saludo correcto de una carta, esto significa rápidamente: «Lost in Translation».

Afortunadamente para nuestros proyectos de migración, TOLERANT Match domina la comprobación de duplicados en los más diversos conjuntos de caracteres asiáticos con precisión y tolerancia a los errores. Los potentes algoritmos de búsqueda encuentran los registros que coinciden basándose en un conjunto de reglas específicas del cliente que se han ajustado con precisión a la migración de datos. El cotejo de duplicados tolerante a los errores también tiene en cuenta los errores ortográficos y de escritura de kanji y kana o las palabras intercambiadas de nombres y direcciones.

Potentes algoritmos para el éxito de los proyectos de migración de datos
La comprobación de duplicados siempre desempeña un papel fundamental en un proyecto de migración. Los datos procedentes de una gran variedad de fuentes deben fusionarse en un nuevo conjunto de datos. Las fuentes no están vinculadas entre sí y sólo lo están a través de la comprobación de duplicados. Cuanto más potentes sean los algoritmos en este punto, más éxito tendrá al final todo el proyecto.

Migración de datos con herramientas TOLERANT - Convertir los datos de entrada - Normalización de los controles DQ

Stefan Sedlacek

¿Quiere saber más? Entonces esperamos recibir su correo electrónico en info@tolerant-software.de o su llamada al teléfono +49 711 400 4250.