Lost in Translation: TOLERANT à Tokyo

Un rapport de terrain
»Lost in Translation« est un long métrage de 2003 avec Bill Murray et Scarlett Johansson. Dans le film, Murray joue le rôle d’un acteur vieillissant qui tourne une publicité à Tokyo. Les indications scéniques qu’il reçoit pendant le tournage sont constamment résumées en une seule phrase par l’interprète. Le contenu réel est perdu dans le processus. Cette scène de « Lost in Translation » détermine donc largement le titre du film.

Le film dépeint Tokyo comme une métropole étrangère qui transforme les étrangers venus d’Europe ou des États-Unis en individus perdus, privés de langue et victimes du décalage horaire. Il a remporté un Academy Award pour le meilleur scénario original en 2004 et Murray a reçu un Golden Globe pour le meilleur acteur dans un rôle principal.

TOLERANT Software à Tokyo
TOLERANT Software est actif sur le marché asiatique depuis 2014. À cela s’ajoutent de nombreuses visites à Tokyo de cadres et de consultants. Alors que le film montre une image plutôt sombre et mélancolique de Tokyo, nos expériences à TOLERANT sont complètement différentes.

Utile et amical au lieu de LOST
Mais il faut d’abord faire les choses. Si vous ne connaissez pas la langue japonaise, il y a un certain nombre de difficultés. Peut-être pas encore à l’arrivée à l’aéroport, car des panneaux en anglais et un grand nombre d’employés de service vous assurent de ne pas vous perdre.

Lors de ma première arrivée à Tokyo, j’ai laissé mon iPad dans l’avion, un peu trop dormi après le long vol. Une interdiction absolue dans un aéroport européen. Dans mon esprit, je pouvais déjà voir une force d’intervention martiale faire exploser l’iPad. Ce n’est pas le cas à Tokyo. Un fonctionnaire sympathique m’a fait passer les contrôles aux frontières et m’a conduit à un bureau de service, où on m’a remis l’iPad cinq minutes plus tard. J’ai eu des expériences similaires dans le métro, à l’hôtel et avec des partenaires commerciaux: la plupart des gens parlent anglais, sont extrêmement amicaux et heureux d’aider.

L’écriture japonaise, l’obstacle fascinant
L’exception est dans le taxi. Ici, vous vous perdrez réellement si vous ne faites pas imprimer au préalable votre destination sur un morceau de papier en caractères japonais. La plupart des chauffeurs de taxi ne parlent pas anglais et ont souvent des problèmes avec les minuscules.

Et c’est probablement l’écriture japonaise qui contribue à l’exotisme de l’État insulaire pour nous, Européens. Contrairement à l’écriture chinoise, vous devez apprendre non pas un, mais trois écritures: Kanji, Hiragana et Katakana. C’est pourquoi le japonais est considéré comme le système d’écriture le plus difficile au monde.

Le défi: la migration des données vers le Japon
Si vous réalisez un projet de migration de données au Japon, comme nous l’avons souvent fait chez TOLERANT ces dernières années, la première étape consiste à prendre soin des particularités des systèmes d’écriture. En général, les noms des clients japonais ne sont pas seulement en Kanji, mais aussi en Kana. Avec la simplification que les données sont stockées séparément. Les adresses, en revanche, en particulier les ajouts d’adresses, se trouvent dans de nombreux ensembles de données sous une forme mixte Kanji/Kana.

Ensemble de données typiquement japonais (nom seulement):

Tableau des données d'adresse Kanji et Kana

Du point de vue de la qualité des données, le stockage en double des noms des clients dans des systèmes de type différent introduit toute une série de sources d’erreur potentielles. Les questions les plus courantes dans ce contexte sont les suivantes:

  • Les champs sont-ils complètement remplis?
  • Les champs sont-ils remplis avec le système d’écriture correct?
  • Les noms sont-ils correctement orthographiés?
  • Les noms et prénoms ont-ils été échangés?

Double contrôle également pour les Kanji et les Kana
Comme vous pouvez le voir « facilement », le prénom et le nom de famille dans l’exemple ci-dessus sont échangés dans le système d’écriture Kana. Pour un double contrôle classique ou même pour la salutation correcte d’une lettre, cela signifie rapidement: « Lost in Translation »!

Heureusement pour nos projets de migration, TOLERANT Match maîtrise le contrôle des doublons dans les jeux de caractères asiatiques les plus divers avec précision et tolérance aux erreurs. Les puissants algorithmes de recherche trouvent les enregistrements qui correspondent en fonction d’un ensemble de règles spécifiques au client qui ont été précisément adaptées à la migration des données. La comparaison des doublons tolérante aux erreurs tient également compte des erreurs d’orthographe et de frappe pour les kanji et les kana ou des mots échangés pour les noms et les adresses.

Des algorithmes puissants pour des projets de migration de données réussis
Le contrôle des doublons joue toujours un rôle central dans un projet de migration. Les données provenant d’une grande variété de sources doivent être fusionnées dans un nouveau pool de données. Les sources ne sont pas liées entre elles et ne le sont que par le biais du contrôle des doublons. Plus les algorithmes sont puissants à ce stade, plus le projet dans son ensemble sera couronné de succès à la fin.

Les outils TOLERANT normalise les contrôles DQ, contrôles les adresses postales, dédupliquent les données et les consolident et enrichissent.

Stefan Sedlacek

Vous souhaitez en savoir plus ? Dans ce cas, nous nous réjouissons de votre e-mail à info@tolerant-software.de ou de votre appel au +49 711 400 4250.