Lost in Translation: TOLERANT in Tokio

Ein Erfahrungsbericht
»Lost in Translation« ist ein Spielfilm aus dem Jahre 2003 mit Bill Murray und Scarlett Johansson in den Hauptrollen. Murray spielt in dem Film einen alternden Schauspieler, der in Tokio einen Werbespot dreht. Die Regieanweisungen, die er während des Drehs bekommt, werden von der Dolmetscherin immer wieder zu einem Satz zusammengefasst. Der eigentliche Inhalt geht dabei verloren. Diese »Lost in Translation«-Szene bestimmt damit maßgeblich den Titel des Filmes.

Der Film zeichnet Tokio als eine fremde Metropole, die Ausländer aus Europa oder den USA zu Jetlag geplagten, verlorenen und der Sprache beraubten Individuen macht. Er erhielt 2004 einen Oscar für das Beste Originaldrehbuch, Murray wurde mit einem Golden Globe als Bester Hauptdarsteller ausgezeichnet.

TOLERANT Software in Tokio
TOLERANT Software ist seit 2014 auf dem asiatischen Markt tätig. Verbunden damit sind viele Besuche der Geschäftsführung und der Consultants in Tokio. Während der Film ein eher düsteres, melancholisches Bild von Tokio zeigt, sind die unsere Erfahrungen bei TOLERANT komplett anders.

Hilfsbereit und freundlich statt LOST
Aber der Reihe nach. Solange man der japanischen Sprache nicht mächtig ist, gibt es eine Reihe von Schwierigkeiten. Vielleicht noch nicht bei der Ankunft am Flughafen, denn Hinweisschilder in Englisch und eine große Anzahl von Servicekräften sorgen dafür, dass man nicht verloren geht.

Bei meiner ersten Ankunft in Tokio habe ich leicht übernächtigt von dem langen Flug mein iPad im Flugzeug liegen lassen. Ein absolutes No-Go an einem europäischen Flughafen. In Gedanken sah ich schon ein martialisches Einsatzkommando das iPad in die Luft sprengen. Nicht so in Tokio. Ein freundlicher Beamter schleuste mich zurück durch die Grenzkontrollen und führte mich zu einem Serviceschalter, an dem man mir fünf Minuten später das iPad überreichte. Ähnliche Erfahrungen gab es auch in der U-Bahn, im Hotel und mit Geschäftspartnern: Die meisten Leute sind der englischen Sprache mächtig, überaus freundlich und gerne bereit, zu helfen.

Japanische Schrift, die faszinierende Hürde
Die Ausnahme erlebt man im Taxi. Hier geht man tatsächlich verloren, wenn man zuvor sein Fahrtziel nicht in japanischen Zeichen auf einen Zettel gedruckt bereithält. Die meisten Taxifahrer sprechen kein Englisch und haben auch häufig mit kleiner Schrift ihre Probleme.

Und vermutlich ist es gerade die japanische Schrift, die für uns Europäer zum exotischen Flair des Inselstaates beiträgt. Setzt man sich mit ihr auseinander, muss man – anders als bei der chinesischen Schrift – nicht nur eine, sondern gleich drei Schriftarten lernen: Kanji, Hiragana und Katakana. Deswegen gilt das japanische als das schwierigste Schriftsystem der Welt.

Die Herausforderung: Datenmigration auf Japanisch
Führt man in Japan nun ein Datenmigrationsprojekt durch, so wie wir das bei TOLERANT in den letzten Jahren häufig getan haben, so muss man sich im ersten Schritt um die Besonderheiten der Schriftsysteme kümmern. Typischerweise liegen japanische Kundennamen nicht nur in der Kanji-Schreibweise vor, sondern zusätzlich noch in Kana. Mit der Vereinfachung, dass die Daten getrennt abgelegt werden. Adressen wiederum, besonders auch Adresszusätze, findet man dagegen in vielen Datenständen in gemischter Kanji/Kana-Form.

Typischer japanischer Datensatz (nur Name):

Japanischer Datensatz

Die doppelte Ablage von Kundennamen in unterschiedlichen Schriftsystemen bringt aus Datenqualitätssicht eine ganze Menge möglicher Fehlerquellen mit sich. Die häufigsten Fragen in diesem Zusammenhang sind:

  • Sind die Felder vollständig befüllt?
  • Sind die Felder mit dem richtigen Schriftsystem befüllt?
  • Sind die Namen korrekt geschrieben?
  • Wurden Vor- und Nachname vertauscht?

Dublettenprüfung auch für Kanji und Kana
Wie man „unschwer“ erkennen kann, sind Vorname und Nachname im obigen Beispiel im Kana-Schriftsystem vertauscht. Für eine konventionelle Dublettenprüfung oder auch für die korrekte Briefanrede heißt es hier schnell: „Lost in Translation“!
Zum Glück für unsere Migrationsprojekte beherrscht TOLERANT Match die Dublettenprüfung in den verschiedensten asiatische Zeichensätzen treffsicher und fehlertolerant. Die leistungsfähigen Suchalgorithmen finden Datensätze, die zusammenpassen, anhand eines kundenspezifischen Regelwerkes, welches genau auf die Datenmigration abgestimmt wurde. Der fehlertolerante Abgleich des Dublettenmatchings berücksichtigt dabei auch für Kanji und Kana Schreib- und Tippfehler oder vertauschte Wörter bei Namen und Adressen.

Leistungsfähige Algorithmen für erfolgreiche Datenmigrationsprojekte
Dabei spielt die Dublettenprüfung in einem Migrationsprojekt immer eine zentrale Rolle. Daten müssen aus verschiedensten Quellen zu einem neuem Datentopf zusammengeführt werden. Die Quellen sind untereinander nicht verknüpft und bekommen die Verknüpfung erst über die Dublettenprüfung. Je leistungsfähiger die Algorithmen an dieser Stelle sind, desto erfolgreicher ist das gesamte Projekt am Ende.

Datenmigration

Stefan Sedlacek

Möchten Sie mehr erfahren? Dann freuen wir uns auf Ihre E-Mail an info@tolerant-software.de oder Ihren Anruf unter Tel. +49 711 400 4250.