Glossar

A

Korrekte und aktuelle postalische Adressen und E-Mail-Adressen sind die Grundvoraussetzung für einen erfolgreichen Kundendialog. Rückläufer und nicht zustellbare Sendungen verursachen hohe Kosten. Eine regelmäßige Überprüfung und Bereinigung des Bestands and postalischen Adressen und E-Mail-Adressen hilft dabei, solche Kosten zu reduzieren. Diese Aufgaben unterstützen Datenqualitätswerkzeuge wie TOLERANT Post, TOLERANT Move und TOLERANT Match. Die Tools gleichen postalische Adressen mit Adress- und Umzugsdaten der Deutschen Post ab und prüfen die Zustellbarkeit von E-Mail-Adressen. Mithilfe der fehlertoleranten Suche werden Dubletten und Duplikate auch bei ähnlicher Schreibweise erkannt und bereinigt.

Die Europäische Union verbietet Geschäftsbeziehungen mit Terroristen und mit Anhängern extremistischer Gruppierungen. Wer zu diesen Gruppierungen gehört, geht aus Anti-Terror-Listen, Sanktionslisten oder Embargolisten hervor, die die EU regelmäßig aktualisiert. Mit dem Tool TOLERANT Sanction kann der Kundenbestand automatisiert mit Anti-Terror-, Sanktions- und Embargolisten abgeglichen werden. Die gefundenen Treffer sind dann durch die jeweilig verantwortlichen Abteilungen zu bewerten.

Die Erhebung, Verarbeitung und Nutzung personenbezogener Daten wird in Deutschland durch §11 des Bundesdatenschutzgesetzes (BDSG) geregelt. Wenn Daten im Auftrag von Dritten erhoben, verarbeitet oder genutzt werden, müssen die Geschäftspartner eine Auftragsdatenverarbeitungsvereinbarung (AVV) treffen. Gemäß §9 BDSG werden in einer solchen Vereinbarung auch die technisch-organisatorischen Maßnahmen für die Datenverarbeitung festgelegt. Für den Einsatz von TOLERANT Software-Produkten sollten Geschäftspartner ebenfalls einen Vertrag zur Auftragsdatenverarbeitung mit ihrem Softwarelieferanten abschließen, wenn „die Prüfung oder Wartung automatisierter Verfahren oder von Datenverarbeitungsanlagen durch andere Stellen im Auftrag vorgenommen wird und ein Zugriff auf personenbezogene Daten nicht ausgeschlossen werden kann“ (§ 11 Abs. 5 BDSG).

B

TOLERANT-Produkte bieten zwei grundsätzliche Nutzungsarten: die Batch-Variante, die offline durchgeführt werden kann, und die Service-Variante, die online durchgeführt wird.

Wenn viele Datensätze in einem einzigen Prozess-Schritt verarbeitet werden, spricht man von einem Batch (‘Stapel-Verarbeitung’). Ursprünglich stammt der Begriff von der automatisierten Verarbeitung eines Lochkarten-Stapels. Heute wird damit die unbeaufsichtigte Verarbeitung einer meist großen Datenmenge nach einem einheitlichen Verarbeitungsmuster bezeichnet. Im Batch-Modus können demnach große Datenbestände schnell miteinander verglichen werden.

Die Service-Variante wird online über eine API-Schnittstelle verarbeitet und wird deshalb auch als API-Modus bezeichnet. Die Abkürzung API steht für ‘Application Programming Interface’, also für eine Schnittstelle zur Anwendungsprogrammierung.

In der Praxis wird der Service- bzw. API-Modus in der Regel dann verwendet, wenn es um die direkte Integration in eine Anwendung geht. Also wenn beispielsweise Adressdaten unmittelbar während ihrer Eingabe ins CRM-System geprüft werden sollen. Auch für Einzelabfragen wird üblicherweise der API-Modus in Form eines Webservice genutzt, während der gesamte Datenbestand in regelmäßigen Intervallen im Batch-Modus überprüft und bereinigt wird.

Bankdaten wie IBAN und BIC können mit der Validierungssoftware TOLERANT Bank schon bei der Erfassung automatisch geprüft und korrigiert werden.

Der Bank Identifier Code (BIC) ist eine international gültige Bankleitzahl und wird von der Society for Worldwide Interbank Financial Telecommunication (SWIFT) vergeben und festgelegt.

C

Beim Cloud Computing werden Softwareprogramme oder Datenspeicher auf externen Servern bereitgestellt und virtuell über das Internet genutzt. Im Gegensatz dazu werden Daten auf On-Premise-Servern lokal und vor Ort gespeichert.
Produkte von TOLERANT Software sind komplett cloudfähig und können auf der Cloudplattform des Kunden betrieben werden. Darüber hinaus bietet TOLERANT Software einige Produkte auch als Cloud-Dienst bzw. Software as a Service (SaaS) an. Der SaaS-Service eignet sich insbesondere für den fehlertoleranten Datenabgleich mit PEP-Listen (TL Cloud PEP), mit Sanktionslisten (TL Cloud Sanction), mit Firmendaten (TL Cloud Business), mit Adressdaten (TL Cloud Post) sowie mit Bankdaten (TL Cloud Bank).

Um gesetzliche Vorschriften (wie beispielsweise Vorgaben der EU-DSGVO) oder andere externe Regularien einhalten zu können, werden im Unternehmen einheitliche Standards eingeführt und umgesetzt. Die Umsetzung dieser Mechanismen kann von Datenqualitätswerkzeugen wie TOLERANT MPM, TOLERANT PEP oder TOLERANT Sanction unterstützt werden.

Ein Customer-Relationship-Management-System (kurz: CRM-System) organisiert und verwaltet die Beziehung eines Unternehmens zu seinen Kunden. Üblicherweise werden in einem CRM-System Kundendaten zusammen mit der Kontakt- und Verkaufshistorie abgelegt. Jede Interaktion mit dem Kunden wird im CRM-System dokumentiert. Alle Unternehmens­abteilungen, die Zugriff zum CRM-System haben, können das System nutzen, um den Kunden damit zu betreuen und mit ihm zu interagieren.

D

Data Stewards sind für die Datenqualität in einer spezifischen Unternehmensabteilung verantwortlich. Gemeinsam mit dem abteilungsübergreifenden Datenqualitätsmanager koordinieren Data Stewards die Überwachung der Datenqualität in einem Unternehmen.

siehe unter ETL-Prozesse

Die Qualität von Daten spiegelt sich in ihrem Nutzen wider. Daten sind dann gut, wenn sie den Zweck erfüllen, für den sie generiert wurden. Wichtige Kriterien zur Bewertung der Datenqualität sind beispielsweise die Korrektheit, die Vollständigkeit, die Konsistenz, die Relevanz und die Aktualität.

Ein Datenqualitätsmanager hat eine zentrale Rolle in einem Unternehmen inne. Gemeinsam mit den abteilungsinternen Data Stewards sichert der Datenqualitätsmanager die Datenqualität in einem Unternehmen. Bei Problemen vermittelt er zwischen dem IT-Administrator und den Data Stewards.

Die europäische Datenschutzgrundverordnung (EU-DSGVO) trat am 25. Mai 2018 in Kraft. Sie vereinheitlicht den Umgang mit personenbezogenen Daten und schützt natürliche Personen, deren personenbezogene Daten von Dritten verarbeitet werden.

Gemäß Artikel 15 der DSGVO haben betroffene Personen beispielsweise das Recht, bei Verantwortlichen nachzufragen, ob ihre personenbezogenen Daten verarbeitet werden. Die Verantwortlichen sind verpflichtet, solche Datenschutzanfragen zeitnah zu beantworten.

Gemäß Artikel 12, Absatz 1 und Artikel 5, Absatz 2 der DSGVO müssen sich Verantwortliche auf solche Anfragen vorbereiten und entsprechende Maßnahmen treffen, um betroffenen Personen fristgerecht antworten zu können. Ergänzt und präzisiert wird die DSGVO in Deutschland durch das Bundesdatenschutzgesetz (BDSG).

Das Produkt TOLERANT MPM von TOLERANT Software hilft Unternehmen dabei, Datenschutzanfragen lückenlos und rechtssicher zu beantworten.

Werbesperrlisten schützen Verbraucher vor unerwünschten Werbezusendungen. Darunter fallen beispielsweise die Robinsonlisten des Interessensverbands Deutsches Internet (I.D.I. e.V.) oder des Deutschen Dialogmarketing Verbands (DDV). Mit dem Datenqualitätstool TOLERANT MPM lassen sich Kundendaten mit solchen Dialogverbotslisten abgleichen.

Die Open-Source-Software Docker verpackt Software in Container. Diese kompakten Einheiten enthalten alles, was für den Betrieb der Software gebraucht wird, also beispielsweise Bibliotheken, Systemtools, Codes und Laufzeiten. Ähnlich wie Frachtcontainer auf einem Frachtschiff können Software-Container an einen Docker-Host angedockt und horizontal skaliert werden. Horizontal skalierte Container können modular, also nebeneinander und unabhängig voneinander betrieben werden, wenn sie gerade gebraucht werden. Der Einsatz von Docker Containern ist u.a. dann sinnvoll, wenn kurzfristig eine große Rechenleistung benötigt wird. Die zusätzliche Rechenleistung kann auf Docker Container verlagert werden. Weiterhin vereinfachen Docker Container die Installation und Aktualisierung von Software. Auch TOLERANT Software-Produkte können in Docker Containern geliefert und betrieben werden.

Ein DQ-Connector ist eine Schnittstelle zwischen einem CRM- oder ERP-System und Datenqualitätswerkzeugen. Datenqualitätswerkzeuge übernehmen unterschiedliche Aufgaben zur Qualitätssicherung bei der Erfassung und Bearbeitung von Kundendaten. So können z.B. Kunden unscharf gesucht werden. Adressen können per Autovervollständigung gefunden, geprüft und vervollständigt werden. Vor Speicherung kann nochmals überprüft werden, dass keine Dubletten angelegt werden. Der DQ-Connector sorgt dafür, dass das CRM- oder ERP-System dublettenfrei bleibt und korrekte Daten eingegeben werden.

siehe unter DQ-Issue-Management

Das DQ-Issue-Management ist ein Prozess zur Behebung von Datenqualitätsproblemen (DQ-Issues). Dazu gehören beispielsweise ungültige postalische Adressen, Fehler in der Schreibweise, Dubletten, oder unvollständige Datensätze. Diese Qualitätsfehler werden in einem strukturierten Prozess gemessen, bewertet und korrigiert. Beim DQ-Issue-Management werden automatisierte Messwerkzeuge, Prozesssteuerung und manuelle Prüfschritte miteinander kombiniert. Als Basis für das DQ-Issue-Management dienen Tools von TOLERANT Software.

Dubletten sind doppelte Datensätze zur selben Person oder Firma, die sich in geringfügigen Merkmalen (z.B. abweichende Schreibweise, unterschiedliche Adressdaten) unterscheiden. Mittels fehlertoleranter Suche kann man Dubletten schon bei der Dateneingabe identifizieren und bereinigen. Das Tool TOLERANT Match unterstützt dabei, Dubletten beim Zusammenführen großer Datenbestände automatisch zu erkennen und zu bereinigen.

siehe unter Dubletten

E

siehe unter Anti-Terror-Listen

Ein Enterprise-Resource-Planning-System ist ein softwarebasiertes Warenwirtschaftssystem, das die Prozesse in einem Unternehmen abbildet. Für die Planung, Steuerung und Verwaltung der Prozesse  werden auch Kundendaten benötigt. Über Schnittstellen können Datenqualitätsprodukte wie TOLERANT Match oder TOLERANT Name an gängige ERP-Systeme gekoppelt werden. Auf diese Weise lassen sich Fehler bei Kundenansprache auf Angeboten, Auftragsbestätigungen und Rechnungen gänzlich vermeiden oder reduzieren.

Die Abkürzung ETL bezeichnet die drei Datenmigrations-Prozesse Extraktion (E), Transformation (T) und Laden (L). Wenn Daten von einem System ins andere überführt werden, so werden in der Regel diese drei Prozesse durchlaufen. ETL-Prozesse sind batch-orientiert; ihre Datenaktualität ist daher begrenzt.

F

Die fehlertolerante Suche wird im Software-Fachjargon auch „unscharfe Suche“ oder „fuzzy search“ genannt. Beim fehlertoleranten Suchen werden ähnliche Schreibweisen berücksichtigt. Besonders nützlich ist das bei schwierig zu schreibenden Namen, deren Schreibweise stark von der Aussprache abweicht, oder bei unvollständigen Informationen. In der Trefferliste werden dann alle Begriffe angezeigt, die gemeint sein könnten. Wer beispielsweise nach „Szymanski“ sucht, findet dank fehlertoleranter Suche auch „Schimanski“ und „Sczymansky“ in der Ergebnisliste.

I

Die IBAN ist eine standardisierte, internationale Schreibweise für Kontonummern. Sie wurde eingeführt, um den internationalen Zahlungsverkehr zur vereinheitlichen.

In einem systemübergreifenden Such- bzw. Kundenindex werden Daten aus verschiedenen Quellen und Systemen zentral zusammengeführt. Der Index beschleunigt systemübergreifende Recherchen und Suchanfragen, denn dadurch erübrigt sich die separate Suche in den einzelnen Systemen. Eine zentrale Suche in einem systemübergreifenden Index ist – unseren Schätzungen zufolge – im Durchschnitt 60 Mal schneller als eine herkömmliche Suche in mehreren Systemen. Der systemübergreifende Suchindex ist im Produkt TOLERANT Match enthalten.

K

Die Kölner Phonetik ist ein Computeralgorithmus, der jedem sprachlichen Laut eines Wortes eine Ziffer zuordnet. Die Kodierung von Text in Ziffern dient dazu, Wörter anhand ihres Klangs zu klassifizieren. Mithilfe der Kölner Phonetik erkennt ein Computer, welche Wörter ähnlich klingen. Der Algorithmus befähigt den Computer dazu, Datenbestände fehlertolerant zu durchsuchen und bei Eingabe eines Wortes auch ein ähnlich klingendes Wort zu finden. Im Gegensatz zu den Verfahren Soundex und Metaphone, die für den englischen Sprachraum konzipiert wurden, wurde die Kölner Phonetik auf den deutschen Sprachraum abgestimmt. Die Kölner Phonetik kodiert Konsonanten mit den Ziffern 1 bis 8. Vokale erhalten die Ziffer 0. Bei der Zuordnung einer Ziffer zu einem sprachlichen Laut werden auch benachbarte Buchstaben berücksichtigt. So wird der Buchstabe P beispielsweise mit der Ziffer 3 kodiert, wenn er vor einem H steht. In allen anderen Fällen wird er dem Kode 1 zugeordnet. Die Kölner Phonetik kommt zusammen mit Soundex und Metaphone im Dublettenprüftool TL Match zum Einsatz. Dank der integrierten Algorithmen findet TL Match den Datensatz „Alexander Sczepansky“ beispielsweise auch dann, wenn nach „Alex Schepanski“ gesucht wurde.

L

Milieu und Lebensstil spielen eine bedeutende Rolle bei einer Kaufentscheidung. Für den Vertrieb lohnt es sich also, hier genauer hinzuschauen und Zielgruppen anhand ihrer Lifestyledaten zu klassifizieren, um genau die richtigen potenziellen Interessenten anzusprechen. Das Datenqualitätswerkzeug TOLERANT Post nutzt CAMEO-Lifestyledaten der Deutschen Post Direkt GmbH. Anhand von CAMEO-Daten lassen sich Wohnumfelder mikrogeografisch segmentieren und nach sozialer Schicht, Finanzkraft und Lebensphase klassifizieren. Die Lifestyledaten helfen dabei, Zielgruppen spezifisch zu typologisieren, Potenziale zu erkennen und auf diese Weise langfristig Marktanteile zu erhöhen. CAMEO-Daten sind für viele europäische und internationale Länder verfügbar. Für Deutschland umfassen sie über 40 Merkmale zur regionalen und soziodemografischen Differenzierung. Diese Merkmale sind wiederum in 9 Hauptgruppen zusammengefasst, so dass Lebenswelten, Konsumverhalten und Interessen der einzelnen Gruppen deutlich voneinander unterscheidbar sind.

M

siehe unter Lifestyledaten

N

siehe unter Parsing

O

siehe unter Cloud Computing

P

Beim Parsing werden Freitextfelder – wie z.B. Namen – in Bestandteile wie Anrede, Titel, Vorname und Nachname aufgespalten. Datenqualitätstools wie TOLERANT Name erledigen das Parsing automatisch. So trennt TL Name die Eingabe „Frau Dr. Alexandra Schellenberger“ beispielsweise automatisch in Anrede („Frau“), Titel („Dr.“), Vorname („Alexandra“) und Nachname („Schellenberger“) auf. Die automatische Analyse, Standardisierung und Strukturierung der Namensbestandteile helfen dabei, Fehler in der Adressierung zu vermeiden und den Kunden korrekt anzusprechen.

Bei der Partitionierung werden die Datensätze einer großen Datenmenge mit gleichartig ausgeprägten Merkmalen in Teilbereiche (englisch Partition) aufgeteilt, in denen dann die Suche ausgeführt wird. Typische Merkmale, die sich für die Partitionierung eignen, sind beispielsweise die Postleitzahl, Telefon-Vorwahl, E-Mail-Domain oder das Geburtsdatum. Die Merkmale sollten für eine Partitionierung lückenlos von allen Kunden vorliegen. Die Partitionierung hat den Vorteil, dass sie die Suche nach Daten beschleunigt, weil dann nur relevante Teilbereiche und nicht der Gesamtbestand durchsucht werden müssen. Die relevanten Teilbereiche ergeben sich aufgrund der Werte im Suchfeld.
Dieses
Schaubild stellt den Vorgang der Partitionierung grafisch dar.

Politisch exponierte Personen (PEP) sind natürliche Personen, wie beispielsweise Politiker, die einen besonders einflussreichen Posten innehaben. Um Korruption und Bestechung zu vermeiden, haben Unternehmen gemäß der Anti-Geldwäsche-Richtlinie der EU eine besondere Sorgfaltspflicht beim Umgang mit PEP. Sie sind beispielsweise dazu verpflichtet, PEP in ihrem Kundenstamm zu identifizieren. Das Tool TOLERANT PEP gleicht den Kundenbestand automatisch mit international gültigen PEP-Listen ab.

Eine postalische Adresse sollte maschinenlesbar sein, damit Sendungen ohne Verzögerung zugestellt werden können. Internationale Normen wie die ISO 19160-4 und die deutsche Norm DIN 5008 standardisieren den korrekten Aufbau, die Schreibweise und die Bestandteile einer postalischen Anschrift. Demzufolge besteht eine postalische Adresse in Deutschland aus Firma und/oder Ansprechpartner, Straße und Hausnummer (oder Postfach), Postleitzahl und Bestimmungsort. Bei internationalen Adressen ist ein Ländercode vor der Postleitzahl nicht mehr üblich. Gemäß der aktualisierten Norm DIN 5008 wird der Ländername auf Deutsch, Englisch oder Französisch in Großbuchstaben unter Postleitzahl und Bestimmungsort gesetzt. Leerzeilen zwischen den einzelnen Adressbestandteilen sind ebenfalls nicht mehr gebräuchlich.

Vertrauliche Kundendaten werden zwischen Geschäftspartner oftmals pseudonymisiert ausgetauscht – beispielsweise um das Geschäftsgeheimnis zu bewahren oder aus Sicherheitsgründen. Bei der Pseudonymisierung werden personenbezogene Merkmale wie Name, Anschrift oder Telefonnummer durch Pseudonyme ersetzt. Das Datenqualitätstool TOLERANT Match kann auch vollständig pseudonymisierte Datenbestände fehlertolerant durchsuchen und Dubletten erkennen. Alle übrigen Kundendaten bleiben bei der Durchsuchung anonym und das Geschäftsgeheimnis bleibt gewahrt.

S

siehe unter Anti-Terror-Listen

Im einheitlichen Euro-Zahlungsverkehrsraum SEPA (Single Euro Payments  Area) werden Überweisungen, Lastschriften und Kartenzahlungen einheitlich abgewickelt. Alle 28 EU-Mitgliedsstaaten sowie 8 weitere Länder beteiligen sich am SEPA.

Siehe unter Batch vs. Service

siehe unter Index

T

Beim Target Marketing werden spezifische Zielgruppen angesprochen. Die Zielgruppen können beispielsweise mittels mikrogeografischer Segmentierung regional oder soziodemografisch eingegrenzt werden.

U

W

siehe unter ERP-System

Z

siehe unter Index

siehe unter Target Marketing