Zehn Warnsignale für schlechte Datenqualität
Adressdaten gehören zu den wichtigsten Grundlagen vieler Geschäftsprozesse. Sie werden für Rechnungen, Lieferungen, Marketingkampagnen, Kundenservice, Analysen und die Identifikation von Kunden benötigt.
Gleichzeitig sind Adressdaten nicht statisch.
Adressdaten altern jeden Tag. Menschen ziehen um, Namen ändern sich, Unternehmen wechseln ihren Standort und Ansprechpartner verlassen ihre Position. Ohne regelmäßige Aktualisierung wird selbst ein ursprünglich korrekter Datenbestand nach und nach unzuverlässig.
Wie groß die Herausforderung ist, zeigt die Adress-Studie 2025 der Deutschen Post Direkt: Laut der Untersuchung sind 13,1 Prozent der analysierten Kundenadressen fehlerhaft oder nicht mehr zustellbar. Damit ist ungefähr jede achte Adresse betroffen.
Die konkrete Fehlerquote kann von Unternehmen zu Unternehmen erheblich variieren. Es gibt jedoch typische Anzeichen dafür, dass ein Adressbestand überprüft und bereinigt werden sollte.
Die folgenden zehn Warnsignale geben eine erste Orientierung.
1. Hohe Retourenquoten und viele unzustellbare E-Mails
Ein besonders offensichtliches Warnsignal sind Briefe, Kataloge, Rechnungen oder Pakete, die regelmäßig als unzustellbar zurückkommen.
Auch eine hohe Zahl von Hard Bounces bei E-Mail-Kampagnen weist darauf hin, dass Kontaktdaten veraltet oder bereits bei der Erfassung fehlerhaft waren.
Mögliche Ursachen sind:
- falsche oder unvollständige Straßenangaben,
- fehlende Hausnummern,
- nicht zusammenpassende Postleitzahlen und Orte,
- unberücksichtigte Umzüge,
- veraltete E-Mail-Adressen,
- Tippfehler bei der Dateneingabe.
Jeder Rückläufer verursacht direkte Kosten. Hinzu kommen der manuelle Prüfaufwand, mögliche Verzögerungen und weitere Kontaktversuche.
Besonders problematisch ist es, wenn Retouren zwar bearbeitet werden, die zugrunde liegenden Datensätze aber unverändert bleiben. In diesem Fall tritt derselbe Fehler bei der nächsten Kommunikation erneut auf.
2. Kunden und Kontakte sind mehrfach vorhanden
Ein Kunde oder ein Unternehmen kann in verschiedenen Schreibweisen im Datenbestand vorkommen.
Beispiele:
- Müller GmbH
- Mueller GmbH
- Müller Gesellschaft mbH
- Mueller G.m.b.H.
Auch bei Personennamen gibt es zahlreiche mögliche Varianten:
- Josef Maier
- Joseph Mayer
- J. Maier
- Sepp Maier
Solche Datensätze können dieselbe Person oder dasselbe Unternehmen beschreiben. Sie müssen es aber nicht. Deshalb handelt es sich zunächst um Dublettenkandidaten.
Eine zuverlässige Dublettenerkennung darf nicht nur den Namen betrachten. Sie sollte auch Anschrift, Telefonnummer, E-Mail-Adresse, Kundennummer und weitere verfügbare Merkmale einbeziehen.
Dubletten können zu folgenden Problemen führen:
- Kunden erhalten dasselbe Mailing mehrfach.
- Kontakthistorien sind auf mehrere Datensätze verteilt.
- Mitarbeiter arbeiten mit unterschiedlichen Informationen.
- Kunden- und Interessentenzahlen werden falsch ausgewiesen.
- Marketing- und Versandkosten steigen.
- Kunden werden unterschiedlichen Zielgruppen zugeordnet.
Bei Firmendaten ist besondere Vorsicht erforderlich. Eine „Müller GmbH“ und eine „Müller KG“ können verbundene, aber rechtlich unterschiedliche Unternehmen sein. Ähnliche Schreibweisen allein reichen daher nicht für eine automatische Zusammenführung.
Mehr zum Thema: Dublettenbereinigung – Wie können mehrfach vorhandene Datensätze erkannt werden?
3. Postleitzahl, Ort, Straße und Hausnummer passen nicht zusammen
Ein vollständig ausgefüllter Datensatz ist nicht automatisch postalisch korrekt.
Typische Auffälligkeiten sind:
- Die Postleitzahl gehört nicht zum angegebenen Ort.
- Die Straße existiert nicht in diesem Ort.
- Der Straßenname enthält einen Schreibfehler.
- Die Hausnummer fehlt oder ist unplausibel.
- Eine veraltete Straßenbezeichnung wird verwendet.
- Ortsteil und postalischer Ort wurden verwechselt.
Eine rein formale Prüfung genügt nicht. Dass eine Postleitzahl aus fünf Ziffern besteht, sagt noch nichts darüber aus, ob sie zum angegebenen Ort und zur Straße gehört.
Entscheidend ist die Prüfung der gesamten Kombination aus:
- Postleitzahl,
- Ort,
- Straße,
- Hausnummer,
- gegebenenfalls Ortsteil und Adresszusatz.
Ohne eine postalische Prüfung werden viele dieser Fehler erst beim tatsächlichen Versand erkannt.
Mehr zum Thema: Bessere Adressqualität durch postalische Adressprüfung
4. Unterschiedliche Formate und unklare Feldinhalte
Dieselbe Anschrift kann auf unterschiedliche Weise gespeichert sein:
- Hauptstraße 15
- Hauptstr. 15
- Hauptstrasse 15
- HAUPTSTR 15
- Hauptstraße 15, 2. OG
Auch Telefonnummern können in zahlreichen Formaten vorkommen:
- 0721 123456
- 0721/123456
- +49 721 123456
- 0049-721-123456
Für Menschen sind diese Angaben meist verständlich. Für automatisierte Vergleiche, Suchfunktionen und Dublettenprüfungen stellen sie jedoch eine Herausforderung dar.
Besonders kritisch sind Felder, in denen mehrere Informationen vermischt werden. Stehen Straße, Hausnummer, Etage und Adresszusatz gemeinsam in einem Freitextfeld, wird eine zuverlässige Verarbeitung deutlich schwieriger.
Eine Normalisierung überführt die Daten in einheitliche Vergleichsformate. Die ursprünglichen Angaben sollten dabei erhalten bleiben.
So können beispielsweise der Originalwert, der normalisierte Vergleichswert und ein möglicher Korrekturvorschlag getrennt gespeichert werden.
5. Wichtige Angaben fehlen
Unvollständige Datensätze beeinträchtigen sowohl die Kommunikation als auch die Identifikation von Kunden.
Häufig fehlen:
- Hausnummern,
- Postleitzahlen,
- Anreden,
- Vor- oder Nachnamen,
- Ansprechpartner,
- E-Mail-Adressen,
- Telefonnummern,
- Länderkennzeichen,
- Firmenzusätze,
- interne Kunden- oder Partnernummern.
Nicht jedes Feld muss für jeden Geschäftsprozess verpflichtend sein. Unternehmen sollten jedoch definieren, welche Informationen für den jeweiligen Anwendungsfall benötigt werden.
Fehlen wichtige Identifikationsmerkmale, können ähnliche Datensätze nicht mehr zuverlässig unterschieden werden.
Zwei Menschen mit demselben Namen und derselben Anschrift können beispielsweise unterschiedliche Personen sein. Ohne weitere Merkmale wäre eine automatische Zusammenführung riskant.
6. Die Daten sind erkennbar veraltet
Menschen ziehen um, heiraten oder ändern ihren Namen. Unternehmen wechseln ihren Standort oder ihre Rechtsform. Ansprechpartner verlassen ein Unternehmen, Telefonnummern werden abgeschaltet und E-Mail-Adressen verlieren ihre Gültigkeit.
Warnsignale für einen veralteten Datenbestand sind beispielsweise:
- Ansprechpartner sind nicht mehr im Unternehmen beschäftigt.
- Kunden reagieren über einen langen Zeitraum nicht mehr.
- Dieselben Adressen erzeugen wiederholt Rückläufer.
- Kunden teilen regelmäßig Korrekturen mit.
- Große Teile des Bestands wurden seit Jahren nicht aktualisiert.
- Es gibt keinen geregelten Prozess zur Datenpflege.
Eine einmalige Bereinigung verbessert die Datenqualität nur vorübergehend.
Nachhaltige Datenqualität erfordert regelmäßige Kontrollen, klar definierte Aktualisierungsprozesse und die konsequente Verarbeitung erkannter Änderungen.
Datenqualität ist deshalb kein einmaliges Projekt, sondern ein kontinuierlicher Prozess.
7. Unterschiedliche Systeme enthalten unterschiedliche Informationen
In vielen Unternehmen werden Kundendaten nicht nur in einem System gespeichert.
CRM, ERP, Kundenservice, Newsletter-System, Webshop und weitere Fachanwendungen können jeweils eine eigene Version eines Kontakts enthalten.
Ein typisches Beispiel:
- Im CRM ist bereits die neue Anschrift hinterlegt.
- Im ERP steht weiterhin die frühere Adresse.
- Der Kundenservice kennt eine aktuellere Telefonnummer.
- Im Newsletter-System befindet sich eine andere E-Mail-Adresse.
In dieser Situation stellt sich die zentrale Frage:
Welche Information ist richtig und welches System ist für welches Merkmal führend?
Fehlen klare Regeln, entstehen widersprüchliche Kundenbilder. Änderungen werden nur in einzelnen Systemen vorgenommen und bei späteren Importen möglicherweise wieder überschrieben.
Ein konsolidierter Golden Record kann die verlässlichsten Informationen aus den beteiligten Quellen zusammenführen.
Dabei muss nachvollziehbar bleiben:
- aus welchem System ein Wert stammt,
- wann er zuletzt aktualisiert wurde,
- nach welcher Regel er ausgewählt wurde,
- welche Quelldatensätze zum Golden Record gehören.
8. Vorhandene Kunden und Kontakte werden nicht gefunden
Ein Kontakt ist im System vorhanden, wird bei der Suche aber trotzdem nicht gefunden.
Das kann verschiedene Ursachen haben:
- Namen wurden unterschiedlich geschrieben.
- Umlaute oder Sonderzeichen weichen voneinander ab.
- Ein Name enthält einen Tippfehler.
- Vor- und Nachname wurden vertauscht.
- Abkürzungen oder alternative Namen wurden verwendet.
- Die Suche unterstützt nur exakte Treffer.
Bei Namen wie Maier, Meier, Mayer oder Meyer reicht ein einfacher Zeichenvergleich häufig nicht aus.
Phonetische Verfahren können helfen, ähnlich klingende Namen zu erkennen. Zusätzlich können Verfahren für Schreibähnlichkeit, Buchstabendreher, Abkürzungen und internationale Schreibvarianten eingesetzt werden.
Werden vorhandene Kontakte nicht gefunden, legen Mitarbeiter häufig einen neuen Datensatz an. Aus einem Suchproblem entsteht dadurch ein zusätzliches Dublettenproblem.
Mehr zum Thema: Relevanz der phonetischen Suche
9. Auswertungen liefern keine verlässlichen Kundenzahlen
Wie viele eindeutige Kunden hat ein Unternehmen tatsächlich?
Diese scheinbar einfache Frage lässt sich bei schlechter Datenqualität häufig nicht zuverlässig beantworten.
Dubletten erhöhen die ausgewiesene Kundenzahl. Unvollständige oder veraltete Datensätze verfälschen Kampagnenreichweiten. Unterschiedliche Systeme liefern voneinander abweichende Ergebnisse.
Weitere Warnsignale sind:
- CRM und ERP weisen unterschiedliche Kundenzahlen aus.
- Marketingkampagnen erreichen weniger Personen als erwartet.
- Dieselbe Person wird mehreren Kundengruppen zugeordnet.
- Regionale Auswertungen enthalten unplausible Ergebnisse.
- Nach jedem Datenexport entstehen andere Kennzahlen.
- Niemand kann erklären, wie die Zahl der eindeutigen Kunden ermittelt wurde.
Schlechte Stammdaten wirken sich unmittelbar auf Reports, Prognosen und geschäftliche Entscheidungen aus.
Datenqualität ist daher nicht nur ein operatives Thema. Sie ist eine Voraussetzung für belastbare Analysen und verlässliche Unternehmensentscheidungen.
10. Manuelle Korrekturen gehören zum Tagesgeschäft
Ein besonders deutliches Warnsignal ist ein hoher manueller Aufwand.
Vor Mailings werden regelmäßig Excel-Dateien bereinigt. Mitarbeiter korrigieren dieselben Fehler immer wieder. Datensätze werden vor einem Import manuell umformatiert oder aus verschiedenen Listen zusammenkopiert.
Typische Symptome sind:
- wiederkehrende Bereinigungsaktionen vor Kampagnen,
- manuell gepflegte Dublettenlisten,
- aufwendige Excel-Abgleiche,
- individuelle Korrekturregeln einzelner Mitarbeiter,
- undokumentierte Änderungen,
- fehlende Qualitätskennzahlen,
- unklare Verantwortlichkeiten.
Solche Tätigkeiten lösen meist nur das aktuelle Problem. Die eigentliche Fehlerursache bleibt bestehen.
Spätestens dann sollte untersucht werden, welche Regeln automatisiert und welche Prozesse grundsätzlich verbessert werden können.
Wie lässt sich die Qualität eines Adressbestands messen?
Eine erste Bewertung muss nicht sofort den gesamten Datenbestand umfassen.
Mit einem Address Quality Quick Scan kann zunächst eine repräsentative Stichprobe untersucht werden.

Dabei lassen sich beispielsweise folgende Kennzahlen ermitteln:
- Anteil vollständiger Datensätze,
- Anteil formal und postalisch plausibler Adressen,
- Anzahl und Art erkannter Qualitätsprobleme,
- potenzielle Dublettenquote,
- Anteil veralteter oder auffälliger Kontaktdaten,
- Anzahl unterschiedlicher Schreibweisen und Formate,
- Widersprüche zwischen verschiedenen Quellsystemen,
- Potenzial für die Bildung von Golden Records.
Auf dieser Grundlage kann entschieden werden, welche Maßnahmen den größten fachlichen und wirtschaftlichen Nutzen versprechen.
Mögliche Schritte sind:
- Datenbestand analysieren und profilieren,
- Schreibweisen und Formate normalisieren,
- postalische Angaben prüfen,
- Dublettenkandidaten identifizieren,
- sichere und unsichere Treffer unterscheiden,
- fachlich nicht eindeutige Fälle manuell bewerten,
- Golden Records bilden,
- Qualitätskennzahlen dauerhaft überwachen.
Weitere Empfehlungen finden Sie im Beitrag Datenqualität im Adress-Management-Umfeld.
Welche Rolle kann Databricks dabei spielen?
Bei großen Datenbeständen oder mehreren Quellsystemen kann Databricks als skalierbare Plattform für die Analyse und Verarbeitung eingesetzt werden.

Eine solche Plattform kann unter anderem:
- Rohdaten aus CRM-, ERP- und Fachsystemen übernehmen,
- unterschiedliche Datenformate vereinheitlichen,
- Qualitätsregeln automatisiert ausführen,
- Adressen und Kontaktdaten normalisieren,
- Dublettenkandidaten bilden,
- Ähnlichkeits- und Match-Scores berechnen,
- Golden Records erzeugen,
- Verarbeitungsschritte nachvollziehbar protokollieren,
- Qualitätskennzahlen in Dashboards bereitstellen.
Databricks ersetzt dabei nicht das fachliche Wissen im Adressmanagement.
Der entscheidende Mehrwert entsteht durch die Kombination aus:
- adressfachlichen Regeln,
- postalischer Prüfung,
- fehlertoleranten Such- und Vergleichsverfahren,
- nachvollziehbaren Matching-Entscheidungen,
- Regeln für die Bildung von Golden Records,
- und einer skalierbaren technischen Plattform.
Die Technologie stellt die Verarbeitungskapazität und Infrastruktur bereit. Die Qualität der Ergebnisse hängt jedoch wesentlich von den verwendeten Regeln, Referenzdaten und fachlichen Entscheidungen ab.
Fazit
Schlechte Adressqualität zeigt sich selten nur an einem einzelnen Fehler.
Retouren, Dubletten, unvollständige Felder, nicht auffindbare Kontakte, widersprüchliche Systeme und hoher manueller Aufwand sind häufig verschiedene Symptome desselben Problems: Es fehlt ein durchgängiger und messbarer Prozess für die Pflege der Kunden- und Adressdaten.
Unternehmen sollten deshalb nicht erst reagieren, wenn eine große CRM-Migration, ein Systemwechsel oder eine umfangreiche Marketingkampagne bevorsteht.
Ein kompakter Address Quality Quick Scan schafft Transparenz darüber, wie gut der vorhandene Datenbestand tatsächlich ist, welche Qualitätsprobleme bestehen und an welchen Stellen das größte Verbesserungspotenzial liegt.
Denn nur verlässliche Adressdaten ermöglichen eine zielgerichtete Kommunikation, belastbare Analysen und ein konsistentes Bild der Kunden.