Vertrauenswürdige Geschäftspartnerdaten durch Data Sharing
Innovative Ansätze im Stammdatenmanagement
Kunden- und Lieferantendaten, auch als Geschäftspartnerdaten bezeichnet, bilden die Grundlage digitaler Geschäftsprozesse und sind Voraussetzung für die Erfüllung regulatorischer Anforderungen. Allerdings kämpfen die meisten Unternehmen mit unzureichender Datenqualität, Datensilos und hohen Aufwänden für die Datenpflege. Das Beispiel der CDQ Data Sharing Community zeigt einen innovativen, kollaborativen Ansatz zum Management von Geschäftspartnerdaten. Durch gemeinsam definierte Qualitätsregeln und Validierung bzw. Anreicherung mit vertrauenswürdigen Datenquellen erleichtert der Ansatz die Anlage und Pflege von Geschäftspartnerdaten. Neben reduzierten Lebenszykluskosten führt die höhere Datenqualität zu weitergehenden Nutzeneffekten in Folge von Prozessautomatisierung, verlässlicheren Analysen und verbessertem Risikomanagement.
Stammdaten entwickeln sich zu einer Schlüsselressource von Unternehmen. Ohne umfangreiche und aktuelle Daten zu den Kerngeschäftsobjekten – wie Kunden, Produkten, Mitarbeitern oder Lieferanten – ist es unmöglich, Geschäftsprozesse zu digitalisieren und innovative Geschäftsmodelle umzusetzen. Auch beim Einsatz Künstlicher Intelligenz (KI) werden in der Regel grosse Datensätze (z. B. Digital Traces oder Sensoren) mit den genannten Kerngeschäftsobjekten verbunden und analysiert. Darüber hinaus gewinnen gute Stammdaten an Relevanz für die Erfüllung regulatorischer Anforderungen, beispielsweise im Bereich internationaler Handel oder Nachhaltigkeit.
Obwohl Unternehmen die Bedeutung erkennen, gibt es beim professionellen Management von Stammdaten noch erheblichen Nachholbedarf. Studien zeigen, dass nur „3 % aller Daten den grundlegenden Qualitätsanforderungen genügen“ [1] und schätzen die Kosten mangelnder Datenqualität pro Unternehmen auf durchschnittlich 15 Millionen US-Dollar pro Jahr [2]. Zu den Ursachen gehören „Datensilos“, in denen Daten mehrfach und oft inkonsistent erfasst werden. Fehler in den Daten werden in der Regel nur reaktiv behoben, wenn signifikante Probleme auftreten. Umgekehrt ist die Datenpflege mit hohen Aufwänden verbunden, und es fehlen Zuständigkeiten und Anreize für hohe Datenqualität [3].
Seit 2006 beschäftigt sich das Kompetenzzentrum Corporate Data Quality (CC CDQ) mit diesen Herausforderungen und entwickelt Lösungsansätze in enger Zusammenarbeit zwischen europäischen Unternehmen und Forschern der Universitäten St. Gallen und Lausanne. Da Unternehmen häufig die gleichen Stammdatenobjekte und -datensätze benötigen, entstand die Idee, diese zu teilen und gemeinschaftlich zu bewirtschaften. Aus den Forschungsaktivitäten des CC CDQ ist mittlerweile ein innovativer, kollaborativer Ansatz zum Management von Geschäftspartnerdaten entstanden, der einerseits die Pflegeaufwände signifikant reduziert und anderseits eine hohe Qualität und Vertrauenswürdigkeit der Daten sicherstellt. In diesem Beitrag stellen wir die Motivation und Funktionsweise des Ansatzes (siehe Bild 1) vor und illustrieren den Nutzen anhand einer Beispielrechnung.
Bild 1: Grundidee des Data Sharing für Geschäftspartnerdaten.
Geschäftspartnerstammdaten – Bedeutung und Herausforderungen
Kunden- und Lieferantendaten, die oft als Geschäftspartnerdaten zusammengefasst werden, gehören zu den wichtigsten Stammdaten eines Unternehmens. Sie spielen eine zentrale Rolle für die folgenden Bereiche:
- Digitalisierung von Geschäftsprozessen, insbesondere im Vertrieb, Einkauf und Logistik: Wenn Stammdaten schlecht gepflegt sind, verursacht dies fehlerhafte Aufträge, Bestellungen oder Rechnungen und behindert die operativen Prozesse. Gemäß der sog. Zehnerregel [1] verursachen Datenqualitätsprobleme einen 10-mal höheren Aufwand als die reguläre Prozessabwicklung.
- Management von Risiken und Einhaltung gesetzlicher und regulatorischer Anforderungen: Gute Kunden- und Lieferantendaten verbessern die frühzeitige Identifikation finanzieller und operativer Risiken. Nur mit aktuellen und korrekten Stammdaten lassen sich kritische Datensätze in Sanktions- und Embargolisten identifizieren und die Einhaltung von Datenschutzgrundverordnung sowie Lieferkettengesetz sicherstellen.
- Entscheidungsunterstützung („Business Insights“) und Einsatz von KI: Unternehmensweit harmonisierte Geschäftspartnerdaten sind Voraussetzung für eine 360°-Sicht auf Kunden und Lieferanten und weitergehende Analysen wie z. B. die Auswertung von Einkaufsvolumina zur Definition und Überwachung von Sourcing-Strategien. Bei KI-basierten Verfahren (z. B. zur Kundensegmentierung oder Optimierung von Logistikketten) ist die Verfügbarkeit und Qualität der Stammdaten wichtig, um diese mit neuartigen Datenquellen (z. B. Digital Traces oder Sensoren) zu verknüpfen und zu analysieren.
Die Analysen im CC CDQ zeigten, dass hohe Aufwände notwendig sind, um Geschäftspartnerdaten korrekt zu erfassen und in hinreichender Qualität für die genannten Anwendungsszenarien bereitzustellen. Geschäftspartnerdatensätze umfassen eine große Anzahl an Attributen (ca. 300 Attribute in einem SAP-System), die manuell eingegeben und gepflegt werden. Operativ erfolgt die Pflege entweder in einem Shared Service Center oder direkt durch die Fachabteilungen wie Einkauf und Vertrieb in den Landesgesellschaften. Dabei erzeugen allein die Grunddaten, d. h. ein recht kleiner Teil der Attribute (ca. 5 %), den Großteil des Pflegeaufwands (80 %). Gleichzeitig wurde deutlich, dass jedes Unternehmen im Datenmanagement sehr ähnliche Aufgaben ausführt und sich Geschäftspartnerdaten auch zwischen Unternehmen signifikant überlappen. Daraus ergab sich die Idee, diese in einem Data Sharing-Ansatz gemeinschaftlich zu bewirtschaften (vgl. Bild 1).
Data Sharing für vertrauenswürdige Geschäftspartnerdaten
Die Grundidee wurde im Rahmen der Forschungsaktivitäten des CC CDQ gemeinsam mit Experten aus führenden europäischen Unternehmen konkretisiert und in einer der cloud-basierten CDQ Data Sharing Plattform für Geschäftspartnerdaten implementiert.
Bild 2: Nutzeneffekte durch Data Sharing von Geschäftspartnerdaten.
Gemeinsames Verständnis durch Datenmodell und Qualitätsregeln
Voraussetzung für Data Sharing ist ein gemeinsames Verständnis von Geschäftspartnerdaten. Dazu entwickelte die Gruppe ein fachliches Datenmodell mit entsprechenden Attributen (z. B. Adresse, Steuernummer, Bankkonto) und Mapping auf operative Systeme, insbesondere SAP-Systeme. Ergänzt wurde das Datenmodell mit mehr als 2.000 Qualitätsregeln, die Vollständigkeit, Korrektheit und Konsistenz der Datensätze sicherstellen. Diese umfassen vielfältige Aspekte, z. B. die Prüfung der angegebenen Adressen und Rechtsformen nach den jeweils gültigen nationalen Standards. Die Regeln erlauben auch das Erkennen sowie eine passgenaue und regional angepasste Zusammenführung von Dubletten in „Golden Records“. Sämtliche Regeln werden permanent überprüft und auf Basis des Feedbacks der Mitglieder der CDQ Data Sharing Community erweitert, sodass der Pool an Datenqualitätsregeln weltweit alle relevanten regulatorischen und geschäftlichen Anforderungen erfüllt.
Validierung und Anreicherung auf Basis externer Quellen
Zusätzlich wurden externe Datenquellen identifiziert, wie z. B. öffentliche Handelsregister, Geodatenbanken oder kommerzielle Datenanbieter, die als „Trusted Source“ herangezogen werden. Sie dienen als Referenzdaten und werden für die Verifizierung und Anreicherung der Geschäftspartnerdaten verwendet. Eine zentrale Rolle spielen die mehr als 70 verschiedenen Unternehmensidentifikatoren (z. B. Steuernummern) und über 3.000 Rechtsformen.
Teilen von Datensätzen in der Community
In der letzten Ausbaustufe umfasst Data Sharing nicht nur das gemeinsame fachliche Datenmodell mit Qualitätsregeln und die Anreicherung mit externen Datenquellen, sondern auch das Teilen von Kunden- und Lieferantendatensätzen zwischen den Unternehmen im Netzwerk. Dazu liefert die CDQ Data Sharing Plattform verschiedene Services für die Anlage und Validierung von Datensätzen sowie Workflows für die gemeinsame Pflege und Aktualisierung der Daten.
Bei Anlage können die Unternehmen über eine Suchfunktion feststellen, ob ein entsprechender Datensatz zu einem Geschäftspartner bereits existiert, d. h., ob ein anderes Unternehmen diesen Datensatz bereits pflegt oder mindestens externe Referenzdaten vorhanden sind. Sobald eines der Unternehmen von einem Geschäftspartner über Änderungen der Daten informiert wird, stößt es einen Workflow zum Update des Datensatzes an. Dabei bleibt die Anonymität der Unternehmen gewahrt, und ein Vier-Augen-Prinzip (d. h. ein Review durch ein zweites Unternehmen) stellt die hohe Qualität und das Vertrauen in die bereitgestellten Daten sicher. Die (positiven) Erfahrungen haben bereits zu erweiterten Data Sharing-Szenarien geführt – wie z. B. zum Teilen von Trust-Scores basierend auf Transaktionsdaten, worüber Betrugsfälle gemeinsam frühzeitiger und damit effizienter erkannt werden.
Nutzen des Data Sharings
Anhand der praktischen Erfahrungen lassen sich konkrete Nutzeneffekte des CDQ Data Sharing-Ansatzes beim Management von Geschäftspartnerdaten nachweisen (vgl. Bild 2): Direkter Nutzen entsteht entlang des Datenlebenszyklus durch Reduktion der Aufwände für Datenanlage, -verifikation und -pflege sowie Pooling der Kosten für die qualitätssichernde Infrastruktur. Indirekter Nutzen entsteht überall dort, wo Geschäftspartnerdaten im Unternehmen genutzt werden, z. B. im Vertrieb, in der Logistik oder im Einkauf.
Direkter Nutzen – „First Time Right“, „Zero Maintenance“ und „IT-Pooling
Der direkte Nutzen lässt sich recht einfach entlang des Datenlebenszyklus quantifizieren (vgl. Bild 3). Die Beispielrechnung orientiert sich an Erfahrungswerten global tätiger Unternehmen, die Geschäftspartnerdaten unternehmensweit standardisieren und dazu Master Data Management-Systeme (z. B. SAP MDG) einsetzen. Als typische Größenordnung gehen wir von ca. 190.000 Datensätzen aus, aufgeteilt auf 60.000 Kunden- und 130.000 Lieferantendatensätze.
Der Ansatz reduziert den manuellen Aufwand bei der Datenanlage und beschleunigt die Zeitspanne bis zur Bereitstellung qualitativ hochwertiger Daten in operativen Systemen. Die Höhe des Effekts hängt von der Überlappung zwischen eigenen Datensätzen und dem Datenpool ab, die zwischen 20–60 % liegt, sowie von der Anzahl an Attributen, für die Informationen zunächst beschafft und dann gepflegt werden. Bei jährlich ca. 5–10 % neu zu erfassenden Datensätzen mit jeweils 18 Attributen ergibt sich ein Effekt von ca. 150.000 Euro pro Jahr.
Sogenannte „Zero Maintenance“-Effekte entstehen durch zeitnahe Information bei Änderungen von Geschäftspartnerdaten und die Übernahme von Adressen, Bankkonten oder anderen Informationen. Bei einer Änderungsquote von ca. 10–15 % aller Datensätze und jeweils 5 geänderten Attributen resultieren ca. 90.000 Euro pro Jahr.
Ein weiterer direkter Nutzen entsteht durch Pooling von IT-Kosten. Heute muss jedes Unternehmen eine zunehmend komplexe qualitätssichernde Infrastruktur betreiben. In unserer Bespielrechnung reduzieren sich die Software-Lizenzkosten für Adressbereinigungs- und Datenqualitätstools von jährlich 150.000 Euro auf 60.000 Euro.
Indirekter Nutzen – Prozesseffizienz, Entscheidungsqualität und Risikomanagement
Neben den um ca. 40% reduzierten Lebenszykluskosten entstehen durch verlässliche Geschäftspartnerdaten Nutzenpotenziale in den wertschöpfenden Bereichen. Diese sind in der Regel höher einzustufen als die direkten Effekte im Stammdatenmanagement und betreffen insbesondere folgende Bereiche:
- höhere Prozesseffizienz und -qualität: Prozessprobleme und Folgekosten schlechter Datenqualität werden reduziert, z. B. durch Verifizierung von Adressinformationen oder korrekte Bank- bzw. Steuernummern. Im Einkauf ermöglicht dies einen höheren Automatisierungsgrad sowie die Reduzierung von Prozessfehlern bei der logistischen bzw. Zahlungsabwicklung. Im Vertrieb sinken dadurch die Fehllieferungen, Retouren sowie Rechnungskorrekturen.
- verlässlichere Analysen („Business Insights“) und Entscheidungsqualität: Vollständige, korrekte und redundanzfreie Geschäftspartnerdaten sind Voraussetzung für eine 360°-Sicht auf Kunden und Lieferanten und damit für die Qualität strategischer Entscheidungen. Durch Deduplizierung und Anreicherung von Datensätzen verbessert Data Sharing im Einkauf die Ausgabenanalysen („Spend analysis“), das Bündeln von Einkaufsvolumina und das Lieferantenmanagement. Im Vertrieb sind bessere Segmentierung von Kunden und individualisierte Kundenansprache möglich.
- Reduzierung von Risiken: Höhere Datenqualität der Geschäftspartnerdaten reduziert schließlich auch Risiken und stellt die Erfüllung regulatorischer Auflagen sicher. Im konkreten Fall führt Data Sharing dazu, dass Betrugsfälle bei Lieferanten früher aufgedeckt und Zahlungsausfälle bei Kunden reduziert werden.
Bild 3: Direkter Nutzen des Data Sharing: Einsparpotenzial pro Jahr (in tausend Euro)
Literatur
[1] Nagle, T./Redman, T. C./ Sammon, D. (2018), Only 3% of Companies’ Data Meets Basic Quality Standards, Harvard Business Review, https://hbr.org/2017/09/only-3-of-companies-data-meets-basic-quality-standards
[2] Moore, S. (2018): Poor quality data weakens an organization‘s competitive standing and undermines critical business objectives, https://www.gartner.com/smarterwithgartner/how-to-stop-data-quality-undermining-your-business/
[3] Otto/Legner (2016), Datenqualitätsmanagement für den Industriebetrieb, Zeitschrift Controlling, S. 550–557.
Prof. Dr. Christine Legner ist akademische Leiterin des Competence Centers Corporate Data Quality (CC CDQ) und Professorin für Wirtschaftsinformatik an der wirtschaftswissenschaftlichen Fakultät der Universität Lausanne (Schweiz).
Dr. Kai Hüner ist Chief Technology der CDQ AG, einem Spin-Off der Universität St. Gallen (Schweiz).
Dr. Simon Schlosser ist Head of Product der CDQ AG, einem Spin-Off der Universität St. Gallen (Schweiz).
Dr. Dimitrios Gizanis ist Chief Executive Officer der CDQ AG, einem Spin-off der Universität St. Gallen (Schweiz).
Dr. Kai Hüner
CDQ AG
Lukasstrasse 4
9008 St. Gallen
Schweiz