Wiki

Datenmodellierung

Was ist Datenmodellierung?

Bei der Datenmodellierung erstellt der Lösungsarchitekt ein Schema, nach dem Unternehmensdaten in einer Datenbank, einem Data Warehouse (DWH) oder einem Data Lake gespeichert bzw. organisiert werden sollen. Das resultierende Datenmodell ist ein Bau- und Fahrplan für die Umsetzung der angestrebten Datenlösung. Es zeigt, welche Daten im Kontext der Geschäftsziele erforderlich sind und wie diese für wertorientierte Analysen strukturiert und in Beziehung gesetzt werden müssen. Ebenso liefert das Datenmodell die Vorgaben zur laufenden Integration neuer Daten.

Das Ergebnis ist eine konsolidierte, unternehmensweite Datenbasis, die sich einerseits für ein zuverlässiges und stets aktuelles Berichtswesen nutzen lässt. Andererseits können diese strukturierten Stammdaten wichtige Zusatzinformationen für moderne Echtzeit- oder KI-Analysen liefern. Im Umkehrschluss bedeutet das aber auch: Bereits im Vorfeld der Datenmodellierung müssen die richtigen Entscheidungen getroffen werden. Wer im laufenden Betrieb umsteuern will, der muss mit teils hohen Aufwänden und beträchtlichen Kosten rechnen.

Wie funktioniert Datenmodellierung?

Die Modellierung von Daten umfasst diese Schritte:

  1. Daten werden konkreten Geschäftsobjekten zugeordnet, den sogenannten Entitäten
  2. Zu den Entitäten werden spezifische Attribute – also Merkmale und Eigenschaften – definiert
  3. Verschiedene Entitäten werden zueinander in Beziehung gesetzt

Das Hauptziel der Datenmodellierung ist also die Ermittlung der Entitäten, ihrer Attribute und ihrer Beziehungen. Zum besseren Verständnis ein Beispiel: Kunden und Produkte sind typische Geschäftsobjekte bzw. Entitäten, denen sich entsprechendes Datenmaterial zuordnen lässt. Die Attribute des Kunden sind dann beispielsweise die Kundennummer und der Kundenname, die des Produktes der Produktname und der Produktpreis. Die Beziehung zwischen den beiden Entitäten ist schließlich der Verkauf.

Das Datenmodell stellt somit sicher, dass alle benötigten Datenobjekte korrekt, vollständig und einheitlich vorliegen. Es gewährleistet Konsistenz in Namenskonventionen, Standardwerten, Semantik und Sicherheit. Entsprechend können Unternehmen sich auf eine stabile Datenbasis von hoher Qualität stützen, die stets verlässliche Analyseergebnisse liefert.

Wann kommt Datenmodellierung zum Einsatz?

Datenmodellierung ist grundlegend für klassischen DWH-Konzepten und Business-Intelligence-Systemen. Aber auch cloudbasierte Data-Lake-Ansätze verlangen nach modellierten Daten. Denn viele moderne Analyseszenarien müssen gesichertes, historisches Wissen einbeziehen, um zu aussagekräftigen Ergebnissen zu gelangen.

Dabei ist die Problemstellung immer die gleiche geblieben: Einerseits soll das Datenschema möglichst große Einschränkungen hinsichtlich seiner Anwendung aufweisen, um die Business-Regeln bereits auf struktureller Ebene zu berücksichtigen. Andererseits soll es möglichst allgemein gehalten sein, damit sich während des Betriebes möglichst wenige strukturelle Änderungen ergeben. Eine Lösungen bieten unterschiedliche Modellierungsmethoden, etwa von Kimball, Inmon oder Linstedt bzw. Data Vault. Auf dieser Grundlage gilt es, eine für die jeweiligen Anforderungen maßgeschneiderte Lösung zu entwickeln, wobei es sich im Regelfall um eine Mischform der verschiedenen Ansätze handelt.

Wollen auch Sie Ihre verschiedenen Datenquellen in einer stabilen Datenbasis zusammenführen, mit der Sie verlässliche Erkenntnisse und ganz neue Werte aus Ihren Daten erschließen können? Dann schauen Sie auf der Big Data Engineering vorbei oder informieren Sie sich über unser Training Microsoft BI: Grundlagen zur Planung und Umsetzung von Business Intelligence-Projekten.

turn your data into value.

Microsoft BI

Grundlagen zur Planung und Umsetzung von Business Intelligence-Projekten

In unserem Training erfahren Sie, wie Sie die zukunftsweisenden Technologien von Microsoft nutzen können, um mit Ihren Daten bessere Entscheidungen zu treffen und erfolgreich zu wachsen.

Join #teamoraylispeople

Gestalte mit uns
die Welt der Daten