Wiki

Data Warehouse (DWH)

Was ist ein Data Warehouse?

Bei einem Data Warehouse (DWH) handelt es sich um eine zentrale Unternehmensdatenbank, die für geschäftliche Analyseszenarien optimiert ist. Das DWH führt die im Unternehmen verteilten Datenbestände aus meist heterogenen Systemen wie CRM und ERP zusammen, vereinheitlicht diese und stellt sie zur weiteren Verwendung bereit. Dadurch kann sich der Nutzer eine globale Sicht auf alle Quelldaten verschaffen – oder konkreter: den Kunden sowie das gesamte Geschäft. Traditionelle Anwendungsfälle sind das unternehmensweite Standard-Berichtswesen und Ad-hoc-Analysen durch Fachabteilungen oder Data Scientisten. Die gewonnenen Erkenntnisse tragen zu mehr Transparenz, besseren Entscheidungen sowie einer sicheren Unternehmenssteuerung bei.

Mit den stetig wachsenden Datenmengen und den resultierenden Möglichkeiten haben sich allerdings auch die Anforderungen an das DWH deutlich erhöht. Ein modernes DWH muss ebenso einen Beitrag zu Anwendungsfällen aus den Bereichen Echtzeit/Internet of Things, Künstliche Intelligenz und Process Mining leisten können. Entsprechend sind der Aufbau und die verwendeten Technologien einem massiven Wandel unterzogen. So finden sich die bekannten DWH-Strukturen zunehmend in vollintegrierten, digitalen Cloud-Plattformen wieder, die alle Themen der unternehmensweiten Datenanalyse unter einem Dach vereinen.

Wie funktioniert ein Data Warehouse?

Die Struktur eines DWHs wird allgemein als „Schichtenarchitektur“ bezeichnet. Dabei werden die verschiedenen Aufgaben des Systems einzelnen Layern zugeordnet. Eine beispielhafte und vielfach bewährte Architektur besteht aus drei Schichten:

  1. Replication Layer: Hier werden die Quelldaten in ihrer Rohform angeliefert und gespeichert. Die Schicht dient als Archiv, das die Quellsysteme entlastet. Entsprechend handelt es sich auch um einen guten Anlaufpunkt für die explorativen Analysen von Data Scientisten. Massendaten lassen sich indes nur in geringer Geschwindigkeit abfragen.
  2. Technology Layer: Auf dieser Ebene werden die Daten technisch transformiert, zusammengefasst und gegebenenfalls historisiert. Grundlage bildet ein relationales Datenbankmanagementsystem. Daher eignet sich dieses Vorgehen auch nur für strukturierte Daten. Abfragen über SQL können in hoher Geschwindigkeit durchgeführt werden. Somit eignet sich der Technology Layer z.B. auch als Quelle für schnelle Datenextrakte, etwa wenn Echtzeitdatenströme durch aktuelle Stammdaten angereichert werden sollen..
  3. Business Layer: Der Business Layer schafft schließlich die fachliche Sicht auf das Unternehmen. Er dient Fachabteilungen und Analysten für Berichte, Ad-hoc-Abfragen und eigene Analysen auf Basis moderner Self-Service-Werkzeuge. Entsprechend sind die Daten dimensional modelliert und mit einer Business-Logik unterlegt.

Dieses Architekturkonzept hat weiterhin Bestand. Es sorgt für eine konsolidierte und harmonisierte Datensammlung, die dem Nutzer schnelle und komfortable Abfragen ermöglicht. Informationen werden organisiert verwaltet, sodass sie für Berichte und Datenanalysen leichter zugänglich sind. Allerdings erweist es sich als relativ unflexibel hinsichtlich der schnellen Veränderungen, die dynamische Märkte den Unternehmen heutzutage abverlangen. Ebenso lassen sich keine unstrukturierten Daten verarbeiten, wie z. B. Bilder und Filme. Daher hat das Konzept inzwischen eine umfassende Erweiterung erfahren.

Wie können Sie mit einem Data Warehouse neue Werte schaffen?

Die mangelnde Flexibilität klassischer DWH-Lösungen ist unter anderem darauf zurückzuführen, dass sie „On-Premises“ im unternehmenseigenen Rechenzentrum betrieben werden. Speicher und Rechenleistung sind also in ihren Größen festgelegt. Im Unterschied dazu ist das Konzept eines Modern Data Warehouse (MDWH) – wie es vor allem Microsoft propagiert – grundsätzlich in der Cloud angesiedelt. Erforderliche Ressourcen können daraufhin nach Bedarf in Anspruch genommen und skaliert werden. Als zentraler Datenspeicher dient meist ein Data Lake, der strukturierte wie unstrukturierte Daten in nahezu unbegrenzten Mengen aufnehmen und beispielweise für explorative Analysen vorhalten kann. Gleichzeitig lässt sich innerhalb des Data Lakes ein Bereich mit Schichtenarchitektur einrichten, der die typischen DWH-Aufgaben wahrnimmt.

Modern Data Warehouse Architektur ORAYLIS

Zudem ermöglichen es Cloud-Angebote wie Azure, abhängig von den individuellen Anforderungen passenden Dienste etwa für die Verarbeitung von Echtzeitdaten oder die Entwicklung Künstlicher Intelligenz nach dem Baukastenprinzip zu ergänzen. Dabei spielen die DWH-Daten weiterhin eine gewichtige Rolle. So werden beispielsweise Zahlenwerte aus einem Echtzeit-Streaming im Regelfall erst durch die Kombination mit konsolidierten Stammdaten verständlich und interpretierbar.

Wollen auch Sie ein modernes Cloud-DWH aufbauen, um Ihre Datenanalyse für die Zukunft zu rüsten? Oder wollen Sie Ihre bestehende On-Prem-Lösung in die Cloud migrieren? Dann schauen Sie auf der Seite BI & Data Analytics vorbei oder informieren Sie sich über unser Training Microsoft Modern Data Warehouse: Cloud-Plattformen aufbauen und geschäftlich nutzen.

turn your data into value.

Microsoft Modern Data Warehouse

Cloud-Plattformen aufbauen und geschäftlich nutzen

Sichern Sie sich Ihr Geschäft von Morgen! Mit einem Modern Data Warehouse (MDWH) können Sie Ihren Daten vollkommen neue Werte entlocken. Begeistern Sie Kunden und Mitarbeiter mit digitalen Services auf der Basis von Internet of Things und Echtzeit-Streaming. Unser Training vermittelt Ihnen die technischen Grundlagen in der Azure Cloud.

Join #teamoraylispeople

Gestalte mit uns
die Welt der Daten