Was ist OLAP in einem Data Warehouse?

Was ist OLAP in einem Data Warehouse?

January 21, 2020

Aleksei Schinkarenko

BI-Architekt

Wir leben in einer datengesteuerten Welt, in der täglich eine enorme Menge an Daten gesammelt und gespeichert wird. In seinem Bericht über die globale Digitalisierung schätzt IDC, dass das weltweite Datenaufkommen bis 2025 auf gewaltige 175 Zettabyte anwachsen wird - das Zehnfache der 2017 produzierten Datenmenge.

Je mehr Daten erzeugt werden, desto wichtiger wird die Fähigkeit, auf sie zuzugreifen und sie zu analysieren, um sie effektiv zu nutzen. Die Hilfe von BI-Beratern kann wertvoll sein, denn sie wissen, wie man mit der Datenanalyse richtig umgeht. Sie können Unternehmen helfen, das Beste aus ihren Daten herauszuholen und die richtigen Geschäftsentscheidungen zu treffen.

Doch die Datenanalyse ist für viele Unternehmen ein Schwachpunkt: Nur 31 % der Teilnehmer der Big Data and AI Executive Survey 2019 von NewVantage Partners gaben an, datengetrieben zu sein, ein Rückgang gegenüber 37,1 % im Jahr 2017 und 32,4 % im Jahr 2018. Darüber hinaus kostet schlechte Datenqualität Unternehmen laut Gartner durchschnittlich 15 Millionen US-Dollar pro Jahr.

Für viele liegt das Problem in der Wahl der falschen Art der Datenspeicherung und der daraus resultierenden ineffektiven Analytik. Der Aufbau eines Data Warehouse ist eine mögliche Lösung für effektive Datenanalysen und operative Business Intelligence. Was also ist OLAP im Data Warehouse und wie kann es effektiv genutzt werden?

Data Warehouse und seine Kernkomponenten

Im Allgemeinen ist ein Data Warehouse eine Datenbank, die aktuelle und historische Daten speichert, damit sie für Marktforschung, analytische Berichte und Entscheidungsfindung analysiert werden können. Der Hauptunterschied zu herkömmlichen operativen Datenbanken besteht darin, dass Data Warehouses in der Regel so konzipiert sind, dass sie einen historischen Überblick bieten und keine aktuellen Daten liefern.

Deshalb eignen sich Data Warehouses hervorragend für langfristige umfassende Analysen. So können Unternehmen die in Data Warehouses gespeicherten Informationen nutzen, um ihre Marketingkampagnen zu überwachen oder zu ändern oder die Kundenbeziehungen zu verbessern.

  • Datenquellen, wie CRM, HRM, SCM und ERP, umfassen operative Datenbanken, die die täglichen Transaktionen des Unternehmens aufzeichnen.
  • Data Warehouse Application Server ist die unterste Ebene der Architektur, die durch das relationale Datenbanksystem repräsentiert wird. Um ein Data Warehouse aufzubauen, müssen Unternehmen zunächst die Rohdaten aus jeder ihrer Datenquellen kopieren, bereinigen und optimieren. Dieser Prozess wird als ETL (Extrahieren, Transformieren, Laden) bezeichnet und ist der wesentliche Teil einer Datenmigrationsstrategie.
  • OLAP-Server ist die mittlere Schicht und eine der wichtigsten Komponenten. OLAP steht für Online Analytical Processing und ermöglicht die schnelle Berechnung wichtiger Geschäftskennzahlen, Planungs- und Prognosefunktionen sowie Was-wäre-wenn-Analysen bei großen Datenmengen.
  • Frontend-Tools befinden sich auf der obersten Ebene der Data-Warehouse-Architektur. Sie bestehen aus den Abfrage-, Berichts-, Analyse- und Data-Mining-Tools.
Data warehouse components

Wie in der Data-Warehouse-Architektur zu sehen ist, spielt OLAP eine wichtige Rolle bei der Datenanalyse. Es wandelt historische Daten in abgeleitete und projizierte Daten um und ermöglicht es den Benutzern, Daten einfach und selektiv aus verschiedenen Perspektiven zu betrachten.

Der Einsatz von OLAP im Data Warehouse für multidimensionale Analysen

Der größte Wert von OLAP liegt in seinem multidimensionalen Ansatz zur Organisation und Analyse von Daten. OLAP schlüsselt die Daten in Dimensionen auf; zum Beispiel kann der Gesamtumsatz in Dimensionen wie Geografie und Zeit unterteilt werden.

Die geografische Dimension könnte die Ebenen Land, Bundesland und Bezirk enthalten, während die zeitliche Dimension nach Jahr, Monat und Tag aufgeschlüsselt sein könnte. OLAP in einem Data Warehouse ermöglicht es Unternehmen also, Informationen in mehreren Dimensionen zu organisieren, was das Verständnis und die Nutzung von Daten erleichtert.

Da OLAP multidimensionale Daten enthält, die in der Regel aus verschiedenen und nicht miteinander verbundenen Quellen stammen, ist eine besondere Methode zur Speicherung dieser Daten erforderlich. Die Verwendung einer Tabellenkalkulation mit Zeilen und Spalten ist für zweidimensionale Daten gut, aber nicht für multidimensionale Daten. Stattdessen sollten OLAP-Würfel für diesen Zweck verwendet werden. Sie sind so strukturiert, dass sie verschiedene Datentypen aus heterogenen Quellen speichern und in logischer und geordneter Weise analysieren können.

OLAP cube

OLAP vs. OLTP

OLAP stellt eine leichte Abwandlung des Online Transaction Processing (OLTP) dar, bei dem es sich um eine eher traditionelle Technologie handelt. Beide sind gängige Systeme für die Datenverwaltung. OLTP und OLAP unterscheiden sich jedoch in ihrer Zielsetzung: Während ersteres auf die Datenverarbeitung abzielt, ist letzteres auf die Datenanalyse ausgerichtet. In der nachstehenden Tabelle sind die weiteren Unterschiede zwischen OLTP- und OLAP-Systemen zusammengefasst.

Parameter OLTP OLAP

Charakterisiert durch

Große Anzahl von kurzen Online-Transaktionen Große Datenmengen

Funktionalität

Ein Online-Datenbankänderungssystem Ein System zur Verwaltung von Online-Datenbankabfragen

Methode

Verwendet ein traditionelles DBMS Benutzt ein Data Warehouse

Tabellen

Normalisiert. Nicht normalisiert.

Datenquellen

OLTP und seine Transaktionen Unterschiedliche OLTP-Datenbanken

Datenintegrität

Kritische Bedeutung Kein Problem

Antwortzeit

Eine Millisekunde Von Sekunden bis Minuten

Datenqualität

Detaillierte und organisierte Daten Daten können unorganisiert sein

Geschäftsnutzen

Kontrolle und Ausführung grundlegender Geschäftsaufgaben Planung, Problemlösung und Entscheidungsunterstützung

Betriebsunterstützung

Lese-/Schreiboperationen Mehrheitlich schreibgeschützte Operationen

Abfragetyp

Standardisiert und einfach Komplexe Abfragen, die Aggregationen beinhalten können

Backup

Komplettsicherung kombiniert mit inkrementellen Sicherungen Backups sind im Vergleich zu OLTP nicht wichtig und werden nur periodisch durchgeführt

Benutzertyp

Kritische Benutzer (Sachbearbeiter, DBAs, Datenbankexperten) Benutzer mit Datenkenntnissen (normale Angestellte, Manager, CEOs)

Zweck

Geschäftsvorgänge in Echtzeit Analyse von Geschäftsmaßnahmen nach Kategorien und Attributen

Herausforderung

Data Warehouses erfordern Entwicklung und können sich als kostspielig erweisen Ein OLAP-Würfel ist kein offenes SQL-Server-Datenlager. Daher sind technische Kenntnisse und Erfahrung für die Verwaltung des OLAP-Servers unerlässlich

Prozess

Schnelle Ergebnisse für täglich genutzte Daten Konstant schnelle Antwort auf eine Abfrage
Stil Gestaltet für eine schnelle Antwortzeit und geringe Datenredundanz; normalisiert Einzigartig gestaltet, so dass es verschiedene Datenquellen zum Aufbau einer konsolidierten Datenbank integrieren kann

Anwendungsfälle von OLAP in einem Data Warehouse

OLAP spielt eine wichtige Rolle bei der Erfüllung der analytischen Anforderungen von Unternehmen, indem es Entscheidungsträger in Bereichen wie Banken und Finanzen, Gesundheitswesen, Versicherungen, Einzelhandel und Fertigung unterstützt. Ergänzt durch Predictive-analytics-Tools ermöglicht es ihnen, Fakten über die für das Unternehmen wichtigsten Dimensionen wie Geographie, Demographie und Produkt zu messen.

Im Gesundheitswesen kann ein Data Warehouse beispielsweise zur Vorhersage von Gesundheitsrisiken und -ergebnissen, zur Erstellung von Berichten und zum Datenaustausch mit Versicherungsunternehmen eingesetzt werden. In der Versicherungsbranche können Data Warehouses zur Analyse von Kundentrends und Datenmustern eingesetzt werden. Im Einzelhandel können sie zur Verfolgung von Artikeln und Kaufmustern der Kunden sowie zur Festlegung dynamischer Preise genutzt werden.

In einem konkreteren Beispiel könnte ein CFO über die Finanzdaten seines Unternehmens nach Standort, Monat oder Produkt berichten wollen. Diese Elemente bilden die Dimensionen des OLAP-Würfels und bieten Möglichkeiten, diese Daten in die gewünschten Informationen umzuwandeln. Außerdem kann der CFO damit schnell und einfach einen individuellen Finanzbericht erstellen.

Ein weiteres Beispiel zeigt, wie ein OLAP-basiertes Data Warehouse im Marketing eingesetzt werden kann. Erstens kann es für Trendanalysen verwendet werden, da es Managern ermöglicht, zukünftige Ergebnisse aus historischen Ergebnissen vorherzusagen. Zweitens stützt sich das digitale Marketing stark auf Data Warehouses, um vielseitige Daten aus Webanalysen, PPC-Kampagnen, Display-Anzeigen, sozialen Kanälen, CRM und E-Mail-Dienstleistern zu erfassen. Drittens konzentrieren sich viele Unternehmen auf die Integration von Data Warehouses zur Marktsegmentierung, um detaillierte Analysen des Kundenverhaltens zu erhalten.

Application of a data warehouse in marketing

Dies ist nur ein kleiner Teil der möglichen Szenarien, wie Unternehmen Data Warehouses und insbesondere OLAP einsetzen können, um ihre Entscheidungsfindung zu verbessern und die Unternehmensleistung zu steigern. Es gibt noch viele weitere Anwendungsfälle, die zeigen, dass sich Data Warehouses schnell weiterentwickeln und die Unternehmen ihre Bedeutung erkennen.

Neue Vorteile eines Data Warehouse in Ihrem Unternehmen erschließen

Der Aufbau eines Data Warehouse für ein Unternehmen ist in vielerlei Hinsicht von Vorteil: Es ermöglicht die Durchführung umfassender Analysen, die einen Mehrwert schaffen und die Entscheidungsfindung unterstützen. Globale Giganten wie Apple, Walmart, eBay und Verizon analysieren ihre Daten mit Hilfe von Online-Analyseverfahren, um ihre Marktmacht zu erhalten und zu stärken. Jedes Unternehmen kann jedoch von einem operativen Data Warehouse profitieren.

Wenn die verfügbaren Informationen aktuell, schnell und skalierbar sind, ermöglichen sie Echtzeit-Big-Data-Analysen, die dazu beitragen können, ein umfassenderes Bild vom Zustand des Unternehmens zu erhalten. Das bedeutet auch, dass die eingehenden Daten konsistent und zuverlässig sind, wenn die richtigen Systeme vorhanden sind. Ein richtig genutztes Data Warehouse kann im Laufe der Zeit wirtschaftlich werden und einen sonst unerreichbaren Zugang zu unschätzbaren Informationen bieten.