Moderne Datenarchitekturen für Analytics

Ihr Experte für Fragen

Stephan Bautz
Senior Manager bei PwC Deutschland
Tel.: +49 170 536 1456
E-Mail

 

Data Architecture – Zentraler Baustein für datengetriebene Entscheidungen

Datenarchitekturen haben sich in den letzten Jahren stark geändert. Dabei haben sich neben den bekannten Lösungen (Data Warehouse / Data Lake) auch weniger bekannte (z. B. Data Fabric) oder Mischformen (z. B. Data Lakehouse) als Best Practices etabliert, die aber wenige Jahre später schon wieder überholt wurden. Diese schnellen Evolutionsschritte zeigen, dass es vor allem wichtig ist, auf die sich ändernden Anforderungen durch neue Daten-Use-Cases eingehen zu können und dabei gleichzeitig flexibel in der zugrundeliegenden Technologie zu sein.

Moderne Datenarchitekturen stellen keine Technologie in den Fokus, sondern ermöglichen Mitarbeitende die Verantwortung für ihre Daten(-produkte) zu übernehmen.

Die Erfahrung aus einer Vielzahl von Projekten zeigt, dass es auf 6 zentrale Elemente ankommt, die Hand in Hand gehen und sauber aufeinander abgestimmt werden müssen: (1) Anwendungsfälle, (2) Daten, (3) Technologie, (4) Prozesse, (5) Mitarbeiter & Organisation sowie (6) Kultur. Dass es bei Datenarchitekturen nicht mehr nur um Technologien geht zeigt vor allem der neueste Trend, das Data Mesh, indem es die Organisation und damit vor allem Prozesse, Mitarbeiter und Kultur in den Vordergrund stellt.

Viele Beteiligte, eine Architektur

Eine moderne Data Architecture lässt die Grenzen zwischen Datenarchitektur und Technologiearchitektur verschwimmen und sorgt dafür, dass Anwendern benötigte Daten in der richtigen Qualität, Geschwindigkeit und Granularität zur Verfügung stehen. Gleichzeitig sind viele unterschiedliche Stakeholder am Lifecycle und an den Prozessen eines Datensatzes beteiligt. Von Entstehung und Ablage in einem Speicher über die Erzeugung von Datenprodukten, der Verifikation, der Nutzung in AI-Modellen und der Bereitstellung in einem Data Marketplace bis zur finalen Nutzung sind viele Methoden, Technologien und Teams beteiligt. Diese arbeiten teils zentralisiert, wie man es bei großen Speichern wie Data Lakes kennt, bis hin zu hochspezialisierten Teams, die im Business sitzen. Wir unterstützen Sie dabei, eine moderne Data Architecture zu entwerfen, die aus dieser Landstraße eine Autobahn macht.

Infografik: Übersicht einer modernen Data Architecture

Unsere Services im Überblick

Data Readiness Assessment

Anhand weniger definierter Fragen bewerten wir anhand einer effizienten Analyse die aktuelle Reife der analytischen Fähigkeiten Ihrer Datenlandschaft. Hierdurch erhalten Sie eine schnelle Einordnung und können die nächsten Schritte zum Steigern des Reifegrades strukturiert angehen.

Data Strategy

Wir entwerfen zusammen mit Ihnen – anhand der Business- und IT-Ziele sowie der geplanten analytischen Use Case Pipeline und internen & externen Einflüssen – die Vision und Mission der Plattform. Diese wird neben den internen Einflüssen von uns durch eine Bewertung der externen Einflüsse sowie einer Outside-In View erweitert.

Data Architecture

Für Architekturen gibt es keine one-size-fits-all Lösung. Data Warehouse (DWH), Data Lake, -Mesh, -Fabric sowie -virtualization, -Marketplaces und andere Architekturmuster haben sich etabliert, um Daten zu strukturieren. Oft werden auch Kombinationen verwendet, da sich die neue Plattform in die bestehende IT-Landschaft einfügen muss.

Um die richtige Architektur zu finden, nehmen wir Business-, IT-, und Datenstrategie als Grundlage und sorgen somit dafür, dass die Plattform das Erreichen der Ziele optimal unterstützt.

Implementierung

Da wir sicher sind, dass die von uns definierten Architekturen und Lösungen zielführend für das Erreichen Ihrer Ziele sind, begleiten wir die Implementierung der Architektur sowie die Umsetzung der ersten Use Cases. Hierbei stellen wir gleichzeitig sicher, dass alle regulatorischen Anforderungen der Plattform (vgl. DSGVO) sowie der Umsetzung der Use Cases (vgl. Responsible AI) beachtet werden.

Coaching

In allen Phasen “From Strategy through Execution” stehen wir Ihnen nicht nur bei Fragen zur Architektur und Hands-On bei der Implementierung zur Verfügung, sondern befähigen auch Ihre Fachbereiche in Aufbau, Betrieb und Nutzung der Plattform, damit das Wissen bei Ihnen bleibt.

Zentrale vs. Dezentrale Architekturen

Der in den letzten Jahren oft verwendete Data Lake ist ein Architektur-Pattern, bei dem Daten zentral in einem skalierbaren Datenspeicher abgelegt und von ebenfalls zentralisierten Teams verwaltet werden. Dazu zählen vor allem die Rollen Data Ingestion, Data Engineering / Data Quality und Data Science, welche zentral aufgebaut wurden, um analytische Use Cases im ganzen Unternehmen zu ermöglichen.

In letzter Zeit hat sich mit dem Data Mesh Konzept ein neuer Trend entwickelt, der diese zentralen Teams als Bottleneck identifiziert und versucht, durch organisatorische Anpassungen die Schwachstellen des Data Lake Konzepts aufzulösen. Gleichzeitig wird in einem Data Mesh auch der Umgang mit Daten geändert, da diese als sogenannte „Data Products“ bereitgestellt und wiederverwendet werden. Das Data Mesh Konzept greift dabei Einflüsse aus den Lösungsmustern „Microservice“, „Data Fabric“, „Data Virtualization“ und „Data Marketplace“ auf und kombiniert diese mit einer zentralen Dateninfrastruktur.

Was empfehlen wir?

Jedes Unternehmen ist einzigartig in seinen Businesszielen, den bestehenden Systemen sowie in der Datenorganisation und -kultur. In unserem Ansatz nutzen wir einen Readyness-Check um Ihren individuellen Stand zu evaluieren und eine Vision & Mission abzuleiten. Darauf aufbauend entwickeln wir gemeinsam mit Ihnen ein strategisches Zielbild, dass im Folgenden weiter verfeinert und implementiert wird.

Infografik: Roadmap

Weitere Schwerpunkte von Data Intelligence

Follow us

Contact us

Andreas Hufenstuhl

Andreas Hufenstuhl

Partner, Data & AI Use Cases, PwC Germany

Tel.: +49 1516 4324486

Stephan Bautz

Stephan Bautz

Senior Manager, PwC Germany

Tel.: +49 170 5361456

Hide