
Data mesh – The next-generation enterprise data platform?
PwC study 2022: Changing data platforms.
Microsoft Fabric ist eine neue und umfassende Software-as-a-Service (SaaS)-Analyseplattform, die von Microsoft angeboten wird. Fabric ist als One-Stop-Shop-Lösung für alle Arten von Daten- und Analyse-Workflows in einem Unternehmen gedacht und deckt Funktionen von der Datenintegration bis hin zu Data Engineering, Data Science, Echtzeitanalysen und Reporting ab. Fabric kombiniert im Wesentlichen drei bewährte Azure-Datendienste (Data Factory, Synapse und Power BI) und erweitert sie um Echtzeit- und Co-Pilot-Funktionen, alles in einem einheitlichen Plattform- und Kapazitätslizenzmodell. Fabric macht die manuelle Einrichtung, Wartung und Konfiguration der zugrundeliegenden Cloud-Dienste überflüssig, was eine neue Stufe der Selbstbedienung bei der Entwicklung von Datenprodukten und Analyselösungen ermöglicht. Fabric fördert die Zusammenarbeit aller Datenexperten, von Data Engineers und Data Scientisten bis hin zu Datenanalysten und Datenkonsumenten, auf einer gemeinsamen Plattform, was zu einer schnelleren Wertschöpfung aus Daten für das Unternehmen führt.
Das Zusammenspiel der verschiedenen Komponenten von Microsoft Fabric wird deutlich, wenn man sich ein Anwendungsbeispiel ansieht. So möchte ein Unternehmen beispielsweise Finanzdaten aus einem ERP-System mit Kundendaten aus einem CRM-System kombinieren, um den Customer Lifetime Value (CLV) vorherzusagen und die Kundensegmentierung entsprechend anzupassen.
Integrieren: Die Implementierung dieses Anwendungsfalls beginnt mit der Integration von Finanzdaten und Kundendaten mit Data Factory. Entwickler können die Co-Pilot-Funktionalitäten in Microsoft Fabric nutzen, um den Prozess zu beschleunigen.
Transformieren: Als Nächstes werden die Daten transformiert, harmonisiert und über Notebooks kombiniert, die auf einer Spark-Engine basieren, die in Microsoft Fabric integriert ist.
Serve: Die Daten werden über einen SQL-Endpunkt an Power BI geliefert, entweder über das Fabric Data Warehouse (beschränkt auf strukturierte Daten, die nach Datenbanken, Schemata und Tabellen organisiert sind) oder direkt über den OneLake von Microsoft Fabric (offen für jeden Datentyp, organisiert nach Ordnern, Dateien, Datenbanken und Tabellen).
Kondumieren: Beide Ansätze lassen sich mit dem DirectLake-Modus leicht in Power BI integrieren, indem Sie Parquet-formatierte Dateien direkt aus OneLake laden, anstatt Daten in Power BI-Datensätze zu importieren oder zu duplizieren.
Optimieren: Um den erstellten Power BI-Bericht mit prädiktiven Erkenntnissen zu ergänzen, werden mit Synapse Data Science in Fabric Machine Learning-Modelle zur Vorhersage des CLV und zur Klassifizierung von Kunden erstellt.
Live: Damit jeder im Unternehmen kontinuierlich CLV-Modelle und Kundensegmente anwenden kann, kann Synapse Real Time Analytics in Fabric genutzt werden, um optimierte Geschäftsentscheidungen auf Basis von Live-Daten zu treffen, und der Data Activator in Fabric kann automatisch Maßnahmen ergreifen, wenn Muster oder Bedingungen in sich ändernden Daten erkannt werden, z.B. um ein neues Segment zu erstellen.
Der beschriebene Anwendungsfall könnte auch innerhalb von Azure Synapse als einheitliche Plattform für Data Warehousing und Analysen oder innerhalb von Azure Databricks als integrierte Notebook-basierte Analyse- und KI-Plattform implementiert werden. Microsoft Fabric bietet jedoch Vorteile wie:
Microsoft Fabric vereint all diese technischen Möglichkeiten in einem Arbeitsbereich und macht sie so für den „Data Citizen“ leichter zugänglich. Aber braucht jetzt jedes Unternehmen Microsoft Fabric? Bedenken Sie die folgenden Fragen:
Um die technische Komplexität zu reduzieren und die Governance zu vereinfachen, könnte Microsoft Fabric die richtige nächste Evolution Ihrer Datenplattform sein.
Warum?
Die Lakehouse Architektur wird in den meisten modernen Datenplattformen verwendet, weil es eine offene und kontrollierte Grundlage ist, die die besten Elemente von Data Lakes und Data Warehouses kombiniert.
Wie?
In Fabric transformieren Notebooks die Daten und speichern sie im Lakehouse unter Verwendung einer gemeinsamen Struktur, z.B. der Medaillon-Architektur.
Neu in Fabric?
OneLake-Integration - Erstellen Sie Verknüpfungen von Lakehouses und führen Sie SQL-Abfragen auf Ihren Daten durch und reduzieren Sie die Fragmentierung des Datenbestands.
Nutzen Sie Daten innerhalb Ihres Unternehmens noch effektiver auf der Grundlage moderner Datenplattformkonzepte wie Data Mesh und Data Fabric.
PwC study 2022: Changing data platforms.
Das Business Analytics Team von PwC hilft Ihnen, Daten zu analysieren und Erkenntnisse zu gewinnen, mit denen sich fundierte Entscheidungen treffen lassen.
Was macht eine gute Datenstrategie aus? Eine Studie von PwC hat fünf zentrale Faktoren identifiziert.
Ein effektives und effizientes Data-Management-System und Data-Framework bilden die Grundlage für die Finanzfunktion der Zukunft.