Microsoft legt bei Power BI seit jeher eine enorme Entwicklungsgeschwindigkeit vor. So hat sich die Self-Service-Suite in den vergangenen Jahren zunehmend zu einer umfassenden Analytics-Lösung für ganze Unternehmen gewandelt. Und jetzt kommt auch noch Automated Machine Learning – kurz: AutoML – hinzu. Fachanwendern soll es dadurch ermöglicht werden, ML-Modelle ohne Programmierung bzw. die Unterstützung von Data Scientists zu trainieren, qualitätszusichern und in Betrieb zu nehmen.
Da stellt sich der eine oder andere sicherlich die Frage, ob das heißbegehrte Berufsbild des Data Scientist etwa schon wieder ausgedient hat? Ich will dem nachgehen und habe mir daher mal etwas genauer angeschaut, in wie weit AutoML in Power BI das hält, was es verspricht.

Power BI und Künstliche Intelligenz
Werfen wir zunächst einen allgemeinen Blick auf die Einbindung von Künstlicher Intelligenz in Power BI. Wie sich zeigt, hat das Entwickler-Team von Anfang an großen Wert auf KI-getriebene Funktionen gelegt. Dabei ging es nicht nur darum, irgendwelchen ML-Skripte in R oder Python einzubinden, so wie es bei vielen Softwareanbietern der Fall ist. Von Anfang an standen Funktionen im Fokus, die selbständig Daten analysieren und darstellen.
Hier sei nur auf die jeweiligen Release Notes verwiesen:
- Power BI Q&A (Juni 2014)
- Quick Insights (November 2015)
- Integration von R (Juli 2016)
- Explain Increase & Decrease (September 2017)
- Integration von Python (August 2018)
- Anbindung von Cognitiv Services & Azure AutoML (November 2018)
- Key Influencer Chart (Februar 2019)
Im März 2019 folgte dann AutoML, das wir uns nun genauer anschauen wollen.
Machine Learning Services in Azure
Mircosoft hat mit dem Relaunch der Azure Machine Learning Services im September 2018 eine sehr spannende neue Technologie und Laufzeitumgebung für Data Science und KI bereitgestellt. Data Scientists können auf dieser Basis schneller vom erstem ML-Modell zur fertigen KI-Lösungen gelangen. Ein Bestandteil dieser Umgebung ist Auto ML. Auto ML nutzt ein für eine spezifische Aufgabenstellung aufbereitetes Dataset und testet verschiedene Machine-Learning-Algorithmen – aktuell sind 39 Stück sind verfügbar – unter unterschiedlichen Parametrisierungen. Im Anschluss wählt AutoML das beste Modell aus, um es direkt für Vorhersagen oder Kategorisierungen zu verwenden. Der Nutzer legt hierbei lediglich den Zeit- und Kostenrahmen sowie die Zielmetrik – also Regression, Klassifikation oder Vorhersage – fest. Ein wirklich praktisches Stück Software, dass in vielen Data-Science-Projekten eine Menge Zeit und Kosten einsparen kann.

AutoML in Power BI
Obwohl Azure Automated Machine Learning einfach zu verwenden ist, verlangt es immer noch Programmierkenntnisse. Microsoft hat nunmehr die AutoML-Funktion aus Azure in den Power-BI-Premium-Dienst integriert, um Machine Learning einer noch breiteren Schicht an Anwendern zu ermöglichen. Microsofts Strategie „AI for everyone“ wird damit erneut unterstrichen. Denn: In Kombination mit den in Power BI verfügbaren Data Flows (ehemals Power Query) kann der Anwender seine Daten im wahrsten Sinne des Wortes zusammenklicken und im Anschluss durch Machine Learning anreichern. Das Ganze geht erstaunlich einfach, wie im folgend GIF zu sehen:

Als Ergebnis erhält der Nutzer ein Power-BI-Dataset inklusive Vorhersagen bzw. Klassifikationen. Hinzu kommt ein Bericht, der die einzelnen Algorithmen und Iteration von AutoML bewertet und die schlussendliche Leistung darstellt. Dabei gilt es anzumerken, dass dieser Prozess ausschließlich innerhalb von Power BI Premium oder Power BI Embedded A3 (oder größer) zur Verfügung steht. Die IT muss also einem Power BI Workspace eine Premium- bzw. Embedded-Ressource hinzufügen. Dann stehen aber auch schon alle Funktionalitäten bereit. Anwender und Data Scientists müssen sich um nichts weiter kümmern. Einfacher geht es kaum!

Werden Data Scientists überflüssig?
Die AutoML-Umgebung in Power BI ist also tatsächlich sehr leicht zu bedienen. So können auch Anwender KI nutzen, die nicht die Möglichkeit haben, sich intensiver mit Data Science zu beschäftigen. Womit wir zur Eingangsfrage zurückkehren: Ersetzt AutoML in Power BI die teuren und raren Data Scientists?
Um die Antwort vorwegzunehmen: So einfach kann KI die vielfältigen Fertigkeiten eines Data Scientists nicht abbilden. Auto ML in Power BI vermittelt den Eindruck, dass der Anwender nur fachliche Kompetenz benötigen würde. Den Rest regelt dann die Software wie von Geisterhand. Dabei wird übersehen, dass die Kernaufgaben in Data-Science-Projekten beim Übersetzen fachlicher Anforderungen in ein für Machine Learning brauchbares Datenmodell liegt. Hierbei sind mathematische und statistische Kenntnisse ebenso gefragt wie Programmierfähigkeiten. Die Aufbereitung erfordert ein tiefgreifendes Verständnis über die Struktur und Inhalte der Daten. Infolgedessen habe ich in vielen Projekten beobachten können, dass selbst Kunden mit hervorragender Datengrundlage – wie einem soliden Data Warehouse oder Realtime-Sensordaten – sich schwertun, diese Daten in ein ML-taugliches Model zu bringen.
In Zukunft kann es durchaus sein, dass es Softwarehersteller gelingt, auch den Schritt der Datenmodellierung zu erleichtern oder gar zu automatisieren. Microsoft könnt hier beispielsweise auf seinem Common Data Model aufbauen und Blaupausen für spezifische ML-Herausforderungen wie Customer Churn oder Umsatzprognose erstellen. Zum aktuellen Zeitpunkt ist jedoch ein Analyst oder Data Scientist nicht zu ersetzten, der die Daten in die passende Form bringt. Nicht zuletzt verlangt auch die Interpretation der Modelle und die Auswertung der Ergebnisse noch immer entsprechendes Expertenwissen. AutoML kann hier selbst im Power-BI-Kontext nur einen Teil der Arbeit abnehmen.
Preis-Leistungs-Verhältnis
Somit gilt es beim Einsatz von AutoML in Power BI auch das Preis-Leistungsverhältnis abzuwägen. Eine Lizenz für Power BI Premium oder Power BI Embedded SKU A3 liegt bei mindestens 2.477 Euro (Listenpreis April 2019) pro Monat für rund 10 GB Arbeitsspeicher mit vier virtuellen CPUs. Maximal sind 100 GB Arbeitsspeicher für gut 20.000 Euro pro Monat möglich. Theoretisch ließe sich AutoML in Power BI auch nur stundenweise für die Dauer des Trainings nutzen. Allerdings sind die Modelle nicht mehr verfügbar, sobald Power BI Premium oder die Embedded-Komponente abgeschaltet werden. Zudem nutzen Premium-Kunden ihre Ressourcen aktuell primär für andere Zwecke, wie schnellere und größere Berichte, kapazitätsbasierte Lizensierungen oder auch für die Einbettung in andere Anwendungen. Diese Szenarien müssten sich die ohnehin schon knappen und teuren Kapazitäten mit Auto ML teilen. Allein die Größe des verfügbaren Arbeitsspeichers schließt große Machine-Learning-Projekte aus. Wer also Auto ML verwenden möchte, der sollte eher auf die frei skalierbaren und deutlich günstigeren Azure Machine Learning Services ausweichen, die sich ebenfalls leicht in Data Flows einbetten lassen. Hierfür ist allerdings etwas Python-Coding-Know-How gefragt.
Fazit
AutoML ist meiner Meinung nach ein weiterer, spannender Entwicklungsschritt in der Power-BI-Historie, der dem Nutzer neue Anwendungsfelder erschließt. Klassische Data-Science-Projekte oder hoch skalierbare Lösung werden hierdurch allerdings nicht abgedeckt. So ist die neue Power-BI-Funktion vor allem als ein schöner Einstieg in die spannende Welt der Data Science zu betrachten.
Kommentare (0)