Unternehmen, die ihre Entscheidungen auf Daten und belastbare Erkenntnisse stützen, sichern sich einen entscheidenden Wettbewerbsvorteil und erschließen großes Potenzial für effizientere und optimierte Prozesse. Um diese Vorteile zu realisieren, müssen zunächst die richtigen Daten gesammelt und anschließend in geeignete Analysemodelle eingespeist werden – beispielsweise zur Prognose von Umsatz oder Absatz für zukünftige Zeiträume.
Business-Intelligence-Lösungen wie Power BI oder SAP Analytics Cloud unterstützen zwar einfache Prognoseverfahren und Planungsaufgaben, stoßen jedoch schnell an ihre Grenzen, sobald die Anforderungen komplexer werden.
Databricks ist eine umfassende Plattform für Machine Learning, Data Science und KI-Entwicklung, die sich hervorragend für die Erstellung innovativer und präziser Prognoseanwendungen eignet. Zwischen einfachen Planungsfunktionen und hochkomplexen, individuell entwickelten ML-Modellen liegt ein breites Feld für Predictive Analytics mit mittlerem Schwierigkeitsgrad – und genau hier setzt AutoML an. AutoML ermöglicht präzise Vorhersagen, ohne dass tiefgehende mathematische Expertise erforderlich ist.
Im Folgenden zeigen wir, wie sich Databricks AutoML für Zeitreihenprognosen nutzen lässt – und wie sich damit Geschäftsdaten mit minimalem Programmieraufwand in handlungsrelevante Erkenntnisse verwandeln.
Databricks vereint Data Engineering, Analytics und Machine Learning auf der Lakehouse-Plattform – einer integrierten Umgebung, die skalierbare Rechenleistung, zuverlässige Datenspeicherung und kontrollierte Zusammenarbeit zusammenführt.
In einem früheren Beitrag zu Databricks & MLflow haben wir bereits gezeigt, wie sich Experimente nachverfolgen, Modelle versionieren und Deployments vereinfachen lassen. Darauf bauen wir nun auf:
Ausgehend von einem einfachen Verkaufsdatensatz visualisieren wir zunächst Trends und Saisonalität, bevor Databricks AutoML potenzielle Prognosemodelle automatisch erkundet. AutoML trainiert und optimiert Modelle im großen Stil, generiert dabei nachvollziehbare Notebooks und registriert die Ergebnisse in MLflow. So lassen sich Modelle reproduzieren, anpassen und problemlos in den produktiven Betrieb überführen.
Unser Ziel: die monatlichen Gesamtumsätze eines Einzelhandelsunternehmens zu prognostizieren. Zunächst visualisieren wir die Verkaufsdaten - um Muster, Trends und saisonale Effekte zu erkennen.
Es zeigt sich ein deutliches Muster: Die Umsätze erreichen im März ihren Höhepunkt, sinken danach deutlich ab und erholen sich im weiteren Jahresverlauf langsam wieder.
Auf dieser Basis starten wir das Training und die Optimierung der Prognosemodelle. Dabei definieren wir Parameter wie Zeit- und Zielspalte, Prognosehorizont sowie Speicherorte für Modellregistrierung und Vorhersagen.
Anschließend startet das Experiment – AutoML übernimmt die gesamte Vorverarbeitung, Modelloptimierung und das Training vollständig automatisiert. Bereits nach wenigen Minuten stehen die Ergebnisse zur Verfügung, und das beste Modell wird im Unity Catalog gespeichert – bereit für den produktiven Einsatz.
Databricks AutoML testet und bewertet verschiedene Zeitreihenmodelle anhand von Kennzahlen wie MAPE (Mean Absolute Percentage Error), RMSE (Root Mean Square Error) und weiteren Metriken.
Ein automatisch erzeugtes Python-Notebook ermöglicht anschließend die Ausführung und Erstellung von Prognosen für zukünftige Zeiträume.
Das optimale Modell wird geladen, und Vorhersagen für die kommenden sieben Monate werden generiert. Die durch AutoML erstellte Visualisierung zeigt, dass die Prognose die tatsächlichen Werte sehr genau abbildet und die historischen Trends präzise fortschreibt.
Die Absatzprognose sagt einen deutlichen Frühjahrs Aufschwung voraus, gefolgt von einem kurzfristigen Rückgang und einer moderaten Erholung – ein Beleg dafür, dass das Modell zyklische und temporäre Marktdynamiken zuverlässig erfasst und somit wertvolle Erkenntnisse für die Geschäftsplanung liefert.
SAP-Systeme sind weit verbreitet und zählen zu den wichtigsten Quellen für betriebswirtschaftliche und operative Daten. Zwar lassen sich erweiterte Analysen auch außerhalb des SAP-Ökosystems durchführen, doch ist dies oft mit zusätzlichem Aufwand durch Drittanbieter-Tools oder individuelle Schnittstellen verbunden.
Mit der SAP Business Data Cloud steht nun eine integrierte Lösung zur Verfügung: Sie verbindet die SAP Datasphere direkt mit dem Databricks-Workspace – beispielsweise für die oben gezeigten AutoML-Zeitreihenprognosen.
Datenprodukte können dabei ohne Replikation zwischen SAP Datasphere und Databricks ausgetauscht werden. Databricks führt die AutoML-Experimente oder individuelle Machine-Learning-Workflows aus, während die Ergebnisse nahtlos zurück in das SAP-Analytik-Ökosystem oder externe BI-Tools wie Microsoft Fabric oder Power BI übertragen werden können.
Da SAP-Systeme stark auf Low-Code/No-Code-Oberflächen setzen, ist der Funktionsumfang zwar benutzerfreundlich, jedoch begrenzt. Mit den in Databricks AutoML verfügbaren Features lässt sich diese Lücke schließen:
SAP Databricks vereint die einfache Bedienbarkeit der SAP-Welt mit der Flexibilität einer professionellen Entwicklungsumgebung und fördert so datengetriebene Innovation direkt auf Grundlage verlässlicher Geschäftsdaten aus den operativen Quellsystemen.
Databricks AutoML macht Zeitreihenprognosen praxisnah, transparent und produktionsreif – in einem durchgängigen Prozess:
Das System automatisiert die Feature-Erstellung und Modellsuche, generiert nachvollziehbare Notebooks zur Prüfung und Anpassung, führt eine strenge Validierung mit Rolling-Backtests und Kennzahlen wie MAPE oder RMSE durch und erleichtert die Bereitstellung über MLflow und Unity Catalog.
Im gezeigten Beispiel liefert dieser End-to-End-Workflow nicht nur ein präzises Modell, sondern bildet auch saisonale Muster – wie Umsatzspitzen, Nachfragetäler und anschließende Erholungsphasen – realitätsnah ab.
Wer also schnelle, verlässliche und erklärbare Umsatzprognosen benötigt, findet in AutoML auf der Lakehouse-Plattform eine leistungsfähige Standardlösung.
Haben Sie Fragen zu diesem oder anderen Themen? Wir freuen wir uns darauf, mehr über Ihre Herausforderungen zu erfahren und helfen Ihnen gerne dabei, optimale Lösungen zu finden und diese umzusetzen.