Python SAP HANA Connector by Nextlytics

SAP HANA & Python:
State of the Art Datenübertragung für Machine Learning

Steigende Datenmengen und rasante Veränderungen im Geschäftsalltag verlangen, dass sich auch die Analysen an die herrschende Geschwindigkeit der Daten anpassen. Die Programmiersprache Python mit ihren flexiblen, umfangreichen Bibliotheken im Data Science Bereich und das hochperformante In-Memory-Datenbankmanagementsystem SAP HANA sind eine unschlagbare Kombination für schnelle Datenanalysen. Jedoch werden die Möglichkeiten über die herkömmliche Datenbankverbindung ausgebremst. Die Daten sind in Echtzeit in der HANA abrufbar, werden allerdings über den Hana Database Client (hdbcli) Treiber nur nach und nach übertragen. Zudem wird der Upload von Daten durch das im Vorfeld zu definierende Schema der relationalen Datenbank im Gegensatz zu NoSQL-Datenbanktypen verkompliziert und die Verbindungsdaten sind nicht selten in Klarform im Code enthalten.

Durch eine Weiterentwicklung der Datenbankverbindung zwischen der SAP HANA und Python mit state-of-the-art Parallelisierung und benutzerfreundlichen Standardisierungschritten des Datendownloads und -uploads gewinnt der Entwicklungsprozess an Geschwindigkeit und Einfachheit.

Performance, Sicherheit und Benutzerfreundlichkeit für die Verbindung der SAP HANA mit Python

Der NLY SAP HANA Python Connector ist als Python Modul konzeptioniert um eine performante und sichere Verbindung mit der SAP HANA Datenbank über die Open Database Connectivity (ODBC) Schnittstelle herzustellen. Die Technologien PyArrow, Turbodbc und der sichere User Store (hdbuserstore) sorgen für eine zeitgemäße Datenverbindung speziell für den Data Engineering und Data Science Bereich:

Perfekt geeignet für fortgeschrittene Analysen

Stockbilder_parallelisierung

Performance durch Parallelisierung

Durch eine Parallelisierung erreicht der Datendownload mit dem SAP HANA Connector eine bis zu 9-fachen Geschwindigkeit im Vergleich zur Verbindung mit dem Standardtreiber von SAP. Im Upload kann sogar die 10-fache Geschwindigkeit erzielt werden.

Stockbilder_authentifizierung

Sichere Authentifizierung

Der Zugriff auf die HANA Datenbank mittels Connector erfolgt optimalerweise über die Authentifizierung mittels Token des HDBUSERSTORE. Dort sind die Verbindungsdaten der HANAclientseitig sicher hinterlegt. Eine alternative Anmeldung mit Nutzername und Passwort ist möglich, jedoch nicht notwendig.

Stockbilder_dataframes

Volle Kompatibilität mit Pandas DataFrames

Pandas DataFrames werden im Kontext der Künstlichen Intelligenz häufig für die Datenmanipulation verwendet. Mit dem HANA Connector werden die Daten nicht nur direkt in einen DataFrame geladen, sondern auch bei einem Upload werden dessen Datentypen entsprechend auf die HANA Datentypen gematched und noch nicht existierende Tabellen automatisch angelegt.

Stockbilder_entwicklungsprozess

Praktische Funktionen für den Entwicklungsprozess

Der Connector orientiert sich hinsichtlich seiner Funktionen eng am Arbeitsalltag von Entwickler*innen. Häufig verwendete SQL-Statements, wie die Ausgabe aller Tabellen eines Schemas, aller Spalten einer Tabelle und das Überprüfen auf die Existenz einer Tabelle sind in den Cursor als leicht zugreifbare Funktionen integriert.

Performance

Im Download kann die Datenübertragung um den Faktor 9 beschleunigt werden.

Total_Elapsed_Time_Flight_Data_Set

Neben der automatischen Datentypenkonversion sorgt die Verwendung der Parallelisierung für einen 10-fach schnelleren Upload

Total_Elapsed_Time_FLIGHT_DATA_Set

Anwendungsbereiche

AI

Anwendungsbereich: Künstliche Intelligenz

Sie sollten aus Ihrem Dashboard immer die richtigen Antworten auf Ihre Fragen bekommen. Als Experte für Dashboarding mit SAP Lumira 2.0 und SAP Application Design bescheren wir Ihnen mit unserem ganzheitlichen Projektansatz aussagekräftige Dashboards, die Ihnen genau die Antworten liefern, die Sie benötigen. Mit jahrelanger Erfahrung auf diesem Gebiet und einem Team aus spezialisierten Experten machen wir Ihr Projekt zu unserem gemeinsamen Erfolg.

Anwendungsbereich: Data Engineering

Eine flexible Datenmanipulation von Daten ist in Python mit den HANA Konnektor schnell realisiert und mit einem Geschwindigkeitsvorteil ausführbar. Produktive Systeme profitieren zusätzlich von dem Failover-Support, welcher durch den hdbuserstore geboten wird. Durch effiziente Speicherformate ist der Speicherbedarf beim Datenabruf stark reduziert.

Data engineering

Installation

Der NextLytics Python SAP HANA Connector wird als Python Modul installiert. Die Einrichtung des hdbuserstores ist ebenfalls in der Dokumentation enthalten und ein CLI Tool vereinfacht die Einrichtung und Verbindungsverwaltung.

SAP HANA Connector

Fragen oder Interesse am Python SAP HANA Connector?
Sprechen Sie uns gerne an.

NextLytics steht Ihnen stets als erfahrener Projektpartner zur Seite. Wir helfen Ihnen, Ihre Datenprobleme von der Datenintegration bis zum Einsatz von Machine Learning Modellen effektiv zu lösen. Nutzen Sie das unten stehende Formular, um Ihre Fragen an uns zu richten und wir melden uns schnellstmöglich bei Ihnen. 

Wir freuen uns von Ihnen zu lesen!

Markus
Markus Suhr, Consultant Data Science & Engineering
Sebastian_Uhlig
Sebastian Uhlig, Solution Architect & Co-CEO

Kontaktieren sie uns