DER SAP EXPERTEN BLOG
NEWS UND TRENDS ZU
SAP BI & BW

Was ist SAP Vora?

SAP Vora ist eine In-Memory Query Engine, die erweiterte interaktive Analysen auf Hadoop ermöglicht. Es nutzt und erweitert dazu das Big-Data Framework Apache Spark und basiert auf der In-Memory Technologie SAP HANA.

 

1.     Was ist das Ziel von SAP Vora?

Hauptzweck von SAP Vora ist, große Datenmengen aus Hadoop für Unternehmen zugänglich zu machen und auszuwerten. Es vereinfacht die Komplexität in der Verarbeitung von „Big Data“. Es soll die Nachteile von Hadoop beseitigen, dass Daten in einem Data Lake unstrukturiert und schwer zu verarbeiten sind. SAP Vora baut strukturierte Datenhierarchien für Hadoop-Daten auf. Es integriert sie mit Daten von HANA, um In-Memory-Analysen im OLAP-Stil zu ermöglichen. Dies erfolgt über eine Schnittstelle für die Apache Spark Structured Query Language (SQL).

Die Ziele dabei sind:

  • präzise Entscheidungen zu ermöglichen
  • Big Data Ownership zu vereinfachen
  • Datenzugriff zu demokratisieren
  • geschäftskritische Fälle aufzudecken 

Das Big-Data-System kann sowohl von SAP Kunden als auch von nicht SAP Kunden genutzt werden. 

 

2.   Was bedeutet der Name SAP Vora?

VORA ist die lateinische Wurzel von "VORAcious", was gefräßig oder unersättlich bedeutet.  Da Vora große Datenmengen verarbeiten kann und soll, beschreibt der Name treffend die Funktion.

 

3.    SAP HANA versus SAP Vora

SAP Vora hieß zu Beginn SAP HANA Vora. SAP HANA Vora wurde im September 2015 als On-Premise- und Cloud-Edition veröffentlicht. Dieser Name führte zu Verwirrung über die Beziehung zwischen SAP HANA und SAP HANA Vora. Vora ist eine völlig neue Codebasis und kann auf Standalone-Basis mit einem der Hadoop-Knoten existieren, kann aber auch in die klassische HANA integriert werden. Die Integration mit SAP HANA erfolgt nahtlos.

Mit dem Release von SAP Vora 1.4 im März 2017 wurde dieser Umstand durch die offizielle Umbenennung in SAP Vora deutlich gemacht.

SAP Vora - SAP HANA integration.jpg

Abb. 1: SAP HANA Integration: SAP Product Road Map, SAP Vora
https://www.sap.com/documents/2017/06/281ab428-c37c-0010-82c7-eda71af511fa.gate.html

 

4.   Wer profitiert von SAP Vora?

SAP Vora bietet vor allen folgenden Nutzern Vorteile:

  • Business-Analysten können Ursachenanalysen durchführen, indem sie interaktive Abfragen sowohl für Geschäfts- als auch für Hadoop-Daten durchführen, um den Geschäftskontext besser zu verstehen.
  • Data Scientist können Muster entdecken, indem sie neue Modellierungstechniken mit einer Kombination aus Geschäfts- und Hadoop-Daten ausprobieren, ohne Datenkopien innerhalb von Data Lakes zu duplizieren.
  • Softwareentwickler können eine Query-Engine in Anwendungen implementieren, die Unternehmens- und Hadoop-Systeme umfassen, indem sie vertraute Programmierwerkzeuge verwenden.

 

5.    Was sind Anwendungsfälle für SAP Vora?

Nach Angaben von SAP eignet sich Vora vor allem für Finanzdienstleister, Telekommunikationsunternehmen und Firmen im Gesundheitswesen und der Fertigungsindustrie.

Vora eignet sich vor allem für folgende Aufgaben:

  • Risikominimierung und Betrugsprävention, indem Unregelmäßigkeiten in Finanztransaktionen und historischen Kundendaten in Echtzeit aufgedeckt werden
  • Bandbreitenoptimierung in der Telekommunikation, indem Datenverkehrsmuster analysiert werden, um Netzwerkengpässe zu vermeiden und die Servicequalität zu verbessern
  • Vorbeugende Instandhaltung und Verbesserung der Prozesse für den Produktrückruf, indem Stücklisten, Datensätzen aus dem Service und Sensordaten gemeinsam untersucht werden.

6.   Was sind die Vorteile von SAP Vora?

Ab Vora 1.3 werden sogenannte „Engines“ unterstützt. Diese „Engines“ sind auf speziellen Einsatzbereiche spezialisiert:

  • Zeit-Reihe
  • Grafiken
  • Dokumentenablage
  • Disk Engine
  • Relational Engine

 

6.1         In-Memory Datenbank:

Alle Engines, außer der Disk-Engine, speichern ihre Daten in der In-Memory Datenbank. Die relationale Engine hat einen Mechanismus zum Auslagern der Daten auf die Festplatte. Dadurch sinkt die Leistung, aber die Datenmenge, die verarbeitet werden kann, steigt. Die Disk-Engine hebt die Daten nur zur Verarbeitung in die In-Memory Datenbank und legt sie anschließend wieder ab.

6.2        Integriertes Produkt

Man hat nun diese verschiedenen Engines in einem integrierten Produkt und muss sich nicht für mehrere, separate Engines entscheiden. Der Dokumentenspeicher umfasst NoSQL-Engines wie MongoDB, die nicht einmal Teil der typischen Hadoop-Auslieferungen sind.

6.3        Skalierbarkeit

Hadoop und Vora sind so konzipiert, dass sie grundsätzlich unendlich skalierbar sind und auch auf handelsüblicher Hardware laufen.

6.4        Verarbeitung von grafikbasierten Daten

Es gibt ein paar Optionen zum Speichern und Verarbeiten von Grafik-Daten in Hadoop, aber keine davon ist sehr komfortabel. Die Grafik-Engine bietet die Möglichkeit, grafikbasierte Daten zu speichern und zu verarbeiten.

 

6.5        Verarbeitung von zeitreihenbasierten Daten

Die Zeitreihen-Engine kann Sensordaten z.B. für vorausschauende Wartungsarbeiten oder Alarmierungsszenarien verarbeiten.

SAP Vora Distributed Computing for the Digital Enterprise.jpg

Abb. 2: SAP Vora: Distributed Computing for the Digital Enterprise, Quelle: SAP Product Road Map, SAP Vora
https://www.sap.com/documents/2017/06/281ab428-c37c-0010-82c7-eda71af511fa.gate.html

 

Ein Einsatzbeispiel:
Ein Unternehmen verfügt nicht über HANA, die Daten befinden sich in Hadoop. Um eine schnellere Datenanalyse und eine OLAP-Verarbeitung für einen großen Datensatz in Hadoop durchzuführen, kann Vora eingesetzt werden. Es ist eine Komponente, die auf Spark und Hadoop sitzt. SAP Lumira hat eine direkte Verbindung zu Vora hat, d.h. mit Lumira können Kunden Hadoop-Daten mit Hilfe von Vora analysieren und visualisieren.

 

7.    Was ist die aktuelle Version von SAP Vora?

SAP hat SAP Vora 2.0 am 14. September 2017 freigegeben. SAP hat auch den SAP Data Hub (https://www.sap.com/products/data-hub.html) veröffentlicht. Data Hub ist ein neues Produkt, das die Datenintegrations- und Orchestrierungsprobleme für SAP-Kunden mit Schwerpunkt auf Big Data-Technologien lösen soll. SAP Vora ist nun Teil dieses Angebots und wird von SAP nicht mehr als eigenständiges Produkt vermarktet.

Vora 2.0 unterstützt On-Premise-, Cloud- und Hybrid-Bereitstellung über Google Kubernetes und Docker-Container:

SAP Vora 2.0 Architecture

Abb.3: Architektur von Vora 2.0,
Quelle: https://blogs.sap.com/2017/09/25/vora-2.0-kubernetes-demystified/

  

8.   Wo kann ich SAP Vora testen?

Für den Vora-Test können Sie eine kostenlose Single Node Developer Edition als virtuelle Maschine herunterladen oder eine Instanz auf AWS ausführen. Sie finden die Links und die Dokumentation auf der SAP Vora bzw. SAP Data Hub-Seite. Registrierung ist erforderlich. Entwicklungs- und Testumgebungen sind kostenlos, was sich von anderen Hadoop-Herstellern unterscheidet, Management und Master-Knoten sind ebenfalls kostenlos.

 

Fazit:
SAP VORA ist eine gute Ergänzung für Unternehmen, die bereits auf SAP-Plattformen arbeiten. Solche Unternehmen können ihre Transaktions-, Data Lake- und anderen Datenquellen in Vora integrieren und Mash-Up-Abfragen für tiefgehende und interaktive Analysen erstellen.

 

Weitere Quellen:
SAP HANA VORA & Hadoop https://blogs.sap.com/2015/10/05/sap-hana-vora-hadoop/
VORA 2.0 & Kubernetes Demystified https://blogs.sap.com/2017/09/25/vora-2.0-kubernetes-demystified/
Product Road Map: https://www.sap.com/documents/2017/06/281ab428-c37c-0010-82c7-eda71af511fa.gate.html

Videos:
SAP HANA Vora: an Overview  https://www.youtube.com/watch?v=pdW2YMzc71I
SAP HANA Academy - Vora 2.0: Overview  https://www.youtube.com/watch?v=OY6BkpyWRWE

 

Auch interessant:
Was ist SAP HANA?
Was ist SAP Leonardo?

Über diesen Blog

Die Wissensexperten von Infocient Consulting, Mannheim, informieren Sie über Neuigkeiten aus der SAP BI und SAP BW-Welt. Unternehmensnachrichten und Erfahrungen unserer Auszubildenden zeigen Ausschnitte unseres spannenden Beratungsalltags.
Informieren Sie sich stets aktuell für Ihren Wettbewerbsvorteil - hier und auf unseren Social Media Kanälen wie Twitter, Facebook, Google+ und XING.

Top BI und BW Wissen

Aktuellste Beiträge

Infocient Mannheim - SAP Consulting