Big Data: Research School erörtert Innovationen im In-Memory Data Management

Bedeutende Geschwindigkeits- und Flexibilitätsvorteile bei der Analyse großer Datenmengen haben im Mittelpunkt eines zweitägigen Symposiums des Hasso-Plattner-Instituts gestanden, das am Freitag zu Ende ging.

Vor rund 100 Informatikforschern aus aller Welt betonte Institutsstifter und SAP-Mitgründer Prof. Hasso Plattner, es sei neuerdings zum Beispiel möglich, dass Handelskonzerne das Aufkommen von Verkaufsdaten aus zehn Jahren mit modernster Datenmanagement-Technologie innerhalb von Sekundenbruchteilen auswerten könnten – und das bei Datenvolumina von 330 Millionen Transaktionen pro Tag.

Eingesetzt würden dafür modernste, massiv parallel verarbeitende Mehrkernrechencluster mit riesigem Arbeitsspeicher von jeweils bis zu sechs Terabyte Kapazität sowie eine besonders effektive Daten-Organisation und -Komprimierung.

Plattner zeigte sich auf dem achten Symposium der HPI Research School glücklich darüber, dass Konzerne bereit seien, dem HPI solche Originaldaten – selbstverständlich in verfremdeter Form – für Forschungszwecke im Zusammenhang mit der hier untersuchten In-Memory-Technologie zur Verfügung zu stellen. „Es ist großartig, dass unsere Studenten dadurch eine innovative Lösung fast bis zur Produktreife entwickeln können“, sagte der Wissenschaftsmäzen.

Zusammen mit Studenten seines Fachgebiets demonstrierte Plattner, wie auf Basis von vier Milliarden Einträgen aus den Kassendaten eines Lebensmittel-Einzelhandelskonzerns blitzschnelle Analysen über Jahresumsätze einzelner Produkte und damit verbundene Verkäufe möglich sind. Auch Gewinn- und Verlustrechnungen erlaubt ein solches Tool praktisch in Echtzeit. Vorgestellt werden soll die Innovation einer breiteren Öffentlichkeit bereits am 5. Juli – beim Bachelorpodium des Hasso-Plattner-Instituts.

Mitverantwortlich für die blitzschnelle Antwortgeschwindigkeit ist nach Plattners Worten auch eine Datenbankarchitektur mit zwei intelligent verbundenen Speichern – ein Deltapuffer für die schnelle Speicherung von eingehenden Daten und ein leseoptimierter Speicher, der den Hauptteil der Daten enthält. In Verbindung mit der Fähigkeit, bereits berechnete Zwischenergebnisse zu speichern, ergebe sich so für den Anwender die Möglichkeit, analytische Berechnungen praktisch in Echtzeit, also auf Knopfdruck, ausgeführt zu bekommen. „Ich habe in meinem Berufsleben schon viele Caches gebaut, aber diese neue Lösung ist die beste, die je entwickelt worden ist“, erklärte Plattner. Sie sei bereits zum Patent angemeldet. Mit Blick auf künftige Anwender der neuen Technologie sagte Plattner: „Die Unternehmen werden Erfahrungen machen, die sie noch nie gemacht haben.“

Die am HPI erforschte und zusammen mit dem SAP-Konzern zum Produkt „HANA“ entwickelte Datenbank-Technologie ist nach Plattners Worten bereits zu einer Plattform geworden, auf deren Basis auch besonders viele Start-up-Unternehmen innovative Anwendungen entwickeln. Der HPI-Gründer und SAP-Aufsichtsratsvorsitzende sprach von mehreren hundert solcher Jungunternehmen. Bald würden es schon 1.000 sein, meinte er. Als ein weiteres Anwendungsbeispiel demonstrierte er gemeinsam mit HPI-Doktoranden die blitzschnelle Analyse von Meinungsbeiträgen und Informationen im Bereich der Online-Tagebücher („Blogosphäre“) und der sozialen Medien.

Fortsetzung auf Seite 2 mit interessanten Infos zur HPI Research School

Kennen Sie schon die Leinwände von Inspiring Art?