Neo4j for Graph Data Science: Erstes Enterprise Framework für Data Scientists

Unternehmen sind erstmals in der Lage auf einfache Art und Weise bisher unlösbare Fragen mit Datenanalytik und Machine Learning zu beantworten

München, 8. April 2020 – Neo4j, führender Anbieter von Graphtechnologie, kündigt die Verfügbarkeit von Neo4j for Graph Data Science an. Das Framework verbindet native Graphanalytik und Graphdatenbank mit skalierbaren Graph-Algorithmen und anschaulicher Visualisierung. Damit erhalten Data Scientists ein zuverlässiges und benutzerfreundliches Toolset für die Analyse vernetzter Daten und das Erstellen von Machine Learning-Modellen.

Mit Neo4j for Graph Data Science können Anwender aussagekräftige, aber bislang weitgehend ungenutzte Beziehungen und Netzwerkstrukturen für ihre Analysen heranziehen. Anwendungsfälle reichen von der eindeutigen Nachverfolgung von Webseiten-Besuchern über mehrere Plattformen und Touchpoints hinweg bis zur Betrugsaufdeckung auf Grund verdächtiger Datenmuster oder der Erforschung von Krankheiten und ihren Behandlungsmöglichkeiten (z. B. Projekt COVID*Graph).

Das Framework bietet Data Scientists eine leistungsstarke und praxistaugliche Arbeitsumgebung: Die native und persistente Modellierung ermöglicht die flexible Projektion von In-Memory-Graphen. Dank des Visualisierungstools Neo4j Bloom können die Ergebnisse anschaulich dargestellt und geteilt werden, wodurch Lösungen schneller entwickelt werden können. Skalierbare Graph-Algorithmen lassen sich zudem in reproduzierbare Abläufe integrieren und erlauben datenbasierte Vorhersagen. Dazu gehören beispielsweise Community Detection- und Similarity Algorithmen zur Identifizierung von Clustern und Nearest-Neighbor-Heuristiken, Centrality Algorithmen zur Identifizierung von Influencern sowie Pathfinding und Link Prediction Algorithmen für topologische Mustererkennung.

Die wichtigsten Features im Überblick
– Optimierte, parallele Algorithmen zur Analyse über mehrere Milliarden Knoten und Kanten
– Bessere Datenintegration für schnellere Modellversuche (z. B. deterministisches Seeding)
– Ein parallel erstellter skalierbarer In-Memory-Graph zur flexiblen Anpassung und Projektion der zugrundeliegenden Graphdaten
– Veränderbarer In-Memory-Graph zur Überlagerung von Ergebnissen von Analyseschritten
– Benutzerfreundlichkeit mit logischem Speichermanagement, intuitiver API und umfangreicher Dokumentation und Beispielen
– Native Integration mit der Neo4j Graphdatenbank liefert maximale Leistung für Analysen und kompakte Speicherung
– Explorative Visualisierung des Graphen sowie der Algorithmen-Ergebnisse für bessere Zusammenarbeit von Data Scientists, Entwicklern und Entscheidern

„Die Annahme, dass mehr Daten die Genauigkeit erhöhen und False-Positive-Ergebnisse reduzieren, ist in der Datenanalyse ein weit verbreiteter Irrtum“, erklärt Alicia Frame, Lead Product Manager und Data Scientist bei Neo4j. „In Wirklichkeit übersehen viele datenwissenschaftliche Modelle die für Vorhersagen aussagekräftigsten Elemente innerhalb der Daten: ihre Verbindungen und Strukturen. Neo4j for Graph Data Science wurde genau deshalb konzipiert, um mit Hilfe der zugrundeliegenden Datenbeziehungen die Vorhersagegenauigkeit von Machine Learning-Modellen zu optimieren und bisher offene Fragen der Datenanalytik zu beantworten.“

„Die Bereitstellung relevanter Inhalte für unsere registrierten Online-Nutzer sowie andere Besucher, ist für unser Geschäft von entscheidender Bedeutung“, erklärt Ben Squire, Senior Data Scientist bei Meredith Corporation. Das US-amerikanische Medienunternehmen erreicht mit seinen Publikationen jeden Monat 190 Millionen Konsumenten – sowohl über TV und Print als auch digital, per Mobilfunk oder Video. „Wir verwenden die Graph-Algorithmen in Neo4j, um Milliarden von Seitenaufrufen in Millionen von pseudonymisierten Profilen umzuwandeln. Statt ‚irrelevante Werbung‘ anzubieten, verstehen wir unsere Kunden jetzt besser, was sich in signifikanten Umsatzgewinnen und höherer Kundenzufriedenheit äußert.“

Anwendungsfall Betrugsermittlungen
Die Betrugsaufdeckung (z. B. Identitätsdiebstahl, Betrugsringe, Steuerhinterziehung) betrifft viele verschiedene Branchen, darunter Finanzdienstleister, Versicherungen und staatliche Behörden. Selbst die kleinste Präventivmaßnahme kann zu Einsparungen in Millionenhöhe führen. Neo4j for Graph Data Science unterstützt Ermittler dabei, schrittweise ihre Betrugsbekämpfung zu verbessern, ohne bestehende Machine Learning-Pipelines zu verändern. Das folgende Beispiel verdeutlicht den Einsatz von Neo4j for Graph Data Science im Rahmen der Betrugsaufdeckung:

1. Ein Data Scientist ist in der Lage verdächtige Gruppen von Transaktionen mit Community-Detection-Algorithmen (z. B. Connected Components) zu ermitteln.
2. Als nächstes werden mit den Graph-Algorithmen Betweenness Centrality oder PageRank verborgene Strukturen aufgedeckt, wie z.B. Konten, die im Mittelpunkt ungewöhnlich transitiver Transaktionen stehen.
3. Ein Analyst kann diese Cluster anschließend mit Neo4j Bloom auf intuitive Weise untersuchen und Ergebnisse mit Betrugsexperten teilen, um Merkmale für kriminelles Verhalten abzuleiten.
4. „Was-wäre-wenn“-Analysen oder mehrere aneinander gekoppelte Graph-Algorithmen können zusammen im variablen In-Memory-Workspace ausgeführt werden, wodurch die Struktur der Graphen flexibel angepasst wird.
5. Ist die Abfolge der Algorithmen einmal validiert, kann sie für Machine-Learning-Modelle verwendet werden, um proaktiv und automatisiert Betrug zu verhindern und nicht nur aufzudecken.

Weitere Informationen zu Neo4j for Graph Data Science finden Sie auf der Neo4j Website sowie im Blog. Registrieren Sie sich im Rahmen des ersten Online-Events von Neo4j Connections für Vorträge und Demos rund zu Graph Data Science am 28. April.

Über Neo4j:
Neo4j ist führender Anbieter für Graphtechnologie, die Unternehmen wie Airbus, Comcast, eBay, NASA, UBS, Walmart entscheidende Innovationen und Wettbewerbsvorteile bietet. Tausende von Community- Projekten sowie mehr als 400 Kunden erschließen vernetzte Daten mit Hilfe von Neo4j, um Zusammenhänge zwischen Menschen, Prozessen, Standorten und Systemen aufzudecken. Der Fokus auf Datenbeziehungen ermöglicht es Anwendungen, die mit Neo4j entwickelt wurden, die Herausforderungen vernetzter Daten zu meistern – von künstlicher Intelligenz, über Betrugserkennung und Echtzeit-Empfehlungen bis hin zum Stammdatenmanagement. Weitere Informationen unter Neo4j.com und @Neo4j.

Firmenkontakt
Neo4j
Birgit Fuchs-Laine
Prinzregentenstraße 89
81675 München
089 41 77 61 13
neo4j@lucyturpin.com
http://www.neo4j.com

Pressekontakt
Lucy Turpin Communications
Birgit Fuchs-Laine
Prinzregentenstraße 89
81675 München
089 41 77 61 13
neo4j@lucyturpin.com
http://www.lucyturpin.de

Bildquelle: Neo4j

Neo4j for Graph Data Science: Erstes Enterprise Framework für Data Scientists