Steuerungsdaten

Echtzeiteinsichten.

Streaming Analytics steigert die Wettbewerbsfähigkeit von Unternehmen. Prognosen werden geschärft, Entscheidungen besser unterfüttert. Die Umsetzung sollte zunächst mit kleinen Pilotprojekten beginnen.

* Von Dr. Ilias Ortega, Trivadis

 

Herkömmliche Business Intelligence-Systeme stellen Unternehmen meist nur vergangenheitsorientierte Auswertungen zur Verfügung. Die als Grundlage benutzten Daten sind oft zwischen einem Tag und einem Monat alt – oder sogar noch älter. Obschon die Entscheider daraus nützliche Angaben über den bisherigen Geschäftsverlauf erhalten, zuverlässige Aussagen über die zukünftige Entwicklung erscheinen damit kaum möglich. 

Um sich in der dynamischen und vernetzten Wirtschaftswelt zu behaupten, benötigen Organisationen zunehmend möglichst aktuelle Informationen. Viele streben deshalb Realtime-Systeme an, die Daten «live» auswerten, um daraus Aussagen über zukünftige Entwicklungen zu liefern und dem Management frühzeitig Handlungsoptionen zu eröffnen. 

Organisationen erhalten Daten in Form von kontinuierlichen Datenströmen, die von Sensoren, Geldautomaten, Online-Shops und vielen anderen Quellen rund um die Uhr und dezentral gesammelt werden. Dies trifft auf viele Bereiche zu wie etwa Finanzen, Überwachung/Strafverfolgung oder industrielle Produktion. Organisationen aus diesen Bereichen müssen Informationen aus kontinuierlichen Datenströmen sammeln, bearbeiten und analysieren, um daraus Prognosen zu erstellen sowie Muster und Ausreißer in Echtzeit zu identifizieren. 

 

Streaming Analytics
Hierbei kann das Verfahren «Streaming Analytics» (SA) helfen. Es verfolgt das Ziel, Realtime-Informationen derart rasch zu bearbeiten, dass die Auswertungen ebenfalls in Echtzeit bereitliegen. Das hohe Volumen der Datenströme sowie deren kurze Latenz lässt den Einsatz herkömmlicher Data Warehouses nicht zu, da dort sämtliche Daten in zeitaufwendige Abläufe vorerst zentral gesammelt, gespeichert, bearbeitet und ausgewertet werden. Moderne IT-Systeme basieren auf verteilter Datensammlung und -verarbeitung (Distributed Computing), daher ist eine Datenbearbeitung und -analyse in Echtzeit nur auf verteilter Basis praktikabel. Typische SA-Anwendungen sind:

  • Mikrosegmentierung in Realtime im Handel, um maßgeschneiderte Angebote zu erstellen,
  • Monitoring komplexer Produkte wie Transportmittel und Anlagen, um bei geahnten Problemen frühzeitig zu intervenieren, etwa durch das vorbeugende Bereitstellen von Ersatzteilen,
  • Mustererkennung, wie die Suche nach Anomalien in Zeitreihen, um Kreditkartenbetrug oder Steuerhinterziehung aufzudecken,
  • Durchsuchen von Daten, um Abhängigkeiten zwischen Parametern zu entdecken,
  • Empfehlungssysteme, um (wie beispielsweise Amazon) potentielle Kunden auf weitere interessante Produkte aufmerksam zu machen.

SA-Systeme müssen hohe Anforderungen an die Durchlaufgeschwindigkeit der Daten erfüllen, um schnelle Auswertungen zu gewährleisten: Im Finanzhandel beispielsweise sind Anwendungen mit mehreren Millionen Transaktionen pro Sekunde üblich. Die unter anderem von Sensoren gesammelten Datenströme sind heterogen und oft unstrukturiert, wie etwa Audio- und Video-Signale. 

Bevor indes die Daten für die analytische Auswertung mithilfe der Statistik oder des Data Minings bereitstehen, werden sie mit Verfahren der Signalverarbeitung – wie zum Beispiel Filtern und Glätten – bereinigt und angeglichen, um störende Faktoren wie das Rauschen und Übertragungsfehler zu eliminieren. 

In der Unternehmenspraxis sollten die in Echtzeit eingesetzten analytischen Verfahren einen guten Kompromiss zwischen Geschwindigkeit und Genauigkeit darstellen. Ein permanentes, automatisiertes Anpassen der Verfahren ist notwendig, um ihre Genauigkeit aufrechtzuhalten. Die Praxis zeigt, dass sich SA ohne Einschränkungen auch bei sehr großen Informationsbeständen (Big Data) problemlos anwenden lässt. SA integriert die Elemente folgender Disziplinen: 

  • verteilte Datenhaltung und -verarbeitung, 
  • Signalverarbeitung sowie 
  • Statistik und Data Mining. 

 

Mehrere Modelle empfehlenswert.
Da ein einzelnes analytisches Modell für komplexe Fragestellungen nicht immer ausreicht, sollten Organisationen ein kombiniertes Vorgehen wählen: Anstelle eines einzigen Modells werden mehrere parallel eingesetzt. Dieses hybride Modell löst Abweichungen und Widersprüche zwischen den Einzelergebnissen. Dabei kommen vor allem zwei Methoden zum Einsatz: die Stimmenmehrheit bei einer Abstimmung und gewichtete Mittelwerte.

Unter hohem Zeitdruck ist es jedoch nicht immer möglich, mehrere Modelle parallel zu berechnen und zu konsolidieren. In solchen Fällen helfen Regeln, nach denen automatisch ein geeignetes Modell ausgewählt und ein einziges Ergebnis berechnet wird (regelbasiertes Modell).

 

Fallbeispiel: Kreditkartenbetrug.
Ein gutes Beispiel für den Einsatz von SA-Systemen ist die Erkennung von Kreditkartenbetrug. Dabei geht es darum, potenziell betrügerische Finanztransaktionen in Echtzeit zu erkennen – das heißt, die Transaktionen korrekt zu klassifizieren. Solche Systeme müssen allerdings in der Lage sein, Tausende von Transaktionen pro Sekunde auf Betrug zu überprüfen. Folgende Kombinationsfälle lassen sich bei der Klassifikation von Finanztransaktionen unterscheiden:

  • betrügerische Transaktion, korrekterweise als betrügerisch klassifiziert,
  • berechtigte Transaktion, fälschlicherweise als betrügerisch klassifiziert,
  • berechtigte Transaktion, korrekterweise als berechtigt klassifiziert,
  • betrügerische Transaktion, fälschlicherweise als berechtigt klassifiziert.

Bei einem System zur Erkennung von Kreditkartenbetrug geht es vor allem darum, die folgenden zwei Arten von Klassifikationen zu minimieren: Bei der einen geht es um die Anzahl berechtigter Transaktionen, die fälschlicherweise als betrügerisch gemeldet werden. In der zweiten steht die Anzahl betrügerischer Transaktionen im Mittelpunkt der Analyse, die fälschlicherweise als berechtigt klassifiziert werden.

Doch die Zahl beider unerwünschter Klassifikationen lässt sich nicht gleichzeitig minimieren. Denn die Klassifikationen, die betrügerische Transaktionen als berechtigt angeben, führen zu unentdecktem Missbrauch. Andererseits können berechtigte Transaktionen, die als betrügerisch «erkannt» werden, die Kunden stark verärgern. 

Daher bedarf es eines Kompromisses: Ein effizientes System zur Erkennung von Kreditkartenbetrug lässt sich umsetzen, indem für jede einzelne Transaktion eine Verdachtsstufe in Echtzeit ermittelt wird. Aufgrund der hohen Komplexität ist dazu ein hybrides Prognosemodell erforderlich: 

Dabei berechnet jedes Einzelmodell zunächst eine Betrugswahrscheinlichkeit auf einer Skala von 0 bis 1 und erhält ein Gewicht. Die Summe der Einzelgewichte aller Modelle ergibt den Wert 1. Die resultierenden gewichteten Wahrscheinlichkeiten werden anschließend addiert. 

Um Betrugsfälle möglichst zielsicher zu identifizieren, werden Schwellwerte für die gewichteten Betrugswahrscheinlichkeiten festgelegt: Unter dem tiefsten dürfen Transaktionen ohne Rückfragen genehmigt werden. Ein mittlerer Grenzwertebereich gilt für genehmigte Transaktionen, die jedoch einer manuellen Überprüfung standhalten müssen. Ab einem festgelegten höheren Schwellwert lehnt das System die Transaktionen ab. In diesem Fall werden die Kunden unter Umständen direkt per Telefon kontaktiert. Oder ihre Kreditkarte wird gesperrt. 

Die Effizienz eines Systems zur Erkennung von Kreditkartenbetrug lässt sich anhand einfacher Kennzahlen beurteilen. Oft wird dazu beispielsweise die Anzahl der korrekt klassifizierten betrügerischen Transaktionen durch die Gesamtzahl der Transaktionen dividiert, die als betrügerisch klassifiziert wurden.

 

Umsetzung eines SA-Systems. 
Die Umsetzung eines derart ausgereiften Systems ist in der Praxis aber nicht einfach, weil die wenigsten Organisationen im Umgang mit Streaming Analytics bewandert sind. Daher sollten Unternehmen die Einführung zunächst auf einzelne Pilotprojekte mit einer überschaubaren Problemstellung und relativ einfachen analytischen Verfahren beschränken. 

Denn kleinere Projekte helfen, das gewählte Vorgehen mit einem geringem Aufwand rasch zu validieren. Zudem lässt sich mithilfe ausführlicher Tests sicherstellen, dass das SA-System den Erwartungen der Entscheider gerecht wird. Sollten die mit einfachen Verfahren erzielten Resultate nicht genügen, können komplexere Verfahren evaluiert und schrittweise eingeführt werden.

 

Fazit: Höhere Wettbewerbsfähigkeit.
Streaming Analytics-Systeme unterstützen Organisationen in Echtzeit in vielfältiger Weise, unter anderem bei:

  • der Erstellung von Prognosen inklusive Muster- und Ausreißererkennung,
  • dem Treffen von Entscheidungen und
  • der Anpassung an sich verändernde Umweltbedingungen.

Damit steigert Streaming Analytics die Wettbewerbsfähigkeit, setzt aber den zielgerichteten Einsatz der genannten drei Verfahren voraus: verteilter Datenhaltung und –verarbeitung, Signalverarbeitung sowie Statistik und Data Mining.   

 

* Dr. Ilias Ortega arbeitet als Senior Consultant für Business Intelligence bei Trivadis. Er ist promovierter Betriebswirtschafter der Universität St. Gallen und diplomierter Ingenieur der ETH Zürich. Er verfügt über mehr als 20 Jahre Erfahrung in der Business Intelligence- und Data Mining-Beratung und ist in seiner umfangreichen Consulting-Arbeit vorwiegend für Organisationen in der Finanzbranche tätig.

 

 

Quelle: BUSINESS INTELLIGENCE MAGAZINE, www.bi-magazine.net 
© ProfilePublishing Germany GmbH 2014_2015. Alle Rechte vorbehalten. 
Vervielfältigung nur mit Genehmigung der ProfilePublishing Germany GmbH

Business Intelligence Magazine: Springe zum Start der Seite