Maschinelles Lernen zur Betrugserkennung: Grundlagen, Anwendungsfälle und Leitlinien
26. September 2023
- Home
- Maschinelles Lernen
- Betrugserkennung
Leiter des KI/ML-Kompetenzzentrums
Erfahren Sie mehr über die Art, die Vorteile und die Anwendungen dieser Technologie in gängigen Betrugsszenarien sowie über einige Richtlinien zur Optimierung ihrer Einführung. Und schließlich erfahren Sie, wie Experten für die Entwicklung von maschinellem Lernen Ihnen helfen können, Ihr Unternehmen und Ihre Kunden vor den sich ständig weiterentwickelnden Betrugsbedrohungen zu schützen.
Maschinelles Lernen bei der Betrugserkennung: Trends und Statistiken
der Unternehmen hatten in den letzten 24 Monaten mit irgendeiner Form von Betrug zu tun
PwC
der Unternehmen setzen bereits KI und ML ein, um Betrug zu erkennen und zu verhindern
ACFE
der Unternehmen planen den Einsatz von KI und ML zur Betrugserkennung in den nächsten 2 Jahren
ACFE
ML-basierte vs. regelbasierte Betrugserkennung
ML-gestützte Anwendungen zur Erkennung von Anomalien unterscheiden sich von herkömmlicher Software in Bezug auf die Erkennungstechnik:
ML-basierte Betrugserkennung
- ML-Lösungen identifizieren und verwenden selbständig komplexere und variablere Regeln als herkömmliche Systeme. Zu diesem Zweck verarbeiten ML-Algorithmen Daten über frühere Betrugsfälle, entdecken Muster und Beziehungen zwischen Datenpunkten und erstellen Modelle, die darauf trainiert sind, diese Muster zu erkennen, sobald sie in künftigen Datensätzen wiederkehren.
- ML-Systeme können bevorstehende kriminelle Handlungen vorhersagen, indem sie Anomalien erkennen, d. h. subtile und unkonventionelle Verhaltensmuster, die Menschen wahrscheinlich übersehen würden, die aber dennoch von der Norm abweichen und Hinweise auf bevorstehenden Betrug sein könnten.
- ML-gestützte Lösungen verbessern sich mit der Erfahrung und verfeinern ihre Modelle im Laufe der Zeit, wenn sie neue Daten verarbeiten, einschließlich nicht erfasster Datenpunkte. Wenn sie also auf neue Betrugsszenarien stoßen, passen sich auf maschinelles Lernen basierende Anomalie-erkennende Systeme schnell an solche Bedrohungen an und integrieren und aktualisieren die bestehenden Regeln automatisch ohne menschliches Eingreifen.
Beispiel
Regelbasierte Betrugserkennung
- Traditionelle regelbasierte Lösungen folgen einer "wenn/dann"-Logik und lösen eine Reaktion aus, wenn eine vordefinierte Bedingung verletzt wird.
- Diese Tools müssen manuell instruiert werden, um Betrugsfälle zu erkennen, indem Bibliotheken mit Hunderten von Regeln zusammengestellt werden.
Beispiel
Lassen Sie sich von unseren Experten beraten, um maschinelles Lernen richtig zu implementieren
Technischer Überblick über ML für die Betrugserkennung
Überwachtes Lernen
ML-basierte Betrugserkennungssysteme werden mit großen Mengen an gekennzeichneten Daten trainiert, die zuvor mit bestimmten Kennzeichnungen versehen wurden, die die wichtigsten Merkmale der Daten beschreiben. Dabei kann es sich um Daten aus legitimen und betrügerischen Transaktionen handeln, die mit den Etiketten "Betrug" bzw. "Nicht-Betrug" beschrieben werden. Diese gekennzeichneten Datensätze, die eine recht zeitaufwändige manuelle Kennzeichnung erfordern, liefern dem System sowohl den Input (Transaktionsdaten) als auch den gewünschten Output (Gruppen von klassifizierten Beispielen), so dass die Algorithmen erkennen können, welche Muster und Beziehungen sie miteinander verbinden, und diese Erkenntnisse zur Klassifizierung künftiger Fälle anwenden können.
Unüberwachtes Lernen
Diese Algorithmen werden mit nicht gekennzeichneten Transaktionsdaten gespeist und müssen diese Transaktionen auf der Grundlage ihrer Ähnlichkeiten (gemeinsame Verhaltensmuster) und Unterschiede (typische bzw. ungewöhnliche Muster, die auf betrügerische Aktivitäten hindeuten können) selbstständig in verschiedene Cluster einteilen. Dieser Ansatz, der typischerweise mit Deep Learning in Verbindung gebracht wird, ist rechenintensiv, kann aber die einzige Wahl sein, wenn es um Betrugsversuche geht, die noch nie zuvor stattgefunden haben und daher nicht gekennzeichnet sind.
Verstärkendes Lernen
Dieser Versuch-und-Irrtum-Ansatz umfasst mehrere Trainingsiterationen, bei denen der Algorithmus eine Betrugserkennungsaufgabe mehrmals auf unterschiedliche Weise durchführt, bis er betrügerische und nicht betrügerische Versuche genau identifizieren kann. Da keine markierten Eingaben erforderlich sind, kann das Reinforcement Learning ohne vorherige Kenntnis des aktuellen Betrugsszenarios angewendet werden. Allerdings erfordert es eine erhebliche Rechenleistung.
Scheme title: Supervised vs unsupervised learning
Data source: medium.com — An Executive’s View: Introduction to Machine Learning
Maschinelles Lernen vs. Deep Learning
Maschinelles Lernen
Eine Untergruppe der KI, die sich auf Systeme konzentriert, die lernen und sich durch Erfahrung verbessern können. Das Erkennen von Mustern und Anomalien ist eine ihrer häufigsten Aufgaben und eine wichtige Voraussetzung für die Betrugserkennung. "Traditionelle" ML-Lösungen können mit einer relativ kleinen Datenmenge trainiert werden und benötigen keine große Rechenleistung, zumindest im Vergleich zu Deep-Learning-basierter Software.
Tiefes Lernen
Eine Methode des maschinellen Lernens, die in der Regel mit komplexen Algorithmen verbunden ist, die als tiefe neuronale Netze bekannt sind. Solche Strukturen, die aus miteinander verbundenen Schichten künstlicher Neuronen bestehen, die das menschliche Gehirn imitieren, können Daten verarbeiten, die von einer Schicht zur nächsten fließen, und die subtilsten Muster und Merkmale erkennen, die in einer immensen Menge von Datenpunkten verborgen sind. Dieser besondere Prozess macht neuronale Netze sehr effektiv bei der Aufdeckung von Betrug, aber er erfordert auch eine enorme Rechenleistung und große Datensätze für das richtige Training.
ML-Algorithmen
Logistische Regression
Ein überwachter Lernalgorithmus, der die Wahrscheinlichkeit eines Ereignisses aus zwei Alternativen, z. B. "Betrug" und "kein Betrug", auf der Grundlage einer Reihe von relevanten Parametern berechnet.
Entscheidungsbaum
Ein weiterer Algorithmus aus der Untergruppe des überwachten Lernens ist ein baumartiges Entscheidungsmodell, bei dem jede Verzweigung die Analyse einer bestimmten Metrik oder Bedingung (Ausgabenschwelle, Standort usw.) darstellt, um festzustellen, ob ein Vorgang betrügerisch ist.
Zufälliger Wald
Eine Kombination mehrerer Entscheidungsbäume, um die Menge der untersuchten Datentypen und Bedingungen zu erweitern und nicht-lineare Beziehungen zwischen mehreren Variablen zu ermitteln.
Support-Vektor-Maschine
Mehrere Systeme verlassen sich bei der Erkennung von Kreditkartenbetrug auf diesen Algorithmus des überwachten Lernens, da er trotz seines hohen Rechenaufwands auch bei großen Datensätzen hervorragende Ergebnisse liefert.
K-ächster Nachbar
Dieser Algorithmus des überwachten Lernens, der sich als recht genau, aber schwierig zu interpretieren erweist, wenn es darum geht, eine bestimmte Entscheidung zu treffen, kann die Art eines Ereignisses (ob es sich um Betrug oder Nicht-Betrug handelt) durch den Vergleich mit ähnlichen, in der Vergangenheit aufgezeichneten Ereignissen bestimmen.
Neuronale Netze
Komplexe, mehrschichtige Architekturen und überlegene Big-Data-Analysefähigkeiten machen neuronale Netze zu den bevorzugten Algorithmen, wenn es darum geht, nichtlineare Beziehungen zu erkennen und mit noch nie dagewesenen Betrugsszenarien durch überwachtes, unbeaufsichtigtes und verstärkendes Lernen umzugehen.
Maschinelles Lernen in den wichtigsten Betrugsszenarien
Maschinelles Lernen kann eingesetzt werden, um Betrüger und Cyberkriminelle in einer Vielzahl von Szenarien in Schach zu halten. Werfen wir einen Blick auf einige beliebte Anwendungsfälle dieser Technologie.
1 Marktmanipulation
Die Finanzinstitute haben das Synergiepotenzial zwischen Börse und maschinellem Lernen und die Vorteile von predictive-analytics im Finanzwesen erkannt, wenn man die hohen Summen bedenkt, um die es geht, und die Einhaltung der immer strengeren Vorschriften.
Maschinengesteuerte Systeme können dazu beitragen, Finanzbetrug wie Churning, Spoofing und Wash-Trading zu verhindern, indem sie Anomalien in den Aktivitäten von Aktienhändlern aufspüren und Transaktionen und Maklerdaten abgleichen, um Unstimmigkeiten in den bereitgestellten Informationen aufzudecken.
2 Geldwäscherei
Die Anwendung des Maschinellen Lernens im Bankwesen hat sich als nützlich erwiesen, um anomale Transaktionen aufzuspüren, die auf kriminelle Aktivitäten hindeuten könnten, wie z. B. große Geldsummen, die zwischen einer Gruppe neu gegründeter, in Steuerparadiesen registrierter Unternehmen ausgetauscht werden.
Maschinenlernmodelle können mit Daten trainiert werden, die sich auf drei mögliche Szenarien beziehen: rechtmäßige Transaktionen, Geldüberweisungen, die von Bankwarnsystemen als verdächtig eingestuft werden, und potenzielle Geldwäschefälle, die den Behörden gemeldet werden. In jedem Fall analysieren die maschinellen Lernsysteme den Hintergrund des Absenders und des Empfängers oder ihre früheren Transaktionen. Auf diese Weise können sie dieselben Muster erkennen, wenn sie in zukünftigen Szenarien wiederkehren, und so zwischen legitimen Aktivitäten und kriminellen Handlungen unterscheiden.
3 Kreditkartenbetrug
Betrug im elektronischen Zahlungsverkehr ist ein weit verbreitetes Verbrechen, das viele Formen annimmt und fast alle Branchen umfasst, vom Bankwesen bis zum eCommerce. Maschinenlernende Systeme im Einzelhandel haben jedoch gute Chancen, diese Eskalation einzudämmen, indem sie abnormales Kontoverhalten erkennen, das ein Anzeichen für Betrug sein könnte. Einige der zu berücksichtigenden Faktoren sind eine zunehmende Transaktionshäufigkeit (insbesondere beim Kauf hochwertiger Waren), die Zahlung mit einer Karte deutlich vor dem Fälligkeitsdatum, die Verknüpfung mit verschiedenen risikoreichen Konten und das Hinzufügen mehrerer Zahlungsmethoden in kurzer Zeit.
Systeme zur Erkennung von Betrug im Zahlungsverkehr, die auf maschinellem Lernen basieren, können auch die Verhaltensprofile von Kartennutzern nach jeder Transaktion aktualisieren, wodurch künftige Vorhersagen präziser werden und falsch positive Ergebnisse vermieden werden.
4 Identitätsdiebstahl
Eine weitere Form der Kriminalität, die eng mit dem Zahlungskartenbetrug zusammenhängt und in vielen Szenarien, einschließlich betrügerischer Kreditanträge und Betrügereien im E-Commerce, bemerkenswert weit verbreitet ist, ist der Identitätsdiebstahl. Dabei nutzt ein Betrüger die persönlichen Daten einer anderen Person, einschließlich ihres Namens und ihrer Kreditkartennummer, ohne deren Zustimmung aus, um ein Verbrechen zu begehen. Um diese Art von Betrug zu bekämpfen, können wir einmal mehr auf die auf maschinelles Lernen gestützte Analyse der Nutzergewohnheiten und Transaktionsdaten zählen.
Außerdem können wir das maschinelle Lernen zur Analyse von Identitätsdokumenten nutzen oder zusätzliche Überprüfungsmechanismen wie Gesichtserkennung und Biometrie hinzufügen.
5 Betrügerische Versicherungsansprüche
Lösungen für maschinelles Lernen können auch die Betrugserkennung im Versicherungssektor, insbesondere in der Krankenversicherung, verbessern. Algorithmen können falsche und doppelte Ansprüche erkennen und auf einen Kunden hinweisen, der eine falsche Diagnose oder überhöhte Kosten für die medizinische Versorgung gemeldet hat.
Eine der wertvollsten Maschinenlerntechniken im Gesundheitswesen ist die Verarbeitung natürlicher Sprache, die eine eingehende Analyse unstrukturierter Daten wie medizinischer Berichte gewährleistet. Diese Lösungen nutzen maschinelles Lernen, um von Ärzten, Versicherern oder Kunden verfasste Dokumente zu scannen und nach verdächtigen Ungereimtheiten zu suchen.
6 Steuerbetrug
Behörden können maschinelles Lernen nutzen, um ungewöhnliche Muster zu erkennen und so die Einhaltung der Steuergesetze zu verbessern. Zum Beispiel kann ML das Hauptbuch auf anomale Einträge untersuchen, die Anzeichen für einen Betrugsversuch sein könnten.
Algorithmen können unter Berücksichtigung verschiedener Parameter eine Vielzahl von Hinweisen leichter und schneller erkennen als menschliche Prüfer. Dazu gehören monatliche Schwankungen der Bruttoumsätze von Unternehmen, Beziehungen zwischen verschiedenen Steuerzahlern, Unstimmigkeiten bei Einkäufen oder die Einzelabzüge in einer Einkommensgruppe.
Nutzen Sie diese ML-Vorteile mit der Beratung von Itransition
Beispiele aus der Praxis für ML zur Betrugserkennung
Titel des Programms: Der Umfang der Capgemini-Lösung zur Betrugserkennung
Datenquelle: capgemini.com - Betrugsmanagementlösungen der nächsten Generation
Titel der Maßnahme: Betrieb des Betrugserkennungssystems der Danske Bank
Datenquelle: assets.teradata.com - Danske Bank bekämpft Betrug mit maschinellem Lernen und KI
Titel des Schemas: Architektur von Amazon Fraud Detector
Datenquelle: aws.amazon.com - Amazon Fraud Detector
Nasdaq setzt eine auf Deep Learning basierende Lösung ein, um über 17,5 Millionen Handelsgeschäfte pro Tag zu überwachen, betrügerische Aktienaufträge zu erkennen, sie den Behörden zu melden und so transparente Märkte zu gewährleisten. Durch die Untersuchung unbekannter Handelsmuster kann das System sogar verdächtige Ereignisse aufdecken, die sich als bisher unbekannte Arten von Betrug herausstellen können. Dieses System arbeitet in Kombination mit menschlichen Analysten und dem bereits bestehenden, auf Regeln und statistischen Verfahren basierenden System.
Es [weist] auf etwas hin, das wir ein "interessantes Ereignis" nennen. Dabei handelt es sich nicht unbedingt um eine verbotene Aktivität, sondern um etwas, das das Modell als interessant eingestuft hat, weil es nicht dem normalen Marktverhalten entspricht.
Mike O'Rourke
Wie man ein ML-System zur Betrugserkennung einrichtet
1
Betriebswirtschaftliche Analyse
Identifizierung von Bedürfnissen und Herausforderungen im Zusammenhang mit der Betrugsbekämpfung durch Workshops und Prozessbeobachtungen
Bewerten Sie Ihr derzeitiges technisches Ökosystem
Verstehen Sie, ob es sinnvoll ist, sich für ML-basierte Betrugserkennungssoftware gegenüber herkömmlichen Lösungen zu entscheiden
Definieren Sie die funktionalen und nicht-funktionalen Anforderungen an die Lösung
Einrichten eines Projektplans, einschließlich Umfang, Leistungen und Zeitrahmen
2
Erste Datenanalyse
Durchführen einer explorativen Analyse, um verfügbare Datenquellen (Unternehmensdatenbanken und angeschlossene Geräte wie Geldautomaten oder Kassen) zu erfassen
Identifizieren Sie externe Datenquellen (öffentliche Aufzeichnungen, Strafverfolgungsbehörden oder staatliche Überwachungslisten)
3
Produktdesign
Erstellung einer Spezifikation, die die Architektur der Lösung, Module, Kernfunktionen, UI/UX und Integrationen mit anderer Software detailliert beschreibt
Ein geeignetes technisches Paket für die Erstellung Ihrer Software identifizieren
Optional, liefern Sie einen Proof of Concept, um die Durchführbarkeit und Finanzierbarkeit des Projekts zu gewährleisten und gleichzeitig auf mögliche Herausforderungen bei der Einführung hinzuweisen
4
Aufbau der CV-Lösung
Vorverarbeitung von Daten, einschließlich Datenbereinigung, -kommentierung und -umwandlung
Extrahieren der wichtigsten Merkmale (IP des Kunden, bevorzugte Zahlungsmethoden, Anzahl der fehlgeschlagenen Transaktionen, durchschnittlicher Bestellwert, Betrugsrate der ausstellenden Bank)
Beschreiben Sie die Bewertungskriterien des Betrugserkennungssystems
Verarbeiten Sie Ihre Datensätze mit ML-Algorithmen, um das Modell auf die Erkennung von Mustern und Anomalien zu trainieren, oder erstellen Sie mehrere Modelle, bis Sie das gewünschte Ergebnis erhalten
5
Modellintegration und -einsatz
Integrieren Sie das ML-Modell in die Lösung, um die Betrugserkennungsfunktionen mit den Ergebnissen des Modells zu unterstützen
Bereitstellung des Systems in der Zielumgebung (vor Ort oder in der Cloud)
Konfigurieren Sie alle notwendigen API- oder ESB-basierten Integrationen mit anderen Unternehmenssystemen und Datenquellen
6
Unterstützung
Mit Hilfe von erfahrenen ML-Ingenieuren
wird der Betrieb des Systems genauestens überwacht und die laufende Wartung durchgeführt.
Schulung und Unterstützung Ihrer Mitarbeiter
Nach den bewährten Praktiken von MLOps trainieren Sie das ML-Modell mit neuen Datensätzen über mehrere Iterationen hinweg, um seine Ergebnisse zu verfeinern und Probleme mit der Modellabweichung zu lösen
Die Vorteile von ML bei der Betrugserkennung
Die besonderen Mechanismen, die ML-basierte Lösungen zur Betrugserkennung und -verhinderung antreiben, machen sie herkömmlichen, regelbasierten Systemen in mehrfacher Hinsicht überlegen.
1 Höhere Flexibilität und Reaktionsfähigkeit
Der regelbasierte Ansatz ist nicht flexibel genug, um mit sich schnell entwickelnden Betrugsmustern umzugehen. Schließlich sind die Regelsätze manuell kodiert und basieren auf früheren Betrugsszenarien, so dass sie kontinuierlich an neue Arten von Ereignissen angepasst werden sollten. Dank selbstlernender Fähigkeiten und schierer Verarbeitungsgeschwindigkeit können ML-gesteuerte Systeme diesen Prozess viel schneller bewältigen als regelbasierte Tools und ihre menschlichen Prüfer, indem sie maschinelle Lernmodelle auf der Grundlage neuer Arten von Bedrohungen selbständig anpassen.
2 Breiterer Datenbestand für die Analyse
Statistische und regelbasierte Betrugserkennungsmethoden können strukturierte Daten, wie z. B. Transaktionszahlen, verarbeiten, haben aber Schwierigkeiten bei der Verarbeitung unstrukturierter Daten, z. B. schriftlicher Berichte, Versicherungsansprüche und Bilder von Ausweisen und anderen Dokumenten. In der Zwischenzeit können maschinelles Lernen und verwandte Technologien wie die Verarbeitung natürlicher Sprache und Computer Vision mit jeder Art von Daten umgehen und ermöglichen es Unternehmen, mehr Kriterien und Variablen über Datenpunkte hinweg zu analysieren.
3 Geringere Rate an fehlerhaften Resultaten
Der herkömmliche Ansatz tendiert zu einer "Schwarz-Weiß-Mentalität". Dies führt zu einer großen Anzahl von Fehlalarmen, die keine wirkliche Bedrohung darstellen, aber dennoch durch eine teure und zeitaufwändige manuelle Überprüfung überprüft werden müssen. Auf maschinellem Lernen basierende Systeme sind dagegen selbst in komplexen Szenarien weitaus genauer und kosteneffizienter, da sie sich nicht auf strenge Regeln stützen, sondern nach Mustern und Abhängigkeiten unter einer größeren Anzahl von Variablen suchen. Dies hilft ihnen, einige Nuancen zu erfassen, die Logik hinter einem Verdachtsfall zu verstehen und Fehlalarme zu vermeiden.
4 Überragende Konformität
Die Notwendigkeit ständiger menschlicher Intervention und Interaktion mit Daten bei regelbasierten Systemen kann mit den immer strengeren Handels-, Steuer- und Datenverwaltungsvorschriften kollidieren. Durch den Einsatz von Systemen mit maschinellem Lernen können menschliche Fehler minimiert und die mit der Einhaltung von Vorschriften verbundenen Geschäftsrisiken gemindert werden, da weniger manuelle Eingriffe erforderlich sind.
Herausforderungen von ML für die Betrugserkennung
Trotz ihrer erwiesenen Effizienz können ML-basierte Betrugserkennungssysteme komplex in der Entwicklung und Einführung sein. Im Folgenden finden Sie einige Tipps, wie Sie ihre Implementierung optimieren und gleichzeitig mögliche Nachteile dieser Technologie überwinden können.
Interpretierbarkeit des ML-Modells
Ausgabe
Empfehlung
Abwägung falsch positiver/negativer Ergebnisse
Ausgabe
Empfehlung
Bedenken hinsichtlich des Datenschutzes
Ausgabe
Empfehlung
Komplexität der Entwicklung
Ausgabe
Empfehlung
Verbrechensbekämpfung mit Algorithmen
Je mehr sich unsere Gesellschaft auf die vollständige Digitalisierung zubewegt, desto mehr nehmen die Auswirkungen, die Häufigkeit und die Komplexität von Angriffen auf die Cybersicherheit zu, wobei Betrüger und Cyberkriminelle dieselben Technologien nutzen, die auch von seriösen Institutionen eingesetzt werden, um ihnen zu begegnen. Infolgedessen knacken KI und ML einerseits Passwörter, treiben adaptive Bots an und manipulieren Datensätze, andererseits treiben sie hocheffektive Betrugserkennungssysteme an. Dank ihrer Anpassungsfähigkeit an neue Bedrohungen, intelligenter kontextbasierter Datenanalyse und Echtzeit-Identifizierungsfunktionen haben sich die Betrugserkennungslösungen bewährt. Gleichzeitig sollten die begrenzte Interpretierbarkeit von ML, das Interesse an sensiblen Daten und die erheblichen Schulungs- und Rechenanforderungen mit angemessenem Fachwissen und unter Berücksichtigung der Compliance angegangen werden. Um die Herausforderungen der ML-Einführung zu meistern, sollten Sie sich auf einen erfahrenen Partner wie Itransition verlassen.
Einblicke
Maschinelles Lernen im E-Commerce: 10 Anwendungsfälle, Beispiele und Best Practices
Entdecken Sie die wichtigsten Trends, Anwendungsfälle, Vorteile und Beispiele für ML im E-Commerce sowie einige Best Practices zur Optimierung der Einführung.
Dienst
Beratung zum maschinellen Lernen
Erfahren Sie mehr über unser Angebot an ML-Beratungsleistungen sowie über Technologien, Anwendungsfälle, die Implementierungs-Roadmap und die Rentabilität.
Einblicke
Maschinelles Lernen in der Immobilienbranche: Anwendungsfälle, Beispiele und Leitlinien für den Einsatz
Entdecken Sie Trends, Anwendungsfälle, Beispiele und Vorteile von ML in der Immobilienbranche sowie die wichtigsten Herausforderungen und Best Practices.
Einblicke
KI-Anwendungsfälle: 3 Regeln, um den richtigen für Ihr Unternehmen zu finden
Eines der Haupthindernisse für die Einführung von KI ist die Identifizierung der richtigen KI-Anwendungsfälle. Erfahren Sie mehr über die besten Praktiken, um diese Herausforderung zu meistern.
Mehr über Dienstleistungen zum maschinellen Lernen
Dienstleistungen