Maschinelles Lernen (ML) ist ein Bereich der Informatik, in dem Computer lernfähig gemacht werden. Dazu werden unter Einsatz verfügbarer Daten automatisch statistische Modelle erstellt. Es werden keine statischen Programminstruktionen befolgt, stattdessen erlernen ML-Algorithmen Muster in Daten zu identifizieren, Wissen zu finden und Entscheidungen zu treffen. Das alles geschieht mit minimaler menschlicher Intervention.
ML ist Teil des grösseren Bereichs Künstliche Intelligenz (KI). Weitere Bereiche der KI überschneiden sich häufig mit ML, wie etwa Wissensmodellierung, die Verarbeitung natürlicher Sprache sowie starke KI. In letzter Zeit gab es eine Vielzahl neuer Produkte und Dienstleistungen aus mehreren Bereichen der KI. Viele Initiativen konnten die Erwartungen nicht erfüllen und gerieten deshalb ins Kreuzfeuer der Kritik. Allerdings stellen die ML-Algorithmen ihre Anwendbarkeit bei der Lösung spezifischer, begrenzter Probleme unter Beweis, wie beispielsweise beim Aufdecken von Anomalien bei Geschäftstransaktionen.
Krankenversicherungen und das Problem von Verschwendung, Missbrauch und Betrug
Die Branche der Krankenversicherungen umfasst sehr unterschiedliche Akteure, vom Gesundheitsdienstleister über Versicherungsunternehmen bis zu Patienten. Da von der Branche ein sozialer Nutzen erwartet wird, besteht ständig der Druck, bei verträglichen Kosten genügend Sicherheit zu bieten und die Gesundheit der Bevölkerung zu verbessern.
Der Missbrauch der Krankenversicherung ist ein Dauerbrenner. Von finanziellen Anreizen gelockt, generieren verschiedene Stakeholder Verschwendung, missbrauchen den Markt oder begehen gar Betrug. Schätzungen zufolge sind 5 bis 10 % der jährlichen Kosten im Gesundheitssystem auf Verschwendung, Missbrauch und Betrug zurückzuführen. Damit machen diese Faktoren einen wesentlichen Teil der medizinischen Inflation aus. Versicherungsansprüche werden von den Zahlenden ständig geprüft, da es sich hierbei um eines der wichtigsten Instrumente zur Kontrolle der Gesundheitsausgaben handelt.
Aus Sicht der Versicherungen werden Verschwendung, Missbrauch und Betrug sowohl durch Gesundheitsdienstleister als auch durch versicherte Mitglieder generiert. Im schlimmsten Falle arbeiten mehrere Parteien konspirativ zusammen. Verschwendung, Missbrauch und Betrug können in sieben Schweregrade unterteilt werden. Den Anfang macht eine einzelne Transaktion, am anderen Ende stehen kriminelle Komplotte mit mehreren Beteiligten.
Versicherte betrügen meistens, um Zugang zu Leistungen zu erhalten, die nicht von ihrer Police abgedeckt werden, oder um diese erstattet zu bekommen. Für Krankenhausärzte und Gesundheitsdienstleister ist die Hauptmotivation der finanzielle Gewinn mit Up-Coding, Service-Entbündelung und Abrechnung unnötiger oder gar nicht erbrachter Leistungen.
Maschinelles Lernen und Verschwendung, Missbrauch und Betrug
Versicherungsunternehmen nutzen bereits regelbasierte Systeme, um Verschwendung, Missbrauch und Betrug bei Versicherungsansprüchen zu finden. Diese Systeme sind Betrugsvermeidungssystemen für Finanztransaktionen sehr ähnlich, z. B. für Kreditkartentransaktionen, bei denen das System die Gültigkeit einer Transaktion mit einem definierten Satz von Geschäftsregeln abgleicht. Diese Geschäftsregeln müssen ständig angepasst werden. Selbst dann sind sie nur so lange nützlich, wie die Person, die die Regeln verwaltet, ein umfassendes mentales Modell für den gesamten Regelsatz erstellen kann.
Und hier kommt ML ins Spiel, um ein komplexes Problem perfekt und elegant zu lösen. Nachdem die ML-Modelle mit historischen Transaktionen trainiert worden sind, können sie die Anomalie jeder neuen Transaktion mit dem Verlauf vergleichen und ihr ein potenzielles Risiko zuweisen. Zudem passen sich ML-Modelle an, wenn das System neue Transaktionen verarbeitet. Sie verbessern sich also während der Nutzung, was die manuelle Regelverwaltung überflüssig macht.
Ein wichtiges Alleinstellungsmerkmal ist die Fähigkeit der ML-Algorithmen, aus den Bewertungen der menschlichen Antragsbearbeiter zu lernen. Typische regelbasierte Systeme verfügen über einen Satz vordefinierter medizinischer Regeln, die festlegen, ob eine Behandlung bei einer bestimmten Erkrankung genehmigt werden sollte. Bearbeiter können jedoch für ihre Entscheidungen zusätzliche Informationen heranziehen, beispielsweise ihre Kenntnis des jeweiligen Behandlers oder die Historie des Versicherungsmitglieds. Ausserdem verfügen sie über Zusatzinformationen, die sich nicht im Anspruchssystem befinden, oder können dank ihrer medizinischen Bildung professionelle Einschätzungen abgeben. ML-Modelle, die mit diesen Entscheidungen trainiert wurden, passen ihre Risikoprognosen basierend auf den Entscheidungen der Bearbeiter an. Sie implementieren implizit Regeln, die nicht nur medizinisch sind, sondern auf täglichen Erfahrungen beruhen.
Netcetera hat RiSIC entworfen und entwickelt, ein ML-basiertes System, dass das Risiko für Verschwendung, Missbrauch und Betrug bei Versicherungsansprüchen quantifiziert. Es folgt ein grober Überblick über die Herangehensweise.
Problemdarstellung
Versicherungsansprüche enthalten sauber strukturierte Datenelemente, die beim Training von ML-Modellen als Input dienen können. Diese Elemente enthalten Informationen über das versicherte Mitglied samt medizinischer Vorgeschichte, die vorgenommenen medizinischen Verfahren und Leistungen, verschriebene Medikamente, Zeit, Datum und Ort der Leistungen und mehr.