Studie: Mit dem richtigen Brief lässt sich die medizinische Überversorgung reduzieren

20.03.2023 Medizinische Überversorgung kostet die Versicherten jährlich Milliarden. Eine Studie unter Beteiligung der BFH zeigt, wie eine einfache Intervention Ärzt*innen motiviert, unnötige Untersuchungen und Behandlungen zu vermeiden. Machine Learning bei der Datenauswertung liefert dabei zusätzliche Erkenntnisse.

«Vitamin-D-Tests sind das Paradebeispiel», sagt Studienleiter Tobias Müller. In den meisten Fällen könnten Ärzt*innen bei den typischen Symptomen für Vitamin-D-Mangel direkt ein Präparat verschreiben. Der Umweg über den Labortest gilt in Fachkreisen als unnötig: Er lässt die Gesundheitskosten ohne Nutzen ansteigen. Trotzdem werden immer mehr Vitamin-D-Tests durchgeführt.

Ein anderes typisches Beispiel für medizinische Überversorgung sind Originalpräparate, die verschrieben werden, obwohl ein günstigeres Generikum mit derselben Wirkung existiert.

Es wird einiges unternommen, um medizinische Überversorgung zu reduzieren, doch nicht jede Massnahme wirkt. «Wir haben für unsere Studie personalisierte Briefe an die Arztpraxen verschickt», erklärt Tobias Müller. Diese Massnahme ist nicht neu, doch das Forscherteam um Müller ging einen Schritt weiter. «Unser Brief kombiniert klinische Guidelines und Peer Comparison Feedback.» So erkennt eine Ärztin zum Beispiel: ‹Oha, ich lasse mehr Labortest auf Vitamin D machen als 85 Prozent der Schweizer Arztpraxen›. Für die entsprechenden Darstellungen im Brief nutzten die Forscher Daten der SASIS AG, die über die Abrechnungsdaten von 95 Prozent der Schweizer Bevölkerung verfügt.

Die Studienergebnisse zeigen, dass eine solche Intervention tatsächlich viel bewirkt. Oder viel bewirken kann. Die Anzahl Vitamin-D-Tests pro 100 Patient*innen liess sich in der Beobachtungsperiode um 18.2 Prozent senken. Im anderen untersuchten Szenario war das Resultat weniger eindeutig: Den Einsatz von Generika konnte die briefliche Intervention im Durchschnitt nicht signifikant steigern.

Die Studie

Pairing Professional Norms and Peer Comparison Feedback to Reduce Low-Value Care: Evidence from a Randomized Controlled Trial Among Primary Care Physicians

Das Forschungspaper von Tobias Müller, Raf Van Gestel und Michael Gerfin ist aktuell noch nicht publiziert.

«Unsere Studie zeigt grosses Potenzial zur Reduktion von unnötigen Leistungen»

Tobias Müller, was bedeutet Ihre Forschung für das Gesundheitswesen?

Wir konnten zeigen, dass sich mit einer verhältnismässig einfachen Intervention unnötige medizinische Leistungen reduzieren lassen. Nach dem Briefversand gingen die Vitamin-D-Tests in den untersuchten Arztpraxen um 18.2 Prozent zurück. Wir haben das einmal grob überschlagen. Allein durch unsere Studie wurde im betrachteten Jahr ein hoher sechsstelliger Betrag eingespart. Würde man den Brief an alle Arztpraxen verschicken, wären wir sogar bei einem eingesparten Millionenbetrag – und zwar pro Jahr, falls der Effekt anhält.

Könnte diese Intervention auch bei anderen Formen medizinischer Überversorgung wirken?

Davon gehen wir aus. Beispielsweise werden bei Rückenschmerzen zu häufig Röntgenaufnahmen oder routinemässige Laboruntersuchungen bei Standardeingriffen angeordnet, die keine zusätzlichen Erkenntnisse und keine bessere Behandlung der Patient*innen bringen. Die Ausgangslage ist hier sehr ähnlich wie bei den Vitamin-D-Tests.

Sie haben auch untersucht, ob sich der Anteil der verschriebenen Generika mit einer brieflichen Intervention erhöhen lässt – mit weniger eindeutigem Resultat.

In diesem Zweig der Studie haben wir insgesamt zwar einen leichten Anstieg der Generika an den verschriebenen Medikamenten gemessen. Allerdings war der nicht statistisch signifikant. Wir können also nicht sicher sagen, dass unsere Intervention beim durchschnittlichen Leistungserbringer etwas bewirkt hat.

Danach haben wir die Daten mit dem Machine-Learning-Algorithmus ‹Causal Forest› analysiert. So fanden wir Subgruppen von Hausärzten*innen, die ihre Generikaquote signifikant erhöht haben. Beispielsweise Arztpraxen, die vor der Intervention vergleichsweise tiefe Medikamentenkosten hatten. Hier wurden nach der Intervention mehr Generika an die Patienten*innen verschrieben.

Warum haben Sie Machine Learning eingesetzt?

Will man Subgruppen untersuchen, muss man diese eigentlich vor der Datenerhebung definieren. Es war bisher verpönt, die Gesamtdaten nachträglich zu gruppieren. Das Problem dabei ist, dass man die Daten so lange umgruppiert, bis man einen Effekt findet. Was man dann effektiv vor sich hat, ist oft das Resultat statistischer Ausreisser.

Mit der Causal-Forest-Methode können wir uns gegen solche Fehler absichern und wissenschaftlich seriös nachträglich Subgruppen identifizieren, die für unsere Forschung relevant sind.

Welche Möglichkeiten eröffnet das Machine Learning der Forschung?

Es erlaubt uns, mehr Informationen aus erhobenen Daten zu ziehen. Nehmen wir unsere Untersuchung zur Verschreibung von Generika. Früher hätte man beim Blick auf die statistisch nicht signifikante Gesamtveränderung annehmen müssen, die Intervention sei wirkungslos gewesen. Dank dem Causal Forest sehen wir nun: Es gibt Gruppen von Hausärzt*innen, die mit einer Verhaltensänderung reagieren. Eine wichtige Erkenntnis, die sonst einfach verloren gegangen wäre.

Zur Person

Tobias Müller
Prof. Dr. Tobias Benjamin Müller ist Dozent für empirische Gesundheitsökonomie am Institut für Gesundheitsökonomie und Gesundheitspolitik der Berner Fachhochschule (Departement Gesundheit).

Was ist ein Causal Forest?

Der Causal Forest ist eine Erweiterung des Random Forests, einem weitverbreiteten Prognose-Algorithmus im Bereich des maschinellen Lernens. Anders als beim Random Forest werden die Daten nicht gemäss ihrer Prognosegenauigkeit aufgesplittet, sondern in Subgruppen, die unterschiedlich auf die Intervention (hier den Informationsbrief) reagieren.

Dabei lässt der Algorithmus mehrere tausend kausale Bäume auf der Grundlage von Teilstichproben aus den Originaldaten «wachsen», die später zusammen den kausalen Wald ergeben. Die einzelnen kausalen Bäume werden so generiert, dass jeweils ein Teil der Daten zur Konstruktion des Baums und die verbleibenden Daten zur Schätzung des Interventionseffekts verwendet werden. Dadurch wird sichergestellt, dass die Unterschiede zwischen den Subgruppen auch tatsächlich bestehen und nicht etwa nur zufällige Unterschiede abbilden.

Mehr erfahren