Satz-von-Bayes-Rechner: Von Prior zu Posterior aktualisieren

simulator intermediate ~7 min
Simulation wird geladen...
Posterior: P(H|E) ≈ 16,1 %

Bei einer Basisrate von 1 %, 95 % Sensitivität und 95 % Spezifität ergibt ein positiver Test nur eine 16,1 %-Chance, die Erkrankung tatsächlich zu haben. Von 1000 Personen haben ~10 die Erkrankung (9,5 testen positiv), aber ~50 gesunde Personen testen ebenfalls positiv. Nur 9,5 von 59,5 positiven Tests sind wahr positiv — eine eindrucksvolle Veranschaulichung des Basisraten-Fehlschlusses.

Formel

P(H|E) = P(E|H) · P(H) / [P(E|H) · P(H) + P(E|¬H) · P(¬H)]
P(E|¬H) = 1 - specificity (false positive rate)
PPV = True Positives / (True Positives + False Positives)

Was ist der Satz von Bayes?

Der Satz von Bayes ist die mathematische Regel zur Aktualisierung von Überzeugungen angesichts neuer Belege. Formuliert von Reverend Thomas Bayes und 1763 postum veröffentlicht, liefert er eine präzise Formel: Die Posterior-Wahrscheinlichkeit einer Hypothese H angesichts eines Belegs E gleicht der Wahrscheinlichkeit, E zu beobachten, wenn H wahr ist, multipliziert mit der A-priori-Wahrscheinlichkeit von H, geteilt durch die Gesamtwahrscheinlichkeit, E zu beobachten.

Der Basisraten-Fehlschluss

Eine der wichtigsten kognitiven Verzerrungen, die der Satz von Bayes offenlegt, ist der Basisraten-Fehlschluss — unsere Tendenz, die Häufigkeit oder Seltenheit eines Phänomens bei der Bewertung von Belegen zu ignorieren. Ein medizinischer Test mit 95 % Genauigkeit klingt hochzuverlässig, doch wenn die Krankheit nur 1 % der Bevölkerung betrifft, ist ein positives Ergebnis mit etwa 84 % Wahrscheinlichkeit ein falsch positives. Dieses kontraintuitive Ergebnis hat tiefgreifende Auswirkungen auf medizinische Vorsorge, Strafjustiz und jeden Bereich, in dem nach seltenen Ereignissen gesucht wird.

Natürliche Häufigkeiten

Der Wahrscheinlichkeitsbaum und die Punktanzeige in diesem Simulator verwenden natürliche Häufigkeiten — sie zeigen Anzahlen von 1000 statt abstrakter Prozentwerte. Forschung von Gerd Gigerenzer zeigt, dass Menschen Bayes'sche Zusammenhänge weit besser verstehen, wenn die Information so dargestellt wird. Statt mit bedingten Wahrscheinlichkeiten zu jonglieren, können Sie einfach zählen: Von 1000 Personen haben etwa 10 die Krankheit, ungefähr 9,5 testen positiv (wahr positiv), und etwa 50 gesunde Personen testen ebenfalls positiv (falsch positiv). Also sind nur 9,5 von ~60 positiven Tests echt.

Interaktive Erkundung

Nutzen Sie die Regler, um zu sehen, wie sich die Posterior-Wahrscheinlichkeit mit verschiedenen Prioren, Sensitivitäten und Spezifitäten ändert. Beachten Sie, wie dramatisch die Posterior-Wahrscheinlichkeit sinkt, wenn die A-priori-Wahrscheinlichkeit (Basisrate) sehr niedrig ist — das ist die mathematische Grundlage des Basisraten-Fehlschlusses. Das Balkendiagramm unten zeigt das Ausmaß der Bayes'schen Aktualisierung: wie stark ein einzelner Beleg Ihre Überzeugungen vom Prior zum Posterior verschiebt.

Häufige Fragen

Was ist der Satz von Bayes?

Der Satz von Bayes ist eine Formel zur Aktualisierung der Wahrscheinlichkeit einer Hypothese anhand neuer Belege. 1763 postum von Thomas Bayes veröffentlicht, besagt er: P(H|E) = P(E|H)·P(H) / P(E). Er ist die mathematische Grundlage rationaler Überzeugungsaktualisierung und zentral für Statistik, maschinelles Lernen und Entscheidungstheorie.

Was ist der Basisraten-Fehlschluss?

Der Basisraten-Fehlschluss ist die Tendenz, die A-priori-Wahrscheinlichkeit (Basisrate) bei der Bewertung von Belegen zu ignorieren. Selbst ein 95 % genauer medizinischer Test erzeugt bei einer Krankheitshäufigkeit von nur 1 % überwiegend falsch-positive Ergebnisse, weil die 5 % Falsch-positiv-Rate angewandt auf die große gesunde Bevölkerung mehr Positive erzeugt als die 95 % Erkennungsrate angewandt auf die kleine kranke Bevölkerung.

Was sind natürliche Häufigkeiten und warum helfen sie?

Natürliche Häufigkeiten drücken Wahrscheinlichkeiten als Anzahlen in einer Referenzgruppe aus (z. B. «10 von 1000») statt als abstrakte Prozentwerte. Forschung von Gerd Gigerenzer zeigt, dass Menschen Bayes'sche Probleme deutlich besser verstehen, wenn die Information als natürliche Häufigkeiten statt als bedingte Wahrscheinlichkeiten dargestellt wird.

Wie unterscheidet sich Sensitivität von Spezifität?

Sensitivität (Richtig-positiv-Rate) ist die Wahrscheinlichkeit eines positiven Tests bei vorliegender Erkrankung: P(E|H). Spezifität (Richtig-negativ-Rate) ist die Wahrscheinlichkeit eines negativen Tests bei Abwesenheit der Erkrankung: P(¬E|¬H). Ein guter diagnostischer Test braucht beides in hohem Maße, aber ihre relative Wichtigkeit hängt von der Basisrate und den Fehlerkosten ab.

Quellen

Einbetten

<iframe src="https://homo-deus.com/lab/cognitive-biases/bayes-theorem/embed" width="100%" height="400" frameborder="0"></iframe>
View source on GitHub