Das Kefk Network Wiki befindet sich im Testbetrieb.


Bayestheorem

Aus Kefk.

(Weitergeleitet von Satz von Bayes)
Wechseln zu: Navigation, Suche

Das Bayestheorem (auch Satz von Bayes) ist ein Ergebnis der Wahrscheinlichkeitstheorie, benannt nach dem Mathematiker Thomas Bayes. Es gibt an, wie man mit bedingten Wahrscheinlichkeiten rechnet.

Inhaltsverzeichnis

Formel

Für zwei Ereignisse A und B lautet es

P(A|B) \; = \; \frac {P(B|A) \cdot P(A)} {P(B)}

Hierbei ist

P(A) die A-Priori-Wahrscheinlichkeit für ein Ereignis A und
P(B | A) die Wahrscheinlichkeit für ein Ereignis B unter der Bedingung, dass A auftritt und
P(B) die A-Priori-Wahrscheinlichkeit für ein Ereignis B

Der Satz folgt unmittelbar aus der Definition der bedingten Wahrscheinlichkeit:

P(A|B) \; = \; \frac{P(A \cap B)}{P(B)} \; = \; \frac{\frac{P(A \cap B)}{P(A)} \cdot P(A)}{P(B)} \; = \; \frac {P(B|A) \cdot P(A)} {P(B)}

Bei endlich vielen Ereignissen ergibt sich das Bayessche Theorem folgendermaßen: Wenn A_{i},\; i = 1, ..., N eine Zerlegung des Ereignisraumes in disjunkte Ereignisse ist, gilt für die a-posteriori-Wahrscheinlichkeit P(Ai | B)

 P(A_i | B) \; = \; \frac{P(B | A_i) \cdot P(A_i)}{\sum_{j=1} ^{N} P(B | A_j) \cdot P(A_j)} = \; \frac{P(B | A_i) \cdot P(A_i)}{P(B)} \;

Den zuletzt gemachten Umformungsschritt bezeichnet man auch als Marginalisierung. Man nennt diese Formel auch Bayesformel.

Die Beziehung

 P(B) \; = \; \sum_{j=1}^N P(A_j \cap B) \; = \; {\sum_{j=1}^{N} P(B | A_j) \cdot P(A_j)}

wird als Gesetz der totalen Wahrscheinlichkeit bezeichnet.


Interpretation

Der Satz von Bayes erlaubt in gewissem Sinn das Umkehren von Schlussfolgerungen:

Die Berechnung von P(Ereignis | Ursache) ist häufig einfach, aber oft ist eigentlich P(Ursache | Ereignis) gesucht, also ein Vertauschen der Argumente. Für das Verständnis können der Entscheidungsbaum und die A-Priori-Wahrscheinlichkeit helfen. Das Verfahren ist auch als Rückwärtsinduktion bekannt.

Anwendungsgebiete

Rechenbeispiel 1

Es sind zwei Urnen „A“ und „B“ gegeben, in denen sich rote und weiße Kugeln befinden. In „A“ sind sieben rote und drei weiße Kugeln, in „B“ eine rote und neun weiße. Es wird nun eine beliebige Kugel aus einer willkürlich gewählten Urne gezogen. Anders ausgedrückt: Ob aus Urne A oder B gezogen wird, sei a priori gleich wahrscheinlich. Es sei das Ergebnis der Ziehung: Die Kugel ist rot. Gesucht ist die Wahrscheinlichkeit dafür, dass diese rote Kugel aus Urne „A“ stammt.

Bild:Stochastik_urnen.PNG
Urnenversuch

Es sei A das Ereignis: Die Kugel stammt aus Urne „A“. Es sei R das Ereignis „Die Kugel ist rot“. Dann gilt:

P(A) = {1 \over 2} (Beide Urnen a priori gleich wahrscheinlich)

P(R \vert A) = {7 \over 10} (in Urne A sind 10 Kugeln, davon 7 rote)

P(R \vert B) = {1 \over 10} (analog)

P(R) = P(A) \cdot P(R \vert A) + P(B) \cdot P(R \vert B) = {1 \over 2} \cdot {7 \over 10} + {1 \over 2} \cdot {1 \over 10} = {2 \over 5} (totale Wahrscheinlichkeit)

Damit ist P(A \vert R) = \frac {P(R \vert A) \cdot P(A)} {P(R)} = {{{7 \over 10} \cdot {1 \over 2}} \over {2 \over 5}} = { 7 \over 8 }. Die Wahrscheinlichkeit, dass eine gezogene rote Kugel aus Urne „A“ stammt (A vorausgesetzt R), beträgt 7/8.

Rechenbeispiel 2

In einem medizinischen Beispiel trete der Sachverhalt A, dass ein Mensch eine bestimmte Krankheit in sich trage, mit der Wahrscheinlichkeit P(A) = 0,0002 auf (Prävalenz). Jetzt soll in einem Screening-Test ermittelt werden, welche Personen diese Krankheit haben. B bezeichne die Tatsache, dass der Test bei einer Person positiv ausgefallen ist, d.h. der Test vermutet, dass die Person die Krankheit hat. Der Hersteller des Tests versichert, dass der Test eine Krankheit zu 99% erkennt (Sensitivität = P(B | A) = 0,99) und nur in 1% der Fälle falsch anschlägt, obwohl gar keine Krankheit vorliegt (1 − Spezifität = P(B | Ac) = 0,01; wobei Ac das Komplement von A bezeichnet).


Die Frage ist: Wie wahrscheinlich ist das Vorliegen der Krankheit, wenn der Test positiv ist? (Positiver prädiktiver Wert)


Wir wissen bereits, mit welcher Wahrscheinlichkeit der Test positiv ist, wenn die Krankheit vorliegt (nämlich mit 99%-iger Wahrscheinlichkeit), jetzt soll das Ganze von der anderen Seite her gesehen werden.

Die Aufgabe kann entweder

  • durch Einsetzen in die Formel oder
  • durch einen Entscheidungsbaum (nur bei diskreten Wahrscheinlichkeiten)

gelöst werden

Lösung mit dem Satz von Bayes

Da initial P(B) unbekannt ist, muss man P(B) auf die bekannten Größen zurückführen. Dies geschieht mittels folgender Gleichungskette:

P(B) = P(B) \cdot 1

= P(B) \cdot (P(A^c|B) + P(A|B))
= P(A^c|B) \cdot P(B) + P(A|B) \cdot P(B)
= P(B|A^c) \cdot P(A^c) + P(B|A) \cdot P(A) (Satz von Bayes)

Nach dieser Umformung kann nun der Satz von Bayes auf die gegebenen Daten angewendet werden


P(A|B) 
= \frac{P(B|A)P(A)}{P(B|A^c)P(A^c) + P(B|A)P(A)}
 =\frac{0,99 \cdot 0,0002}{0,01 \cdot 0,9998 + 0,99 \cdot 0,0002}
\approx 0,019

Es liegt also nur zu 1,9% eine Krankheit vor d.h. der Patient hat eine Chance von 98% gesund zu sein, obwohl der Test ihn als krank einschätzte! Das ist schwer zu glauben, liegt aber daran, dass die Wahrscheinlichkeit tatsächlich erkrankt zu sein (0,02%) um das fünzigfache geringer ist als die Wahrscheinlichkeit eines falschen Testergebnisses (1%). Diese Problematik und dessen Konsequenzen werden von Gerd Gigerenzer im Buch Das Einmaleins der Skepsis ausführlich beschrieben.

Lösung mit dem Entscheidungsbaum

Probleme mit wenigen Klassen und einfachen Verteilungen lassen sich übersichtlich im Entscheidungsbaum darstellen. Die "fehlenden" Angaben werden einfach eingesetzt. Das Diagramm "rechnet mit".

                   10 000
                  /      \
                 /        \ 
                /          \ 
              2(krank)    9 998 (gesund)
              /\             /\
             /  \           /  \
            /    \         /    \
           /      \       /      \
Test-     0       2     100      9898
ergebnis  -       +     +        -
(gerundet)

Ergebnis: 2+100=102 haben ein positives Ergebnis, obwohl 100 (=falsch positiv) von ihnen gesund sind. Diese Angaben erfolgen hier in der absoluten Häufigkeit.

Verständnisprobleme des Bayes-Theorems

Die gleichen Informationen, die vielen schwer verständlich sind, können auch ohne bedingte Wahrscheinlichkeiten aufbereitet werden, wie in absolute Häufigkeit aufgeführt. Typische Verständnisprobleme im Umgang mit bedingten Wahrscheinlichkeiten sind [1]:

  1. Verwechslung von Konditionalität und Kausalität
  2. Verwechslung von bedingter und konjunktiver Wahrscheinlichkeit
  3. Verwechslung von bedingtem und bedingendem Ereignis
  4. Schwierigkeiten bei der exakten Definition des bedingenden Ereignisses (z. B. beim "Ziegenproblem")
  5. Missverstehen der Fragestellung durch mangelndes Grundverständnis für bedingte Wahrscheinlichkeiten, zu komplizierte Formulierung u. ä.

Weblinks

<imagemap>-Fehler: Bild ist ungültig oder nicht vorhanden Wikibooks: einige Beispiele – Lern- und Lehrmaterialien
Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Bayestheorem, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Bayestheorem, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge