In der Stochastik ist es bei der Auswertung der Ergebnisse einer Stichprobe oft von großer Bedeutung zu schätzen, wie hoch die der Verteilung zugrundeliegenden Wahrscheinlichkeiten für das Eintreten der einzelnen Ereignisse sind. Dies ist zum Beispiel der Fall, wenn man eine bestimmte Anzahl an Würfen auf einen Basketballkorb gemacht und gezählt hat, wie oft getroffen wurde. In diesem Zufallsexperiment kann man davon ausgehen, dass die Trefferquote binomialverteilt ist, jedoch muss man die Trefferwahrscheinlichkeitperst noch abschätzten.
Wichtig ist hierbei, dass man bei einer stochastischen Untersuchung nie die zugrunde liegende Wahrscheinlichkeit genau bestimmen kann. (Dazu müsste man das Experiment unendlich oft wiederholen.)
Um die Trefferwahrscheinlichkeit abzuschätzen, bestimmt man zunächst die relative Häufigkeit. Diese ist gegeben durch:
h=nr
h
Relative Häufigkeit
r
Stichprobenergebnis (Anzahl Treffer)
n
Stichprobenumfang (Anzahl Würfe)
Die relative Häufigkeit gibt eine vorläufige Schätzung für die unbekannte Wahrscheinlichkeitpan.
Vetrauensintervalle
Vertrauensintervalle- auch Konfidenzintervalle genannt, hängen mit einem bestimmten Niveau zusammen. Zum Beispiel das Vertrauensintervall zum Niveau von 95% beinhaltet alle Ergebnisse des Zufallsexperiments, die zu einer Wahrscheinlichkeit von 95%
passieren werden. Allgemein gilt, je größer das Niveau ist, zu dem das Vertrauensintervall gebildet wird (zu 90%, zu 99%,..), desto größer ist das Vertrauensintervall und somit wahrscheinlicher ist es, dass die Wahrscheinlichkeit eines Treffers pdes Zufallsexperiments in diesem Intervall liegt.
Eine unbekannte Wahrscheinlichkeit p in einem Bernoulli-Experiment lässt sich mithilfe der folgenden Vertrauensintervalle schätzen:
90%-Vertrauensintervall
[h−1,64nh(1−h),h+1,64nh(1−h)]
95%- Vertrauensintervall
[h−1,96nh(1−h),h+1,96nh(1−h)]
99%-Vertrauensintervall
[h−2,58nh(1−h),h+2,58nh(1−h)]
Die Wahrscheinlichkeit, dass p nach n Durchführungen des Experiments in einem dieser Intervalle liegt, ist also bei a% für das a% -Vertrauensintervall.
Hinweis: Beim Berechnen der unteren und oberen Intervallgrenze muss man beachten, dass man die Ergebnisse so rundet, dass das Vertrauensintervall größer wird. Das heißt, man rundet die untere Intervallgrenze ab und die obere Intervallgrenze auf.
Beispiel
Beim Werfen auf einen Basketballkorb wird von 100 Würfen der Korb 62 mal getroffen. Gesucht ist nun ein Vertrauensintervall für die Wahrscheinlichkeit auf dem Niveau von 95% dafür, dass man den Korb trifft.
Zunächst berechnen wir die relative Häufigkeit:
h=nr=10062=0,62
Nun verwenden wir die Formel für das Vertrauensintervall auf dem Niveau von95%:
Das bedeutet, die Trefferwahrscheinlichkeit liegt (mit einer Wahrscheinlichkeit von95%) zwischen 52% und 72%.
Beachte: Um ein genaueres Intervall der Trefferwahrscheinlichkeit zu finden, müssten wir entweder öfter werfen oder das Niveau des Intervalls senken (also die Wahrscheinlichkeit, dass unsere Vorhersage korrekt ist, senken).
Signifikanz
Bei der Interpretation von Ergebnissen aus einer Stichprobenuntersuchung kommen manchmal signifikante Ergebnisse vor, also Ergebnisse oder auch einzelne Werte, die nicht im Vertrauensintervall enthalten sind. „Signifikant“ hat die Bedeutung „als von der generellen Theorie abweichend“. Also ein Ergebnis, das statistisch relevant von der Norm abweicht und somit auf ein neues und bisher unvorhergesehenes Forschungsergebnis hinweist.
Bei der Diskussion zur Signifikanz einer gewissen Aussage oder von einzelnen Werten muss man allerdings vorsichtig sein, da hierbei auch Faktoren wie der Stichprobenumfang oder das Niveau des Vertrauensintervalls eine Rolle spielen.
Wenn man beispielsweise bei dem Basketballspiel aus dem obigen Beispiel eine weitere Versuchsserie macht und dabei nur55 mal den Korb trifft, so ist das trotzdem kein signifikantes Ergebnis, das beispielsweise die Hypothese von „die Trefferwahrscheinlichkeit bei einem Wurf liegt bei etwa62%“ widerlegen würde. Dies ist der Fall, da die relative Häufigkeit von0,55=10055 in unserem vorherigen Vertrauensintervall liegt.
Ein Beispiel für eine signifikante Abweichung wäre hier, wenn man bei100 Würfen98mal den Korb trifft. In dem Fall hat man womöglich die Trefferwahrscheinlichkeit falsch eingeschätzt. Allerdings müsste man auch hier mehrere Experimente durchführen, um wirklich fundierte Aussagen über die Trefferwahrscheinlichkeit zu machen.