Lexikon der Mathematik: Konfidenzschätzung für eine unbekannte Wahrscheinlichkeit
eine spezielle Bereichsschätzung.
Sei X eine dichotome Zufallsgröße, bei der nur die beiden Wahrscheinlichkeiten P(X = 1) = p und P(X =0) = 1−p eintreten können. p sei unbekannt und durch ein Konfidenzintervall zu schätzen. Sei X1, …, Xn eine Stichprobe von X, auf deren Basis p zunächst durch die relative Häufigkeit
geschätzt wird. Der Zentrale Grenzwertsatz besagt, daß bei genügend großem Stichprobenumfang n die Zufallsvariable
standardnormalverteilt ist. Davon ausgehend folgt näherungsweise für großes n
Quadriert man die Gleichung \(|U|\le u(1-\frac{\alpha }{2})\) und löst sie nach p auf, so erhält man für großes n ein näherungsweises Konfidenzintervall für p zur Überdeckungswahrscheinlichkeit 1−α gemäß folgender Vorschrift:
und
mit \(\phi :=1-{\scriptstyle \frac{\alpha }{2}}\).
Bei kleinem Stichprobenumfang n muß man zur Konstruktion eines Konfidenzintervalls für p die Binomialverteilung von \(n\bar{X}\) verwenden. Für ein zweiseitiges Intervall ergeben sich die Konfidenzgrenzen p1 und p2 aus den Beziehungen
Dieses Verfahren geht auf Clopper und Pearson (1934) zurück. Die Intervallgrenzen können Tafeln entnommen werden. Die Handhabung dieser Formeln zur Ermittlung von p1 und p2 ist sehr unbequem und führt in der Regel (da \(n\bar{X}\) eine diskrete Zufallsgröße ist) zu einer Konfidenzschätzung, deren Überdeckungswahrscheinlichkeit ≥ (1 − α) ist. In [2] ist beschrieben, wie man p1 und p2 mit Hilfe der F-Verteilung berechnen kann. Die Fachliteratur bietet Methoden zur Konstruktion verbesserter Konfidenzintervalle für p mit minimaler Länge.
Ein Beispiel. In einer Stichprobe von n = 200 produzierten Teilen wurden 8 fehlerhafte Teile ermittelt. Es ist eine Bereichsschätzung für die Anzahl der fehlerhaften Teile bei einer Produktion von 400000 Stück mit einer Sicherheit von 1 − α = 99 Prozent zu ermitteln. Für die relative Häufigkeit ergibt sich
und für das benötigte Quantil der Standardnormalverteilung liest man aus einer Tabelle den Wert
ab. Daraus ergibt sich durch Einsetzen
Die Anzahl defekter Teile bei einer Produnktion von 400000 Stück liegt dann mit einer Sicherheit von 99 Prozent im Intervall [28000; 37400].
[1] Clopper, C.J., Pearson, E.S.: The use of confidence or fiducial limits illustrated in the case of binomial. Biometrika 26, S. 404-413, 1934.
[2] Storm,R.: Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle. Fachbuchverlag Leipzig-Köln, 1995.
[3] Weber, E.: Grundriß der biologischen Statistik. Fischer Verlag, Jena, 9. Auflage, 1986.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.