Lexikon der Mathematik: U-Test
von Mann und Withney 1947 entwickelter verteilungsfreier (nichtparametrische Statistik) Signifikanztest zum Prüfen, ob zwei unabhängige Stichproben aus Grundgesamtheiten mit gleicher Verteilungsfunktion stammen. Er wird angewendet, wenn die Stichproben nichtnormalverteilten Grundgesamtheiten entstammen oder nur ordinalskaliert (Skalentypen) vorliegen.
Seien X und Y zwei Zufallsgrößen mit den Verteilungsfunktionen FX und FY, und seien \(({X}_{1},\ldots,{X}_{{n}_{1}}),\ ({Y}_{1},\ldots,{Y}_{{n}_{2}})\) Stichproben von X und Y vom Umfang n1 und n2. Der U-Test ist ein spezieller Rangtest zum Prüfen ein- und zweiseitiger Hypothesen:
a) zweiseitig :
H0 : FX = FY gegen H1 : FX ≠ FY
b) einseitig :
H0 : Fx(x) ≥ Fy (x) gegen
H1 : FX(x) ≤ FY (x)
und < für mindestens ein x
c) einseitig
H0 : FX(x) ≤ FY (x) gegen
H1 : FX(x) ≥ FY (x)
und > für mindestens ein x
Zur Berechnung der Teststatistik des Tests wird zunächst für die vereinigte Stichprobe \(({X}_{1},\ldots,{X}_{{n}_{1}},\ {Y}_{1},\ldots,{Y}_{{n}_{2}})\) eine gemeinsame aufsteigende Rangplatzreihe (geordnete Stichprobe) gebildet. Aus dieser Rangplatzzuordnung werden die beiden Teilsummen Rx und Ry der der Rangplatzzahlen, die zu den Stichprobenelementen von X und Y gehören, gebildet. Die Teststatistik des U-Test ist
H0 wird abgelehnt, falls der Wert von T bei vorgegebenen α im Ablehnebereich der U-Verteilung liegt, d. h., die Entscheidungsregeln lauten:
a) H0 wird verworfen, falls \(|T|\ \gt \ {U}_{{n}_{1},\ {n}_{2}}(1-\frac{\alpha}{2})\)
b) H0 wird verworfen, falls \(T\gt \ {U}_{{n}_{1},\ {n}_{2}}(1-\alpha)\)
c) H0 wird verworfen, falls \(T\lt \ {U}_{{n}_{1},\ {n}_{2}}(\alpha)\)
\({U}_{{n}_{1},\ {n}_{2}}(p)\) ist das p-Quantil (Quantil) der U-Verteilung. Diese Quantile sind z.B. in [1] tabelliert.
Es gilt Ux + Uy = n1n2. Wenn H0 gilt, so müssen beide Teilsummen etwa gleich groß sein und folglich \(T\approx \frac{{n}_{1}{n}_{2}}{2}\) gelten. Auf dieser Basis wird häufig anstelle des eben beschriebenen exakten Tests ein approximativer Test durchgeführt. Bei diesem wird anstelle von T die Teststatistik
a) H0 wird verworfen, falls \(|\tilde{T}|\ \gt \ {z}_{1-\frac{\alpha}{2}}\)
b) H0 wird verworfen, falls \(\tilde{T}\ \gt \ {z}_{1-\alpha}\)
c) H0 wird verworfen, falls \(\tilde{T}\lt \ {z}_{\alpha}\)
zp ist hierbei das p–Quantil der Standardnormalverteilung. Treten in beiden Stichproben gleiche Werte (Bindungen) auf, dann erhalten alle diese Werte bei der Rangplatzzuordnung den gleichen mittleren Rangplatz zugewiesen. Enthalten solche Bindungen Werte beider Stichproben, dann ist eine Korrektur der Prüfgröße \(\tilde{T}\ \) notwendig, die sich wie folgt berechnet:
Dabei ist n = n1 + n2, und t bezeichnet die Auftrittshäufigkeit ranggleicher Beobachtungen aus beiden Stichproben.
Die o.g. Hypothesen a) bis c) erstrecken sich auch auf entsprechende Hypothesen über die Gleichheit zentraler Parameter der beiden Verteilungsfunktionen FX und FY, wie z. B. die Gleichheit der Mediane oder der Erwartungswerte von X und Y. In diesen Fällen wird der U-Test analog angewendet. Der so beschriebene Test wird häufig auch als Rangsummentest von Wilcoxon für unabhängige Stichproben bezeichnet. Mann und Whitney haben ursprünglich zur Berechnung der Teststatistik zum Prüfen obiger Hypothesen folgendes Vorgehen vorgeschlagen. Man ordne die gemeinsame Stichprobe in aufsteigender Reihenfolge, und verwende als Teststatistik U = Anzahl aller Paare (xi, yj) in der gemeinsamen geordneten Stichprobe, für die gilt: xi< yj. Ein solches Paar (xi, yj) mit xi< yj bezeichnet man auch als Inversion. Die U-Test-Statistik ist also gleich der Summe aller Inversionen. U heißt Mann-Whitney Teststatistik. Man kann aber zeigen, daß
Beispiel. An zwei Prüfgeräten werden Werkstücke gleichen Materials Dehnungsversuchen unterzogen. Es soll ermittelt werden, ob beide Prüfgeräte gleichmäßig arbeiten, d. h., ob die von beiden Geräten ermittelten Meßwerte gleichen Grundgesamtheiten entstammen. An jedem Gerät werden n1 = n2 = 10 Messungen durchgeführt, und wir erhalten folgende Tabelle der gemessenen Dehnungen und ihrer zugehörigen Rangplätze der gemeinsamen Stichprobe:
Mit diesen Daten ergibt sich:
Wir wollen den approximativen Test anwenden. Das Zeichen * markiert eine Bindung im Wert 20, 2, die vierfach in beiden Stichproben auftaucht. Wir verwenden deshalb die korrigierte approximative Testgröße \(\mathop{T}\limits^{\approx}\), für die sich ergibt:
Mit α = 0.05 und dem Quantil \({z}_{1-\frac{\alpha}{2}}=1,96\) ist
[1] Sachs, L.: Angewandte Statistik. Springer Verlag Berlin Heidelberg New York, 1992.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.