Lexikon der Mathematik: Varianzanalyse
auch als ANOVA (Analysis of Variances) bezeichnet, ein in wesentlichen von Sir Ronald Aylmer Fisher entwickeltes Teilgebiet der mathematischen Statistik, welches darauf gerichtet ist, den Einfluß von gestuften Faktoren auf ein beobachtetes zufälliges Merkmal zu untersuchen.
Dabei wird die Frage beantwortet, ob die verschiedenen Stufen eines Einflußfaktors statistisch signifikant unterschiedliche Wirkungen auf das interessierende Merkmal haben. Die einzelnen Modelle der Varianzanalyse unterscheiden sich nach drei Kriterien:
a) Nach der Anzahl der im Versuchsplan enthaltenen Faktoren unterscheidet man die einfache, zweifache, dreifache, usw. Varianzanalyse.
b) Nach Anzahl der Beobachtungen je Faktorabstufung unterscheidet man zwischen der Varianzanalyse mit mehrfacher Klassenbesetzung und der Varianzanalyse mit einfacher Klassenbesetzung.
c) Nach Aufbau des Versuchsplanes und Zielsetzung unterscheidet man zwischen dem
– Modell I: Modell mit festen Effekten. Hier sind die einzelnen Faktorabstufungen fest vorgegeben. Das Ziel der Untersuchung besteht darin, den mittleren Effekt der vorgegebenen Faktorabstufungen auf das beobachtete Merkmal auszuweisen.
– Modell II: Modell mit zufälligen Effekten. Die einzelnen Faktorabstufungen sind nicht fest vorgegeben, sondern ihr konkreter Ausprägungsgrad wird zufällig realisiert. Die Zielstellung der Untersuchung ist hier, Kenntnis über die von den Faktoren erzeugte Variabilität (Streuung) innerhalb der Gesamtvariabilität zu erlangen.
– Modell III: Modell der gemischten Effekte, welches sowohl feste als auch zufällige Effekte enthält.
Geht es beispielsweise um die Untersuchung von bestimmten fest vorgegebenen Dosierungen eines Psychopharmakons auf das Leistungsvermögen, so handelt es sich um Modell I; geht es aber um die Untersuchung des Einflusses des Alters auf das Leistungsvermögen, und ergibt sich das Alter zufällig aus einer Zufallsstichprobe, so handelt es sich um Modell II. Um Modell III handelt es sich, wenn der Einfluß von beiden Einflußfaktoren, Dosis und Alter, auf das Leistungsvermögen untersucht werden soll.
Das Prinzip der Varianzanalyse sei im folgenden am Beispiel des Modells I für die einfache Klassifikation beschrieben.
1) Modell I, einfache Klassifikation.
Versuchsplan:
Modell:
Dabei sind αi der Einfluß des i-ten Faktors auf den Erwartungswert Eyij = μi = μ + αi, μ der von den Faktorstufen unabhängige Teil des Erwartungswertes Eyij, und ϵij für alle i und j stochastisch unabhängige identisch N(0, σ2) (normal)verteilte Zufallsgrößen, die den zufälligen Versuchsfehler darstellen.
Problemstellung: Prüfen der Hypothese:
Um die Auswertung zu normieren, wird i. a. die Gültigkeit der Bedingung
(SQA = Variation zwischen den Stufen, SQR = Variation innerhalb der Stufen des Faktors (Rest)).
Man kann zeigen, daß gilt:
Unter der Hypothese H0 sind also beide Teilvarianzen gleich. Deshalb verwendet man zum Prüfen der H0-Hypothese einen F-Test auf Gleichheit der Varianzen. Die Teststatistik ist
Einige weitere wichtige Modelle und Hypothesen der Varianzanalyse:
2) Modell I, zweifache Klassifikation mit einfacher Besetzung:
In diesem Modell ist jede Kombination (αi, βj) der Faktorstufen jeweils nur mit einer einzigen Beobachtung yij besetzt.
3) Modell I, zweifache Klassifikation mit mehrfacher Besetzung
4) Modell II, am Beispiel der zweifachen Klassifikation mit mehrfacher Besetzung:
Dabei sind Ai normalverteilte paarweise unabhängige Zufallsgrößen mit EAi = 0 und \(Var({A}_{i})=\ {\sigma}_{A}^{2}\) für alle i, Bj normalverteilte paarweise unabhängige Zufallsgrößen mit EBj = 0 und \(Var({B}_{j})=\ {\sigma}_{B}^{2}\) für alle j, Cij normalverteilte paarweise unabhängige Zufallsgrößen mit ECij = 0 und \(Var({C}_{ij})=\ {\sigma}_{AB}^{2}\) für alle i und alle j, ϵijm stochastisch unabhängig und identisch \(N(0,\ {\sigma}_{\varepsilon}^{2})\)-verteilt.
Die Aufgabenstellungen in einem solchen Modell sind:
(1) Ermittlung erwartungstreuer Schätzungen (Punktschätzungen) für die Varianzkomponenten \({\sigma}_{A}^{2}\), \({\sigma}_{B}^{2}\), \({\sigma}_{AB}^{2}\) und \({\sigma}_{\varepsilon}^{2}\).
(2) Prüfung der Hypothesen
(3) Konstruktion von Konfidenzintervallen für die Varianzkomponenten \({\sigma}_{A}^{2}\), \({\sigma}_{B}^{2}\), \({\sigma}_{AB}^{2}\).
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.