Lexikon der Mathematik: multivariate Varianzanalyse
MANOVA, auch als mehrdimensionale Varianzanalyse bezeichnete Verallgemeinerung der gewöhnlichen eindimensionalen Varianzanalyse für mehrdimensionale Beobachtungen.
Die Einteilungen in Varianzanalysen des Modelles I (mit festen Effekten), des Modells II (mit zufälligen Effekten) und des Modells III (feste und zufällige Effekte gemischt) bleibt bestehen. Die wichtigste Aufgabe der MANOVA des Modells I ist es, Vergleiche von Mittelwertsvektoren sowie entsprechende Untersuchungen komplizierter Kontraste durchzuführen. Im Falle des Modells II werden die von den einzelnen Einflußfaktoren herrührenden Varianz- und Kovarianzanteile geschätzt und geprüft.
Durch die multivariate Varianzanalyse werden mehrere Variablen (auch unterschiedlicher Skalentypen) im Zusammenhang beurteilt. Die Teststatistiken der multivariaten Varianzanalyse lassen sich zur Bewertung des Informationsgehaltes von Variablenmengen nutzen und werden deshalb auch in der Diskriminanzanalyse angewendet. Multivariate Varianzanalysen können ein- oder mehrfaktoriell durchgeführt werden. Dabei geht man von geeigneten linearen Modellen aus.
Im folgenden wird der Fall der einfaktoriellen MANOVA beschrieben. Es soll die Wirkung eines Faktors A mit J Stufen auf einen p-dimensionalen Zufallsvektor geprüft werden. Die Zahl der Beobachtungen für Stufe j sei nj, j = 1,… , J. Das verwendete Modell hat die Gestalt:
\begin{eqnarray}\begin{array}{rll}{\overrightarrow{y}}_{jk} & = & \overrightarrow{\mu }+{\overrightarrow{\alpha }}_{j}+\overrightarrow{{e}_{jk}}\\ j & = & 1,\ldots ,J;k=1,\ldots ,{n}_{j}\end{array}\end{eqnarray}
Hier sind \({\overrightarrow{y}}_{jk}\), \(\overrightarrow{\mu }\), \({\overrightarrow{\alpha }}_{j}\), \(e\overrightarrow{{}_{jk}}\)p-dimensionale Spaltenvektoren.
Die zu prüfende Nullhypothese lautet:
\begin{eqnarray}{H}_{0}:\overrightarrow{{\alpha }_{1}}=\overrightarrow{{\alpha }_{2}}=\ldots =\overrightarrow{{\alpha }_{J}}=\overrightarrow{0},\end{eqnarray}
wobei sogenannte Reparametrisierungsbedingun- gen gefordert werden:\begin{eqnarray}\displaystyle \sum _{j=1}^{J}{n}_{j}{\overrightarrow{\alpha }}_{j}=\overrightarrow{0}.\end{eqnarray}
Bei der MANOVA sind folgende Berechnungen durchzuführen:
Mittelwertvektoren der Stufen j = 1,… , J:
\begin{eqnarray}{\overrightarrow{y}}_{j.}=\frac{1}{{n}_{j}}\displaystyle \sum _{k=1}^{{n}_{j}}{\overrightarrow{y}}_{jk}\end{eqnarray}
Gesamtmittelwertvektor:
\begin{eqnarray}{\overrightarrow{y}}_{\mathrm{..}}=\frac{1}{{n}_{j}}\displaystyle \sum _{j=1}^{J}{n}_{j}{\overrightarrow{y}}_{j.},\quad\quad\quad \text{mit}\quad n=\displaystyle \sum _{j=1}^{J}{n}_{j}\end{eqnarray}
Zerlegung der Kovarianzen:
Variationsursache zwischen den Stufen des Faktors A:
\begin{eqnarray}H=\displaystyle \sum _{j=1}^{J}{n}_{j}({\overrightarrow{y}}_{j.}-{\overrightarrow{y}}_{\mathrm{..}}){({\overrightarrow{y}}_{j.}-{\overrightarrow{y}}_{\mathrm{..}})}^{T}\end{eqnarray}
(Freiheitsgrad: J – 1).
Variationsursache innerhalb der Stufen von A (Rest):
\begin{eqnarray}G=\displaystyle \sum _{j=1}^{J}\displaystyle \sum _{k=1}^{{n}_{j}}({\overrightarrow{y}}_{jk}-{\overrightarrow{y}}_{j.}){({\overrightarrow{y}}_{jk}-{\overrightarrow{y}}_{j.})}^{T}\end{eqnarray}
(Freiheitsgrad: n – J).
Schätzung der Restvarianz: \(S=\frac{1}{n-J}G\).
Zum Prüfen von HQ kann folgender Signifikanztest in einer approximativen Version des Spurkriteriums nach J.Läuter (vgl. [1]) angewendet werden. Die Teststatistik ist
\begin{eqnarray}\begin{array}{c}T:=\frac{n-J-p+1}{(J-1)p(n-J)}\times \\ \quad\quad\quad \displaystyle \sum _{j=1}^{J}{n}_{j}{({\overrightarrow{y}}_{j.}-{\overrightarrow{y}}_{\mathrm{..}})}^{T}{S}^{-1}({\overrightarrow{y}}_{j.}-{\overrightarrow{y}}_{\mathrm{..}}).\end{array}\end{eqnarray}
H0 wird abgelehnt, falls gilt
\begin{eqnarray}F\gt {F}_{{g}_{1},{g}_{2}}(1-\alpha ),\end{eqnarray}
wobei Fg1, g2 (1 − α) das (1 − α)-Quantil der F-Verteilung mit den Freiheitsgraden g1 und g2 ist. Die Freiheitsgrade sind gegeben durch\begin{eqnarray}{g}_{1}=\{\begin{array}{ll}\frac{(J-1)p(n-J-p)}{n-(J-1)p-2} & \text{für}\quad n-(J-1)p-2\gt 0.\\ \infty & \text{sonst},\end{array}\end{eqnarray}
\begin{eqnarray}{g}_{2}=n-J-p+1.\end{eqnarray}
α ist das vorgegebene Signifikanzniveau des Tests. Wenn der Freiheitsgrad g1 des Tests nicht ganzzahlig ist, wird beim Ablesen des Quantils aus entsprechenden Tabellen interpoliert.
[1] Ahrens, H.; Läuter, J.: Mehrdimensionale Varianzanalyse. Akademie-Verlag Berlin, 1981.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.