Lexikon der Mathematik: Korrelationskoeffizient
ein Maß für die Abhängigkeit (Assoziation) zwischen Zufallsgrößen.
Seien X und Y zwei Zufallsgrößen mit dem Erwartungswert EX = μx und EY = μy, sowie den Varianzen \(V(X)={\sigma }_{x}^{2}\) und \(V(Y)={\sigma }_{y}^{2}\), wobei \(0\lt {\sigma }_{x}^{2},{\sigma }_{y}^{2}\lt \infty $.
1. Ausgehend von der Kovarianz cov(X, Y) = E[(X − EX)(Y − EY)] zweier Zufallsgrößen X und Y bezeichnet man
In diesem Sinne ist der einfache Korrelationskoeffizient ϱxy ein Maß für die lineare Abhängigkeit von X und Y. Man nennt X und Y positiv bzw. negativ korreliert, falls ϱxy > 0 bzw. ϱxy< 0 gilt. Ist ϱxy = 0, d. h. cov(X, Y) = 0, so heißen X und Y unkorreliert. Aus der stochastischen Unabhängigkeit zweier Zufallsgrößen folgt ihre Unkorreliertheit. Die Umkehrung dieser Aussage gilt nur dann, wenn X und Y eine zweidimensionale Normalverteilung besitzen. Man bezeichnet die Größe \(B:={\varrho }_{xy}^{2}\) als Bestimmtheitsmaß und \(1-B=1-{\varrho }_{xy}^{2}\) als Unbestimmtheitsmaß.
2. Es sei nun, in Verallgemeinerung von 1., \(\overrightarrow{X}=({X}_{1},\ldots,{X}_{m})\) ein zufälliger Vektor mit dem Erwartungswert \(E\overrightarrow{X}=\overrightarrow{\mu }\) und der Kovarianzmatrix Bx = B. Weiterhin bezeichne (X(1), X(2)) eine Zerlegung von X mit X(1) = (X1, …, Xp) und X(2) = (Xp+1, …, Xm), p < m, sowie
die entsprechenden Zerlegungen von \(\overrightarrow{\mu }\) und B. Dabei sei B22 als regulär vorausgesetzt. Dann gilt für
und die beste lineare Funktion im Sinne der Mini-mierung dieses Kriteriums ist die lineare Regressionsfunktion
Die Elemente der Matrix \({B}_{11}-{B}_{12}{B}_{22}^{-1}{B}_{21}\) sind die ‚partiellen Kovarianzen‘
und entsprechend nennt man
die ‚partiellen Korrelationskoeffizienten‘ zwischen Xi und Xj (i, j = 1, …, p) bezüglich Xp+1, …, Xm. (Im Fall p = m setzt man
d. h., der partielle ist in diesem Fall mit dem einfachen Korrelationskoeffizienten identisch.)
Der partielle Korrelationskoeffizient mißt also die lineare Abhängigkeit zwischen Xi und Xj nach Ausschaltung linearer Einflüsse von Xp+1, …, Xm auf Xi und Xj.
3. Als ‚multiplen Korrelationskoeffizienten‘ ϱ1(2···m) zwischen X1 und (X2, …, Xm) bezeichnet man den einfachen Korrelationskoeffizienten zwischen X1 und gX1 (X(2)), X(2) = (X2, …, Xm) d. h., es ist
ϱ1(2···m) ist ein Maß für die lineare Abhängigkeit zwischen X1 und der Gesamtheit der X2, …, Xm. Der Wert \({\varrho }_{1(\mathrm{2\cdots}m)}^{2}\) heißt ‚multiples Bestimmtheitsmaß‘. Es gilt:
- (a) 0 ≤ ϱ1(2···m) ≤1 ;
- (b) ϱ1(2···m) = 1 genau dann, wenn P(a1X1 +···+
\begin{eqnarray}P(a_1X_1+\cdots +a_mX_m+b=0)=1;\end{eqnarray} - (c) ϱ1(2···m) = 0 genau dann, wenn X1 und Xi für i = 2, …, m unkorreliert sind.
4. Als Maß für die lineare Abhängigkeit zweier zufälliger Vektoren X(1) = (X1, …, Xp) und X(2) = (Xp+1, …, Xm), p ≤ m − p, werden in Verallgemeinerung des multiplen Korrelationskoeffizienten die ‚kanonischen Korrelationskoeffizienten‘ herangezogen (Korrelationsanalyse).
[1] Röhr, M.: Kanonische Korrelationsanalyse. Akademie-Verlag Berlin, 1987.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.