Direkt zum Inhalt

Lexikon der Mathematik: Mahalanobis-Abstand

ein in der Clusteranalyse und Diskriminanzanalyse verwendetes Maß für die statistische Unterscheidung zweier Objekte bzw. zweier Gruppen von Objekten (Klassen, Cluster, Kollektive), und zur Zuordnung eines Objekts zu einer von mehreren möglichen Gruppen.

I. Mahalanobis-Abstand zur Unterscheidung zweier Objekte: Seien O1, O2,…,Onn Objekte, an denen jeweils p Merkmale gemessen wurden, und sei \({\overrightarrow{x}}_{i}=({x}_{i1},\ldots,{x}_{ip})\) der Vektor der gemessenen Merkmalswerte am Objekt Oi, i = 1,…, n. Die Gesamtinformation an Daten ist in folgender Datenmatrix darstellbar:

Abbildung 1 zum Lexikonartikel Mahalanobis-Abstand
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Seien weiterhin \begin{eqnarray}\overline{{x}_{.k}}:=\frac{1}{n}\displaystyle \sum _{i=1}^{n}{x}_{ik}\end{eqnarray} das arithmetische Mittel des Merkmals Xk und S = (skl)k,l=1,…,p, wobei \begin{eqnarray}{s}_{kl}:=\frac{1}{n}\displaystyle \sum _{i=1}^{n}({x}_{ik}-\overline{{x}_{.k}})({x}_{il}-\overline{{x}_{.l}})\end{eqnarray} die empirische Kovarianz des Merkmals Xk mit dem Merkmal Xl ist. Sei S−1 die Inverse zu S. Der Mahalanobis-Abstand zwischen den Objekten Oi und Oj ist dann definiert durch \begin{eqnarray}{d}_{ij}:={({\overrightarrow{x}}_{i}-{\overrightarrow{x}}_{j})}^{T}{S}^{-1}({\overrightarrow{x}}_{i}-{\overrightarrow{x}}_{j})=:{\Vert {\overrightarrow{x}}_{i}-{\overrightarrow{x}}_{j}\Vert }_{{S}^{-1}}^{2}.\end{eqnarray}

II. Mahalanobis-Abstand zwischen Objektgruppen: In diesem Fall liegt für jede von N, N ≥ 2, Objektgruppen i = 1,…,N folgende Datenmatrix vor:

Abbildung 2 zum Lexikonartikel Mahalanobis-Abstand
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Sei \begin{eqnarray}\overline{{\overrightarrow{x}}_{i.}}:=(\overline{{x}_{i.1}},\ldots,\overline{{x}_{i.p}})\,\,\mathrm{mit}\,\,\overline{{x}_{i.k}}:=\frac{1}{{n}_{i}}\displaystyle \sum _{j=1}^{{n}_{i}}{x}_{ijk}\end{eqnarray} der Vektor der Merkmalsmittelwerte in der i-ten Gruppe und S* = (skl)k,l=1,…,p die gemeinsame empirische Kovarianzmatrix, wobei die Komponenten skl die Schätzungen der Kovarianz zwischen Merkmal k und Merkmal l bzgl. aller Gruppen sind, also \begin{eqnarray}\begin{array}{cc}{s}_{kl}:=\frac{1}{n-N}\displaystyle \sum _{i=1}^{N}\displaystyle \sum _{j=1}^{{n}_{i}}({x}_{ijk}-\overline{{x}_{i.k}})({x}_{ijl}-\overline{{x}_{i.l}})\end{array}\end{eqnarray} mit \(n:=\displaystyle {\sum }_{i=1}^{N}{n}_{i}\). Der Mahalanobis-Abstand zwischen den Gruppen i und j von Objekten ist dann definiert durch den normierten Abstand der Vektoren der Merkmalsmittelwerte in den beiden Gruppen: \begin{eqnarray}\begin{array}{lll}{D}_{ij} & := & {(\overline{{\overrightarrow{x}}_{i.}}-\overline{{\overrightarrow{x}}_{j.}})}^{T}{S}^{-1}(\overline{{\overrightarrow{x}}_{i.}}-\overline{{\overrightarrow{x}}_{j.}})\\ & = & {\Vert \overline{{\overrightarrow{x}}_{i.}}-\overline{{\overrightarrow{x}}_{j.}}\Vert }_{{S}^{-1}}^{2}.\end{array}\end{eqnarray}

III. Liegt ein unbekanntes Objekt mit dem Merkmalsvektor \(\overrightarrow{z}={({z}_{1},\ldots {z}_{p})}^{T}\) vor, so verwendet man als Kriterium für die Zuordnung des Objekts den Mahalanobis-Abstand zum Mittelwertvektor der jeweiligen Gruppe i: \begin{eqnarray}{(\overrightarrow{z}-\overline{{\overrightarrow{x}}_{i.}})}^{T}{S}^{-1}(\overrightarrow{z}-\overline{{\overrightarrow{x}}_{i.}})={\Vert \overrightarrow{z}-\overline{{\overrightarrow{x}}_{i.}}\Vert }_{{S}^{-1}}^{2}.\end{eqnarray}

Das Objekt wird der Gruppe zugeordnet, bei der der Abstand am kleinsten ist.

[1] Hartung, J.; Elpelt, B.: Multivariate Statistik. Oldenbourg Verlag München/Wien, 1989.
[2] Krause, B.; Metzler, P.: Angewandte Statistik. Deutscher Verlag der Wissenschaften Berlin, 1983.

  • Die Autoren
- Prof. Dr. Guido Walz

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.