Kohonen-Lernregel

Lexikon der Mathematik: Kohonen-Lernregel

eine spezielle Lernregel im Bereich Neuronale Netze, die insbesondere von Teuvo Kohonen gegen Ende der siebziger Jahre publik gemacht, allerdings auch schon vorher in Variationen in der Literatur diskutiert wurde.

Die Kohonen-Lernregel ist eng verwandt mit der lernenden Vektorquantisierung, wobei der wesentliche Unterschied darin besteht, daß letztere primär eine überwachte Lernregel ist, während die Kohonen-Lernregel unüberwacht arbeitet. Auch besteht ein enger Zusammenhang mit der adaptive-resonance-theory, die in gewisser Hinsicht als eine konsequente Fortführung der Kohonen-Lernregel zur Lösung des sogenannten Stabilitäts-Plastizitäts-Problems angesehen werden kann.

Im folgenden wird das Prinzip der Kohonen-Lernregel an einem einfachen Beispiel (diskrete Variante) erläutert: Eine endliche Menge von t Vektoren x⁽^s⁾ ∈ ℝⁿ, 1 ≤ s ≤ t, soll klassifiziert werden, d. h. in j sogenannte Cluster eingeordnet werden (Clusteranalyse), wobei j im allgemeinen wesentlich kleiner als t ist. Dazu werden zunächst zufällig sogenannte Klassifikationsvektoren w⁽ⁱ⁾ ∈ ℝⁿ, 1 ≤ i ≤ j, generiert, die die einzelnen Cluster repräsentieren sollen und aus diesem Grunde auch kurz als Cluster-Vektoren bezeichnet werden.

Die Justierung der Cluster-Vektoren in Abhängigkeit von den zu klassifizierenden Vektoren geschieht nun im einfachsten Fall wie folgt, wobei λ ∈ (0, 1) ein noch frei zu wählender Lernparameter ist: Im s-ten Schritt (1 ≤ \({\mathcal{S}}\) ≤ t) zur Klassifikation von x⁽^s⁾ berechne jeweils ein Maß für die Entfernung von x⁽^s⁾ zu allen Cluster-Vektoren w⁽ⁱ⁾, 1 ≤ i ≤ j (z. B. über den Winkel, den euklidischen Abstand, o.ä.). Schlage x⁽^s⁾ demjenigen Cluster zu, dessen Cluster-Vektor die geringste Entfernung von x⁽^s⁾ hat. Falls mehrere Cluster-Vektoren diese Eigenschaft besitzen, nehme das Cluster mit dem kleinsten Index. Falls der so fixierte Cluster-Vektor den Index i hat, ersetze ihn durch \begin{eqnarray}{w}^{(i)}+\lambda ({x}^{(s)}-{w}^{(i)}),\end{eqnarray} d. h. durch eine Konvexkombination des alten Cluster-Vektors mit dem neu klassifizierten Vektor; alle übrigen Cluster-Vektoren bleiben unverändert.

Iteriere dieses Vorgehen mehrmals, erniedrige λ Schritt für Schritt und breche den Algorithmus ab, wenn z. B. der Maximalabstand aller zu klassifizierenden Vektoren zu ihrem jeweiligen Cluster-Vektor eine vorgegebene Schranke unterschreitet oder aber eine gewisse Anzahl von Iterationen durchlaufen worden sind.

Der oben skizzierte Prototyp der Kohonen-Lernregel ist im Laufe der Zeit in verschiedenste Richtungen wesentlich verallgemeinert worden. Erwähnt seien in diesem Zusammenhang nur die Erweiterung der zu modifizierenden Cluster-Vektoren in Abhängigkeit von einer Nachbarschaftsfunktion sowie die temporäre Unterdrükkung der Aktualisierung von Cluster-Vektoren, die unverhältnismäßig oft minimalen Abstand liefern („Kohonen-Lernregel mit Gewissen“).

Schließlich findet man unter dem Stichwort Kohonen-Netz einige grundsätzliche Bemerkungen dazu, wie man die Kohonen-Lernregel konkret im Umfeld neuronaler Netze implementieren kann.