Lanczos-Verfahren

Lexikon der Mathematik: Lanczos-Verfahren

ursprünglich ein Verfahren zur Transformation einer symmetrischen Matrix auf Tridiagonalgestalt.

Kombiniert mit einer Methode zur Bestimmung von Eigenwerten und Eigenvektoren symmetrischer Tridiagonalmatrizen ist es ein geeignetes Verfahren zur Lösung des symmetrischen Eigenwert-problems für große sparse Matrizen.

Für eine gegebene symmetrische Matix A ∈ ℝⁿ^×ⁿ und einen gegebenen Vektor q₁, ||q₁||₂ = 1, berechnet das Lanczos-Verfahren eine orthogonale Matrix Q ∈ ℝⁿ^×ⁿ, Q^TQ = I, deren erste Spalte Qe₁ = q₁ ist, sodaß A auf symmetrische Tridiagonalgestalt transformiert wird, d. h. \begin{eqnarray}{Q}^{T}AQ={T}_{n}=\left(\begin{array}{cccc}{\alpha }_{1} & {\beta }_{1} & & \\ {\beta }_{1} & {\alpha }_{2} & \ddots & \\ & \ddots & \ddots & {\beta }_{n-1}\\ & & {\beta }_{n-1} & {\alpha }_{n}\end{array}\right).\end{eqnarray}

Setzt man Q = (q₁, q₂, …, q_n) mit q_j ∈ ℝⁿ, so berechnet das Lanczos-Verfahren die Spalten von Q sukzessive aus der Gleichung AQ = QT_n. Dies führt auf die 3-Term-Rekursion für die q_j\begin{eqnarray}A{q}_{j}={\beta }_{j-1}{q}_{j-1}+{\alpha }_{j}{q}_{j}+{\beta }_{j}{q}_{j+1},\end{eqnarray}

wobei β₀q₀ = 0.

Aus der Orthonormalität der q_i folgt dann \({\alpha }_{j}={q}_{j}^{T}A{q}_{j}\) und, wenn \begin{eqnarray}{r}_{j}=(A-{\alpha }_{j}I){q}_{j}-{\beta }_{j-1}{q}_{j-1}\end{eqnarray}

ungleich Null ist, q_j₊₁ = r_j/β_j mit β_j = ||r_j||₂.

Zur Berechnung der nächsten Spalte q_j₊₁ von Q benötigt man also lediglich die beiden vorhergehenden Spalten q_j und q_j₋₁. Da bei den Berechnungen zudem nur das Produkt von A mit einem Vektor benötigt wird, d. h. A selbst nicht verändert wird, verwendet man das Lanczos-Verfahren häufig zur näherungsweisen Berechnung einiger Eigenwerte und Eigenvektoren großer, sparser Matrizen. Dabei reduziert man A nicht vollständig zu der Tridiagonalmatrix T_n, sondern stoppt bei einem T_j, j < n. Man berechnet also nur die ersten j Spalten Q_j = (q₁, q₂, …, q_j) von Q, so daß \begin{eqnarray}A{Q}_{j}={Q}_{j}{T}_{j}+{r}_{j}{e}_{j}^{T}.\end{eqnarray}

Nun berechnet man die Eigenwerte \begin{eqnarray}{\lambda }_{1},\ldots, {\lambda }_{j}\in {\mathbb{R}}\end{eqnarray}

und orthonormalen Eigenvektoren \begin{eqnarray}{s}_{1},\ldots, {s}_{j}\in {{\mathbb{R}}}^{j}\end{eqnarray}

von T_j, d. h. \begin{eqnarray}{T}_{j}={S}_{j}{D}_{j}{S}_{j}^{T},\end{eqnarray}

mit S_j = (s₁, …, s_j), \({S}_{j}^{T}{S}_{j}=I\), und D_j = diag (λ₁, …, λ_j). Ist r_j = 0, dann sind die Eigenwerte λ_k, k = 1, …, j, der berechneten j-ten Hauptabschnittsmatrix T_j der Tridiagonalmatrix T_n Eigenwerte von A. Für r_j ≠ 0, ist jedes λ_i eine gute Näherung an einen Eigenwert von A, für welches |β_js_ji| genügend klein ist (hierbei bezeichnet s_ji den letzten Eintrag des i-ten Eigenvektors s_i von T_j). Zugehöriger approximativer Eigenvektor von A ist dann y_i = Q_js_i. Auf diese Art und Weise approximiert man die extremalen Eigenwerte von A.

Es existieren zahlreiche Varianten des beschriebenen Lanczos-Verfahrens. Bei der numerischen Berechnung ist es z. B. erforderlich, die theoretisch gegebene Orthonormalität der Vektoren q_i explizit zu erzwingen.

Zur Bestimmung der Eigenwerte der symmetrischen Tridiagonalmatrizen T_j ist der QR-Algorithmus gut geeignet, da man i. allg. an allen Eigenwerten von T_j interessiert ist.

Das Lanczos-Verfahren kann auch interpretiert werden als Methode zur Berechnung einer orthogonalen Basis {q₁, q₂, …, q_n} für den Krylow-Raum \begin{eqnarray}\{{q}_{1},A{q}_{1},{A}^{2}{q}_{1},\ldots, {A}^{n-1}{q}_{1}\},\end{eqnarray}

bzw. als Methode zur Berechnung einer der Krylow-Matrix \begin{eqnarray}\begin{array}{lll}K(A,{q}_{1},n) & = & ({q}_{1},A{q}_{1},{A}^{2}{q}_{1},\ldots, {A}^{n-1}{q}_{1})\\ & = & ({q}_{1},{q}_{2},\ldots, {q}_{n})R=QR.\end{array}\end{eqnarray}

Diese Eigenschaft nutzt das konjugierte Gradientenverfahren aus, um ein lineares Gleichungssystem Ax = b mit symmetrischer positiv definiter Matrix A zu lösen.

Es existieren Verallgemeinerungen des Lanczos-Verfahren für nichtsymmetrische Matrizen A ∈ ℝⁿ^×ⁿ. In dem Falle wird eine nichtsinguläre Matrix X berechnet, welche die Matrix A auf (nichtsymmetrische) Tridiagonalgestalt \({\tilde{T}}_{n}=XA{X}^{-1}\) transformiert. Hierzu setzt man Y = X^−T und berechnet, ausgehend von zwei gegebenen Vektoren y₁, x₁ mit \({y}_{1}^{T}{x}_{1}=1\), die Matrizen X = (x₁, x₂, …, x_n) und Y = (y₁, y₂, …, y_n) spaltenweise, so daß \begin{eqnarray}\begin{array}{rll}AX & = & X{\tilde{T}}_{n}\\ {A}^{T}Y & = & Y{\tilde{T}}_{n}^{T}\\ {Y}^{T}X & = & I\end{array}\end{eqnarray}

mit \begin{eqnarray}{\tilde{T}}_{n}=\left(\begin{array}{ccccc}{\alpha }_{1} & {\beta }_{1} & & & \\ {\gamma }_{1} & {\alpha }_{2} & {\beta }_{2} & & \\ & {\gamma }_{2} & \ddots & \ddots & \\ & & \ddots & \ddots & {\beta }_{n-1}\\ & & & {\gamma }_{n-1} & {\alpha }_{n}\end{array}\right)\end{eqnarray}

gilt. Wie beim symmetrischen Lanczos-Verfahren reduziert man A nicht vollständig zur Tridiagonal-matrix \({\tilde{T}}_{n}\), sondern stoppt bei einem \({\tilde{T}}_{j}\), j < n, und betrachtet die Eigenwerte von \({\tilde{T}}_{j}\) als Näherungen an die Eigenwerte von A. Im Gegensatz zum Lanczos-Verfahren für symmetrische Matrizen kann es hier vorkommen, daß die Berechnungen nicht durchgeführt werden können (da einer der Parameter, durch die dividiert wird, Null werden kann). Das Verfahren bricht dann zusammen, ohne relevante Informationen über Eigenwerte und Eigenvektoren zu liefern. In der Literatur existieren zahlreiche Vorschläge, wie dieses Problem umgangen werden kann.

Stets anwendbar ist in diesem Fall das Arnoldi-Verfahren, welches die Matrix A statt auf Tridiagonalgestalt auf obere Hessenberg-Form reduziert.

Lexikon der Mathematik: Lanczos-Verfahren

Schreiben Sie uns!

Artikel zum Thema

Mathematik: Was die Zahl 2026 besonders macht

Universum im Computer: Laut Mathematik könnten wir in einer Computersimulation leben

Christian Spannagel: Glühwein-Funktionen

Mathemagischer Advent: Die kultige 1729

Themenkanäle

Zahlentheorie

Das Digital-Manifest

Quantenphysik

SponsoredPartnerinhalte