Lexikon der Mathematik: Konvexe Analysis
Sigg M.
Die konvexe Analysis ist ein Grenzgebiet von Geometrie, Analysis und Funktionalanalysis, das sich mit den Eigenschaften konvexer Mengen und konvexer Funktionen befaßt und Anwendungen sowohl in der reinen Mathematik besitzt (von Existenzsätzen in der Theorie der Differential- und Integralgleichungen bis zum Gitterpunktsatz von Minkowski in der Zahlentheorie) als auch in Bereichen wie der mathematischen Ökonomie und den Ingenieurswissenschaften, wo man es oft mit Optimierungs- und Gleichgewichtsproblemen zu tun hat.
In den folgenden Ausführungen, die vor allem auf [4], [5] und [1] zurückgehen, seien alle Vektorräume reell und alle topologischen Räume separiert. Hinsichtlich anderer und allgemeinerer Konvexitätsbegriffe sei auf [3] und für Anwendungen insbesondere auf [2] und [6] verwiesen.
Trennungssätze
Von besonderer Bedeutung für die Anwendungen, etwa für Existenzsätze für Lösungen von Ungleichungssystem in der mathematischen Ökonomie, sind Trennungssätze für konvexe Mengen. Von zwei Teilmengen X, Y eines Vektorraums V sagt man genau dann, sie lassen sich trennen, wenn es ein lineares Funktional f ≠ 0 auf V gibt, das X und Y trennt, d. h. sup f(X) ≤ inf f(Y) erfüllt. Man sagt, daß f die Mengen X und Y stark trennt genau dann, wenn sup f(X) < inf f(Y) gilt. Ein wesentlicher Gesichtspunkt ist, daß diese Trennungsbegriffe keine Topologie auf V benötigen.
Grundlegend ist der auf Stanislaw Mazur (1933) zurückgehende Trennungssatz von Mazur: Sind X und Y disjunkte konvexe Teilmengen eines Vektorraums V, und ist X radial in einem Punkt, so lassen sich X und Y trennen.
Dabei heißt eine Menge X ⊂ V radial im Punkt x ∈ X und x ein radialer Punkt von X, wenn es zu jedem y ∈ V ein t > 0 gibt mit x + sy ∈ X für s ∈ (−t, t). Ist V topologischer Vektorraum, so ist jeder innere Punkt einer Menge auch radialer Punkt, und für konvexe Mengen mit nicht-leerem Inneren sind die inneren Punkte genau die radialen Punkte.
Sind X und Y disjunkte konvexe Teilmengen eines lokalkonvexen Vektorraums V, und ist X abgeschlossen und Y kompakt, so lassen sich X und Y stark trennen.
Extremale Teilmengen und extremale Punkte
Zu einer konvexen Teilmenge X eines Vektorraums V ist die kleinste Menge Y ⊂ V von Interesse, deren konvexe Hülle gerade X ist, für die also conv Y = X gilt, bzw. auch \(\overline{\text{conv}}Y=X\), falls V ein topologischer Vektorraum ist. Dabei sind extremale Teilmengen und extremale Punkte von Nutzen. Eine nicht-leere Teilmenge Y von X heißt extremal in X genau dann, wenn für alle x1, x2 ∈ X gilt: Gibt es ein t ∈ (0, 1) mit tx1 + (1 − t)x2 ∈ Y, so folgt x1, x2 ∈ Y. Der Rand eines Kreises ist z. B. eine extremale Teilmenge des Kreises. Ecken, Kanten sowie Stirnflächen eines konvexen Polyeders in ℝ
Ein x ∈ X heißt extremaler Punkt von X genau dann, wenn {x} eine extremale Teilmenge von X ist, also genau dann, wenn für alle x1, x2 ∈ X \{x} mit x ∈ conv{x1, x2} gilt: x1 = x2 = x. Ist X konvex, so ist x genau dann extremaler Punkt von X, wenn auch X \{x} noch konvex ist.
Zu einer Menge X ⊂ V bezeichnet ext X die Menge der extremalen Punkte von X. Man kann zeigen, daß
gilt und damit für Y ⊂ V:
Im Fall eines topologischen Vektorraums V gilt offenbar ext X ∩ int X = ∅ und damit ext X ⊂ ∂X. Ist V lokalkonvex und \(\overline{\text{conv}}X\text{}\) kompakt, so gilt
Im Jahr 1940 zeigten Mark Grigorjewitsch Krein und David Milman den wichtigen Satz von Krein-Milman: Ist X eine kompakte konvexe Teilmenge eines lokalkonvexen Vektorraums V, so gilt
d. h. X ist die abgeschlossene konvexe Hülle seiner extremalen Punkte. Die Kompaktheit von X ist hierbei eine wesentliche Voraussetzung – man betrachte etwa das Innere eines n-Simplex oder einen abgeschlossenen Halbraum im ℝ
Aus (1) erhält man unter den Voraussetzungen des Satzes von Krein-Milman noch für Y ⊂ X:
\(\overline {\text{ext}\space X}\) ist also die kleinste abgeschlossene Menge, deren abgeschlossene konvexe Hülle gleich X ist.
Der Satz von Krein-Milman hat zahlreiche Anwendungen. Beispielsweise fand Joram Lindenstrauss mit seiner Hilfe im Jahr 1966 einen besonders kurzen und eleganten Beweis des Konvexitätssatzes von Ljapunow, der etwa in der Time-Optimal-Control Theory (Bang-Bang-Steuerung) von großer Bedeutung ist.
Stützpunkte
Ist X Teilmenge eines topologischen Vektorraums V, so heißt x ∈ X ein Stützpunkt von X, wenn es ein stetiges lineares Funktional f ≠ 0 auf V gibt mit sup f(X) = f(x). Man nennt f ein Stützfunktional, die Menge x + ker f eine Stützhyperebene und { y ∈ V | f(y) ≤ f(x)} einen stützenden Halbraum von X im Punkt x. Der Durchschnitt aller stützenden Halbräume im Punkt x heißt Stützkegel und der Durchschnitt aller Stützhyperebenen Kantenraum von X im Punkt x. Besteht der Kantenraum genau aus dem Punkt x selbst, so heißt x Ecke von X.
Mit ∂sX wird die Menge der Stützpunkte von X bezeichnet. Es gilt ∂sX ⊂ ∂X, d. h. jeder Stützpunkt von X ist ein Randpunkt von X. Eine Teilmenge von V heißt konvexer Körper genau dann, wenn sie konvex ist und ein nicht-leeres Inneres hat. Aus dem Trennungssatz von Mazur folgt, daß für einen abgeschlossenen konvexen Körper X ∂sX = ∂X gilt. Im ℝ
Nach dem auf Errett Bishop und Robert ℝ. Phelps (1963) zurückgehenden Satz von Bishop-Phelps liegt für jede abgeschlossene konvexe Teilmenge X eines Banachraums die Menge ∂sX dicht in ∂X. Damit kann man zeigen, daß ∂sX = ∂X gilt, wenn X eine abgeschlossene konvexe Teilmenge eines endlichdimensionalen normierten Vektorraums ist.
Exponierte Punkte
Ist X Teilmenge eines topologischen Vektorraums V, so heißt x ∈ X ein exponierter Punkt von X, wenn x ein Stützpunkt von X ist und man durch x eine Stützhyperebene legen kann, die X genau in x schneidet, d. h. wenn es ein Stützfunktional f von X im Punkt x gibt mit f(y) < f(x) für y ∈ X \{x}. Die Menge der exponierten Punkte von X wird mit exp X bezeichnet.
Ist X konvex, so gilt exp X ⊂ ext X. Ist X eine kompakte konvexe Teilmenge eines normierten Vektorraums, so liegt nach dem von Stefan Straszewicz (1935) für ℝ
erhält und damit
als Verschärfung des Satzes von Krein-Milman im Fall eines normierten Vektorraums.
Schreibt man \(A\overline{\subset }B\) für, A liegt dicht in B, d. h. A ⊂ B und \(B\subset \overline{A}\), so gilt für abgeschlossene konvexe Teilmengen X eines normierten Vektorraums nach dem Bisherigen:
Für kompakte konvexe Teilmengen X eines Banachraums erhält man mit dem Satz von Bishop-Phelps daraus
und im Fall X ⊂ ℝ
Man kann zeigen, daß ein abgeschlossener konvexer Körper X eines topologischen Vektorraums genau dann streng konvex ist, wenn exp X = ∂X gilt. Daraus erhält man
für abgeschlossene streng konvexe Körper X.
Reguläre Punkte
Ist X Teilmenge eines topologischen Vektorraums V, so heißt x ∈ X ein regulärer Punkt von X, wenn x ein Stützpunkt von X ist und es im Punkt x genau eine Stützhyperebene von X gibt, d. h. wenn es ein Stützfunktional f von X im Punkt x so gibt, daß jedes Stützfunktional zu X im Punkt x ein positives Vielfaches von f ist. Man nennt ein solches f Tangentenfunktional und {y ∈ V | f(y) ≤ f(x)} einen X im Punkt x tangierenden Halbraum. Die Menge der regulären Punkte von X wird mit ∂rX bezeichnet.
Die Menge X heißt glatt genau dann, wenn sie konvex ist und alle ihre Randpunkte reguläre Punkte sind, also wenn ∂rX = ∂X gilt. Ein Kreis ist z. B. glatt. Ein Quadrat ist nicht glatt, weil seine Ecken nicht regulär sind. Mazur konnte 1933 beweisen, daß für einen abgeschlossenen konvexen Körper X in einem separablen Banachraum ∂rX dicht in ∂X liegt. Damit kann man zeigen, daß jeder abgeschlossene Körper in einem separablen Banachraum der Durchschnitt seiner tangierenden Halbräume ist.
Die Menge X heißt regulär genau dann, wenn sie glatt ist und exp X = ∂X gilt. Jeder glatte streng konvexe Körper ist regulär.
Konvexe Mengen im ℝn
Für konvexe Mengen im ℝ
Der 1913 von Eduard Helly bewiesene Satz von Helly ist eine wichtige und schöne Erkenntnis über Schnitte konvexer Mengen im ℝ
Der Satz von Helly läßt sich etwa benutzen für einen Beweis des 1903 von Paul Kirchberger angegebenen Satzes von Kirchberger: Sind X und Y endliche Teilmengen von ℝ
Es bezeichne U := Un die Einheitskugel im ℝ
definierten Metrik \(d:{{\mathbb{K}}}_{n}^{2}\to [0,\infty ),\), so ist der metrische Raum (Kn, d) vollständig.
S ⊂ 𝕂n heißt beschränkt genau dann, wenn
gilt. Nach dem auf Wilhelm Johann Eugen Blaschke (1916) zurückgehenden Auswahlsatz von Blaschke besitzt jede beschränkte Folge in 𝕂n eine in (𝕂n, d) konvergente Teilfolge. Damit kann man zeigen, daß (𝕂n, d) lokalkompakt und separabel ist.
Von Interesse ist auch die Approximation konvexer Mengen im ℝ
woraus d(X, P) < ϵ folgt, d. h. ℙn liegt dicht in 𝕂n.
Nach dem von Hugo Hadwiger (1955) stammenden Satz von Hadwiger gibt es zu jeder kompakten konvexen Nullumgebung X ⊂ ℝ
Damit erhält man, daß es zu jedem kompakten konvexen Körper X ⊂ ℝ
Ferner kann man zeigen, daß es zu jeder kompakten konvexen Menge X ⊂ ℝ
Für P ∈ ℙn sei An(P) der Oberflächeninhalt und Vn(P) das Volumen von P. Es sei \({{\mathbb{K}}}_{n}^{0}\subset {{\mathbb{K}}}_{n}\) die Menge der kompakten konvexen Körper. In Erweiterung von An und Pn definiert man durch
den Oberflächeninhalt An(X) und das Volumen Vn(X) von \(X\in {\mathbb{K}}_{n}^{0}\). Es gilt:
An : \({{\mathbb{K}}}_{n}^{0}\to [0,\infty )\) ist stetig. Setzt man noch
so ist Vn : 𝕂n → [ 0, ∞) stetig und isoton. Man kann An(X) für \(X\in {{\mathbb{K}}}_{n}^{0}\) rekursiv berechnen durch die Cauchy-Oberflächenformel
Dabei bezeichnet Px für x ∈ ∂Un die orthogonale Projektion von ℝ
Fixpunktsätze
Fixpunktsätze sind wichtige Hilfsmittel zur Herleitung von Existenzsätzen und zur Lösung von Differential- und Integralgleichungen, von Approximations-, Anfangs- und Randwertproblemen. Vorteil der auf Konvexitätseigenschaften beruhenden Fixpunktsätze ist, daß sie keine Kontraktionsforderungen an die betrachtete Funktion stellen.
Grundlegend ist der 1909 von Luitzen Egbertus Jan Brower bewiesene Fixpunktsatz von Brouwer, der besagt, daß jede stetige Abbildung der Einheitskugel im ℝ
Konvexe Funktionen
Wie für reellwertige Funktionen auf reellen Inter-vallen nennt man eine auf einer konvexen Teilmenge X eines Vektorraums V definierte Funktion f : X → ℝ konvex genau dann, wenn
gilt für alle x1, x2 ∈ X mit x1 ≠ x2 und α ∈ (0, 1), und streng konvex, wenn dabei sogar, <‘ gilt. Konvexität von f ist auch hier äquivalent zur Jensen-Ungleichung
für alle n ≥ 2, α1, …, αn ∈ (0, 1) mit : \(\displaystyle {\sum }_{i=1}^{n}{\alpha }_{i}=1\) und paarweise verschiedene x1, …, xn ∈ X.
Sind f, g : X → ℝ konvex und α, β ≥ 0, so ist auch αf + βg konvex. Ist I eine beliebige Indexmenge und fi : X → ℝ konvex für i ∈ I, so sind die Menge X0 := {x ∈ X | supi∈I fi(x) < ∞} und die Funktion supi∈I fi : X0 → ℝ konvex. Ist (fn)n∈N eine Folge konvexer Funktionen fn : X → ℝ, die punktweise gegen die Funktion f : X → ℝ konvergieren, so ist auch f konvex.
Epigraph und Distanzfunktion
Es gibt eine Reihe von Zusammenhängen zwischen konvexen Funktionen und konvexen Mengen. Eine Funktion f : X → ℝ auf einer konvexen Teilmenge X eines Vektorraums V ist z. B. genau dann konvex, wenn ihr Epigraph
konvex ist. Ist V ein normierter Vektorraum, so folgt aus der Konvexität von X ⊂ V die Konvexität der für a ∈ V durch
erklärten Distanzfunktion dX : V → [0, ∞). Insbesondere ist natürlich ∥ ∥ : V → [0, ∞) konvex.
Stetigkeit und Differenzierbarkeit
Es sei X eine offene konvexe Teilmenge eines topologischen Vektorraums V. Ist f : X → ℝ konvex, so ist f genau dann stetig, wenn es eine nicht-leere offene Teilmenge von X gibt, auf der f nach oben beschränkt ist. Ist V normierter Vektorraum, so ist f genau dann stetig, wenn f lokal Lipschitz-stetig ist. Ist V sogar endlichdimensional, so ist jede konvexe Funktion auf X stetig.
Im folgenden sei V ein normierter Vektorraum. Wie bei reellwertigen Funktionen auf reellen Inter-vallen liefert dann für eine Funktion f : X → ℝ die Ableitung ein Konvexitätskriterium: Ist f konvex und an der Stelle a ∈ X differenzierbar, so gilt
für alle x ∈ X, d. h. f liegt über seiner Tangential-hyperebene an der Stelle a. Ist f differenzierbar auf ganz X, so ist f genau dann konvex, wenn (2) für alle a, x ∈ X gilt, und genau dann streng konvex, wenn hierbei in (2) für x ≠ a sogar, >‘ gilt.
Nennt man, in Erweiterung der, reellen‘ Sprechweise, eine auf einer Menge M ⊂ V definierte Funktion g : M → ℝ
gilt für alle x, y ∈ M, und streng isoton genau dann, wenn dabei sogar, >‘ gilt für x ≠ y, dann hat man: Ist f : X → ℝ stetig und differenzierbar, so ist f genau dann (streng) konvex, wenn f′ (streng) isoton ist.
Weiter gilt: Ist f : X → ℝ zweimal differenzierbar, so ist f genau dann konvex, wenn f′′(x) für jedes x ∈ X positiv semidefinit ist. Ist f′′(x) für alle x ∈ X positiv definit, so ist f streng konvex. Im Fall V = ℝ
Ist V ein Vektorraum und X ⊂ V konvex, so ist jede konvexe Funktion f : X → ℝ einseitig Gâteaux-differenzierbar, d. h. für jedes x ∈ X und v ∈ V derart, daß es ein α > 0 gibt mit x + αv ∈ X, existiert die Gâteaux-Ableitung
Ist V ein endlichdimensionaler normierter Vektorraum, so ist f an einer Stelle genau dann differenzierbar, wenn f dort Gâteaux-differenzierbar ist.
Es sei X ⊂ ℝ
Literatur
[1] Giles, J. R.: Convex Analysis with Application in Differentiation of Convex Functions. Pitman London, 1982.
[2] Hiriat-Urruty, J.-B.; Lemaréchal, C.: Convex Analysis and Minimization Algorithms I,II. Springer-Verlag Berlin, 1993.
[3] Hörmander, L.: Notions of Convexity. Birkhäuser-Verlag Boston, 1994.
[4] Marti, J. T.: Konvexe Analysis. Birkäuser-Verlag Basel, 1977.
[5] Roberts, A. W.; Varberg, D. E.: Convex Functions. Academic Press New York, 1973.
[6] Stoer, J; Witzgall, C.: Convexity and Optimization. Springer-Verlag Berlin, 1970.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.