Lexikon der Mathematik: Mischverteilung
Mischung, in der Regel auf der σ -Algebra ℬ(ℝ) der Borelschen Mengen von ℝ definiertes Wahrscheinlichkeitsmaß Q, das eine Darstellung der Form
für alle B ∈ ℬ(ℝ) mit einem Markow-Kern κ von (ℝ, ℬ(ℝ)) nach (ℝ, ℬ(ℝ)) und einem auf ℬ(ℝ) definierten Wahrscheinlichkeitsmaß µ besitzt.
Im allgemeinen faßt man Q und µ als die Verteilungen PX und PY von zwei auf einem Wahrscheinlichkeitsraum (Ω, 𝔄, P) definierten reellen Zufallsvariablen X und Y und k als die bedingte Verteilung (y, B) → P(X ∈ B|Y = y) von X gegeben Y auf. Besitzt die bedingte Verteilung von X gegeben Y = y, d. h. die Abbildung B → P(X ∈ B|Y = y), für jedes y eine bedingte Dichte fX|Y=y bezüglich des Lebesgue-Maßes λ bzw. des Zählmaßes a, so besitzt PX die Dichte
bezüglich λ bzw. a. Im Falle, daß X und Y beide diskret sind, vereinfacht sich dieser Ausdruck zu
und im Falle, daß eine gemeinsamen Dichte von X und Y bezüglich des zweidimensionalen Lebesgue-Maßes existiert, zu
wobei fY die Dichte von PY bezüglich λ bezeichnet. Die Abbildung zeigt fX für eine Situation, in der PY durch PY ({0}) = 0, 3 und PY ({3}) = 0, 7 gegeben sind, sowie fX|Y=y für y ∈ {0, 3} die Dichte einer Normalverteilung mit Erwartungswert µy = y und Varianz σ2 = 1 ist.
In Anwendungen, wie z. B. der Epidemiologie, werden Mischverteilungen häufig zur Modellierung nicht beobachtbarer Heterogenität verwendet. Dabei wird Y als latente, nicht beobachtbare Variable aufgefaßt, welche die Zugehörigkeit zu bestimmten Subgruppen einer interessierenden Population angibt. Die Verteilung der beobachtbaren Variable X in der durch die Realisierung y von Y gekennzeichneten Subgruppe ist die bedingte Verteilung von X gegeben Y = y. Man nimmt nun an, daß diese Verteilung für jedes y zu einer bestimmten Verteilungsfamilie gehört, z. B. Poisson-Verteilung zum Parameter y. Um eine Mischverteilung an unabhängige Realisierungen x1, …, xn von X anzupassen, stellt man die Log-Likelihood-Funktion
auf, welche bei gegebenen x1, …, xn nur von der unbekannten Verteilung PY abhängt, und versucht eine Verteilung \({\hat{P}}_{Y}\) innerhalb einer bestimmten parametrischen oder nichtparametrischen Klasse von Verteilungen zu bestimmen, die diese Funktion maximiert. Siehe auch Mischen von Verteilungsfunktionen.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.