2D-Gauss-WDF (Applet)
Contents
Programmbeschreibung
Das Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen XY, gekennzeichnet durch die Standardabweichungen (Streuungen) σX und σY ihrer beiden Komponenten sowie den Korrelationskoeffizienten ρXY zwischen diesen. Die Komponenten werden als mittelwertfrei vorausgesetzt: mX=mY=0.
Das Applet zeigt
- die zweidimensionale Wahrscheinlichkeitsdichtefunktion ⇒ 2D−WDF fXY(x,y) in dreidimensionaler Darstellung sowie in Form von Höhenlinien,
- die zugehörige Randwahrscheinlichkeitsdichtefunktion ⇒ 1D−WDF fX(x) der Zufallsgröße X als blaue Kurve; ebenso fY(y) für die zweite Zufallsgröße,
- die zweidimensionale Verteilungsfunktion ⇒ 2D−VTF FXY(x,y) als 3D-Plot,
- die Verteilungsfunktion ⇒ 1D−VTF FX(x) der Zufallsgröße X; ebenso FY(y) als rote Kurve.
Das Applet verwendet das Framework Plot.ly
Theoretischer Hintergrund
Verbundwahrscheinlichkeitsdichtefunktion ⇒ 2D–WDF
Wir betrachten zwei wertkontinuierliche Zufallsgrößen X und Y, zwischen denen statistische Abhängigkeiten bestehen können. Zur Beschreibung der Wechselbeziehungen zwischen diesen Größen ist es zweckmäßig, die beiden Komponenten zu einer zweidimensionalen Zufallsgröße XY=(X,Y) zusammenzufassen. Dann gilt:
Definition: Die Verbundwahrscheinlichkeitsdichtefunktion ist die Wahrscheinlichkeitsdichtefunktion (WDF, englisch: Probability Density Function, kurz: PDF) der zweidimensionalen Zufallsgröße XY an der Stelle (x,y):
- fXY(x,y)=limΔx→0Δy→0Pr[(x−Δx/2≤X≤x+Δx/2)∩(y−Δy/2≤Y≤y+Δy/2)]Δ x⋅Δy.
- Die Verbundwahrscheinlichkeitsdichtefunktion oder kurz 2D−WDF ist eine Erweiterung der eindimensionalen WDF.
- ∩ kennzeichnet die logische UND-Verknüpfung.
- X und Y bezeichnen die beiden Zufallsgrößen, und x∈X sowie y∈Y geben Realisierungen hiervon an.
- Die für dieses Applet verwendete Nomenklatur unterscheidet sich also geringfügig gegenüber der Beschreibung im Theorieteil.
Anhand dieser 2D–WDF fXY(x,y) werden auch statistische Abhängigkeiten innerhalb der zweidimensionalen Zufallsgröße XY vollständig erfasst im Gegensatz zu den beiden eindimensionalen Dichtefunktionen ⇒ Randwahrscheinlichkeitsdichtefunktionen:
- fX(x)=∫+∞−∞fXY(x,y)dy,
- fY(y)=∫+∞−∞fXY(x,y)dx.
Diese beiden Randdichtefunktionen fX(x) und fY(y)
- liefern lediglich statistische Aussagen über die Einzelkomponenten X bzw. Y,
- nicht jedoch über die Bindungen zwischen diesen.
Als quantitatives Maß für die linearen statistischen Bindungen ⇒ Korrelation verwendet man
- die Kovarianz μXY, die bei mittelwertfreien Komponenten gleich dem gemeinsamen linearen Moment erster Ordnung ist:
- μXY=E[X⋅Y]=∫+∞−∞∫+∞−∞X⋅Y⋅fXY(x,y)dxdy,
- den Korrelationskoeffizienten nach Normierung auf die beiden Effektivwerte σX und σY der beiden Komponenten:
- ρXY=μXYσX⋅σY.
Eigenschaften des Korrelationskoeffizienten:
- Aufgrund der Normierung gilt stets −1≤ρXY≤+1.
- Sind die beiden Zufallsgrößen X und Y unkorreliert, so ist ρXY=0.
- Bei strenger linearer Abhängigkeit zwischen X und Y ist ρXY=±1 ⇒ vollständige Korrelation.
- Ein positiver Korrelationskoeffizient bedeutet, dass bei größerem X–Wert im statistischen Mittel auch Y größer ist als bei kleinerem X.
- Dagegen drückt ein negativer Korrelationskoeffizient aus, dass Y mit steigendem X im Mittel kleiner wird.
2D–WDF bei Gaußschen Zufallsgrößen
Für den Sonderfall Gaußscher Zufallsgrößen – der Name geht auf den Wissenschaftler Carl Friedrich Gauß zurück – können wir weiterhin vermerken:
- Die Verbund–WDF einer Gaußschen 2D-Zufallsgröße XY mit Mittelwerten mX=0 und mY=0 sowie dem Korrelationskoeffizienten ρ=ρXY lautet:
- fXY(x,y)=12π⋅σX⋅σY⋅√1−ρ2 ⋅ exp[−12⋅(1−ρ2)⋅(x2σ2X+y2σ2Y−2ρ⋅x⋅yσx⋅σY)]mit−1≤ρ≤+1.
- Ersetzt man x durch (x−mX) sowie y durch (y−mY), so ergibt sich die allgemeinere WDF einer zweidimensionalen Gaußschen Zufallsgröße mit Mittelwert.
- Die Randwahrscheinlichkeitsdichtefunktionen fX(x) und fY(y) einer Gaußschen 2D-Zufallsgröße sind ebenfalls gaußförmig mit den Streuungen σX bzw. σY.
- Bei unkorrelierten Komponenten X und Y muss in obiger Gleichung ρ=0 eingesetzt werden, und man erhält dann das Ergebnis:
- fXY(x,y)=1√2π⋅σX⋅e−x2/(2σ2X)⋅1√2π⋅σY⋅e−y2/(2σ2Y)=fX(x)⋅fY(y).
Fazit: Im Sonderfall einer 2D-Zufallsgröße mit Gaußscher WDF fXY(x,y) folgt aus der Unkorreliertheit auch direkt die statistische Unabhängigkeit:
- fXY(x,y)=fX(x)⋅fY(y).
Bitte beachten Sie:
- Bei keiner anderen WDF kann aus der Unkorreliertheit auf die statistische Unabhängigkeit geschlossen werden.
- Man kann aber stets ⇒ für jede beliebige 2D–WDF fXY(x,y) von der statistischen Unabhängigkeit auf die Unkorreliertheit schließen, weil:
- Sind zwei Zufallsgrößen X und Y völlig voneinander (statistisch) unabhängig, so gibt es zwischen ihnen natürlich auch keine linearen Abhängigkeiten
⇒ sie sind dann auch unkorreliert ⇒ ρ=0.
Höhenlinien bei unkorrelierten Zufallsgrößen
Aus der Bedingungsgleichung fXY(x,y)=const. können die Höhenlinien der WDF berechnet werden.
Sind die Komponenten X und Y unkorreliert (ρXY=0), so erhält man als Gleichung für die Höhenlinien:
- x2σ2X+y2σ2Y=const.
Die Höhenlinien beschreiben in diesem Fall folgende Figuren:
- Kreise (falls σX=σY, grüne Kurve), oder
- Ellipsen (für σX≠σY, blaue Kurve) in Ausrichtung der beiden Achsen.
Korrelationsgerade
Als Korrelationsgerade bezeichnet man die Gerade y=K(x) in der (x,y)–Ebene durch den „Mittelpunkt” (mX,mY). Diese besitzt folgende Eigenschaften:
- Die mittlere quadratische Abweichung von dieser Geraden – in y–Richtung betrachtet und über alle N Messpunkte gemittelt – ist minimal:
- ¯ε2y=1N⋅N∑ν=1[yν−K(xν)]2=Minimum.
- Die Korrelationsgerade kann als eine Art „statistische Symmetrieachse“ interpretiert werden. Die Geradengleichung lautet im allgemeinen Fall:
- y=K(x)=σYσX⋅ρXY⋅(x−mX)+mY.
- Der Winkel, den die Korrelationsgerade zur x–Achse einnimmt, beträgt:
- θ=arctan(σYσX⋅ρXY).
Höhenlinien bei korrelierten Zufallsgrößen
Bei korrelierten Komponenten (ρXY≠0) sind die Höhenlinien der WDF (fast) immer elliptisch, also auch für den Sonderfall σX=σY.
Ausnahme: ρXY=±1 ⇒ Diracwand; siehe Aufgabe 4.4 im Buch "Stochastische Signaltheorie", Teilaufgabe (5).
Hier lautet die Bestimmungsgleichung der WDF-Höhenlinien:
- fXY(x,y)=const.⇒x2σ2X+y2σ2Y−2⋅ρXY⋅x⋅yσX⋅σY=const.
Die Grafik zeigt in hellerem Blau für zwei unterschiedliche Parametersätze je eine Höhenlinie.
- Die Ellipsenhauptachse ist dunkelblau gestrichelt.
- Die Korrelationsgerade K(x) ist durchgehend rot eingezeichnet.
Anhand dieser Darstellung sind folgende Aussagen möglich:
- Die Ellipsenform hängt außer vom Korrelationskoeffizienten ρXY auch vom Verhältnis der beiden Streuungen σX und σY ab.
- Der Neigungswinkel α der Ellipsenhauptachse (gestrichelte Gerade) gegenüber der x–Achse hängt ebenfalls von σX, σY und ρXY ab:
- α=1/2⋅arctan(2⋅ρXY⋅σX⋅σYσ2X−σ2Y).
- Die (rote) Korrelationsgerade y=K(x) einer Gaußschen 2D–Zufallsgröße liegt stets unterhalb der (blau gestrichelten) Ellipsenhauptachse.
- K(x) kann aus dem Schnittpunkt der Höhenlinien und ihrer vertikalen Tangenten geometrisch konstruiert werden, wie in der Skizze in grüner Farbe angedeutet.
Zweidimensionale Verteilungsfunktion ⇒ 2D–VTF
Definition: Die 2D-Verteilungsfunktion ist ebenso wie die 2D-WDF lediglich eine sinnvolle Erweiterung der eindimensionalen Verteilungsfunktion (VTF):
- FXY(x,y)=Pr[(X≤x)∩(Y≤y)].
Es ergeben sich folgende Gemeinsamkeiten und Unterschiede zwischen der "1D-VTF" und der" 2D-VTF":
- Der Funktionalzusammenhang zwischen "2D–WDF" und "2D–VTF" ist wie im eindimensionalen Fall durch die Integration gegeben, aber nun in zwei Dimensionen. Bei kontinuierlichen Zufallsgrößen gilt:
- FXY(x,y)=∫y−∞∫x−∞fXY(ξ,η)dξdη.
- Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch partielle Differentiation nach x und y angeben:
- fXY(x,y)=d2FXY(ξ,η)dξdη|x=ξy=η.
- Bezüglich der Verteilungsfunktion FXY(x,y) gelten folgende Grenzwerte:
- FXY(−∞, −∞)=0,FXY(x, +∞)=FX(x),FXY(+∞, y)=FY(y),FXY(+∞, +∞)=1.
- Im Grenzfall (unendlich große x und y) ergibt sich demnach für die "2D-VTF" der Wert 1. Daraus erhält man die Normierungsbedingung für die 2D-Wahrscheinlichkeitsdichtefunktion:
- ∫+∞−∞∫+∞−∞fXY(x,y)dxdy=1.
Fazit: Beachten Sie den signifikanten Unterschied zwischen eindimensionalen und zweidimensionalen Zufallsgrößen:
- Bei eindimensionalen Zufallsgrößen ergibt die Fläche unter der WDF stets den Wert 1.
- Bei zweidimensionalen Zufallsgrößen ist das WDF-Volumen immer gleich 1.
Versuchsdurchführung
- Wählen Sie zunächst die Nummer (1, ...) der zu bearbeitenden Aufgabe.
- Eine Aufgabenbeschreibung wird angezeigt. Die Parameterwerte sind angepasst.
- Lösung nach Drücken von "Musterlösung".
- Bei der Aufgabenbeschreibung verwenden wir ρ anstelle von ρXY.
- Für die "1D-WDF" gilt: fX(x)=√1/(2π⋅σ2X)⋅e−x2/(2⋅σ2X).
Die Nummer 0 entspricht einem "Reset":
- Gleiche Einstellung wie beim Programmstart.
- Ausgabe eines "Reset–Textes" mit weiteren Erläuterungen zum Applet.
(1) Machen Sie sich anhand der Voreinstellung (σX=1, σY=0.5, ρ=0.7) mit dem Programm vertraut. Interpretieren Sie die Grafiken für WDF und VTF.
- WDF ist ein Bergrücken mit dem Maximum bei x=0, y=0. Der Bergkamm ist leicht verdreht gegenüber der x–Achse.
- VTF ergibt sich aus WDF durch fortlaufende Integration in beide Richtungen. Das Maximum (nahezu 1) tritt bei x=3, y=3 auf.
(2) Nun lautet die Einstellung σX=σY=1, ρ=0. Welche Werte ergeben sich für fXY(0, 0) und FXY(0, 0)? Interpretieren Sie die Ergebnisse.
- Das WDF–Maximum ist fXY(0, 0)=1/(2π)=0.1592, wegen σX=σY=1, ρ=0. Die Höhenlinien sind Kreise.
- Für den VTF-Wert gilt: FXY(0, 0)=[Pr(X≤0)]⋅[Pr(Y≤0)]=0.25. Geringfügige Abweichung wegen numerischer Integration.
(3) Es gelten weiter die Einstellungen von (2). Welche Werte ergeben sich für fXY(0, 1) und FXY(0, 1)? Interpretieren Sie die Ergebnisse.
- Es gilt fXY(0, 1)=fX(0)⋅fY(1)=[√1/(2π)]⋅[√1/(2π)⋅e−0.5]=1/(2π)⋅e−0.5=0.0965.
- Das Programm liefert FXY(0, 1)=[Pr(X≤0)]⋅[Pr(Y≤1)]=0.4187, also einen größeren Wert als in (2), da weiter integriert wird.
(4) Die Einstellungen bleiben erhalten. Welche Werte ergeben sich für fXY(1, 0) und FXY(1, 0)? Interpretieren Sie die Ergebnisse.
- Aufgrund der Rotationssysmmetrie gleiche Ergebnisse wie in (3).
(5) Stimmt die Aussage: "Elliptische Höhenlinien gibt es nur für ρ≠0". Interpretieren Sie die 2D−WDF und 2D−VTF für σX=1, σY=0.5 und ρ=0.
- Nein! Auch für ρ=0 sind die Höhenlinien elliptisch (nicht kreisförmig), falls σX≠σY.
- Für σX≫σY hat die 2D−WDF die Form eines langgestreckten Bergkamms parallel zur x–Achse, für σX≪σY parallel zur y–Achse.
- Für σX≫σY ist der Anstieg der 2D−VTF in Richtung der y–Achse deutlich steiler als in Richtung der x–Achse.
(6) Variieren Sie ausgehend von σX=σY=1, ρ=0.7 den Korrelationskoeffizienten ρ. Wie groß ist der Neigungswinkel α der Ellipsen–Hauptachse?
- Für ρ>0 ist α=45∘ und für ρ<0 ist α=−45∘. Für ρ=0 sind die Höhenlinien kreisfömig und somit gibt es auch keine Ellipsen–Hauptachse.
(7) Variieren Sie ausgehend von σX=σY=1, ρ=0.7 den Korrelationskoeffizienten ρ>0. Wie groß ist der Neigungswinkel θ der Korrelationsgeraden K(x)?
- Für σX=σY ist θ=arctan (ρ). Die Steigung nimmt mit wachsendem ρ>0 zu. In allen Fällen gilt θ<α=45∘. Für ρ=0.7 ergibt sich θ=35∘.
(8) Variieren Sie ausgehend von σX=σY=0.75, ρ=0.7 die Parameter σY und ρ (>0). Welche Aussagen gelten für die Winkel α und θ?
- Für σY<σX ist α<45∘ und für σY>σX dagegen α>45∘.
- Bei allen Einstellungen gilt: Die Korrelationsgerade liegt unter der Ellipsen–Hauptachse.
(9) Gehen Sie von σX=1, σY=0.75, ρ=0.7 aus und variieren Sie ρ. Wie könnte man die Korrelationsgerade aus den Höhenlinien konstruieren?
- Die Korrelationsgerade schneidet alle Höhenlinien an den Punkten, an denen die Tangente zu der Höhenlinie senkrecht verläuft.
(10) Nun gelte σX=σY=1, ρ=0.95. Interpretieren Sie die 2D−WDF. Welche Aussagen würden für den Grenzfall ρ→1 zutreffen?
- Die 2D−WDF hat nur Anteile in der Nähe der Ellipsen–Hauptachse. Die Korrelationsgerade liegt nur knapp darunter: α=45∘, θ=43.5∘.
- Im Grenzfall ρ→1 wäre θ=α=45∘. Außerhalb der Korrelationsgeraden hätte die 2D−WDF keine Anteile. Das heißt:
- Längs der Korrelationsgeraden ergäbe sich eine Diracwand ⇒ Alle Werte sind unendlich groß, trotzdem um den Mittelwert gaußisch gewichtet.
Zur Handhabung des Applets
(A) Parametereingabe per Slider: σX, σY und ρ
(B) Auswahl: Darstellung von WDF oder VTF
(C) Reset: Einstellung wie beim Programmstart
(D) Höhenlinien darstellen anstelle von "1D-WDF"
(E) Darstellungsbereich für "2D-WDF"
(F) Manipulation der 3D-Grafik (Zoom, Drehen, ...)
(G) Darstellungsbereich für "1D-WDF" bzw. "Höhenlinien"
(H) Manipulation der 2D-Grafik ("1D-WDF")
( I ) Bereich für die Versuchsdurchführung: Aufgabenauswahl
(J) Bereich für die Versuchsdurchführung: Aufgabenstellung
(K) Bereich für die Versuchsdurchführung: Musterlösung einblenden
( L) Bereich für die Versuchsdurchführung: Musterlösung
Werte–Ausgabe über Maussteuerung (sowohl bei 2D als auch bei 3D)
Über die Autoren
Dieses interaktive Berechnungstool wurde am Lehrstuhl für Nachrichtentechnik der Technischen Universität München konzipiert und realisiert.
- Die erste Version wurde 2003 von Ji Li im Rahmen ihrer Diplomarbeit mit "FlashMX–Actionscript" erstellt (Betreuer: Günter Söder).
- 2019 wurde das Programm von Carolin Mirschina im Rahmen einer Werkstudententätigkeit auf "HTML5" umgesetzt und neu gestaltet (Betreuer: Tasnád Kernetzky).
Die Umsetzung dieses Applets auf HTML 5 wurde durch Studienzuschüsse der Fakultät EI der TU München finanziell unterstützt. Wir bedanken uns.