Difference between revisions of "Applets:Two-dimensional Gaussian Random Variables"

From LNTwww
Line 3: Line 3:
 
==Programmbeschreibung==
 
==Programmbeschreibung==
 
<br>
 
<br>
Dieses Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen&nbsp; $XY$, gekennzeichet durch die Standardabweichungen (Streuungen)&nbsp; $\sigma_X$&nbsp; und&nbsp; $\sigma_Y$&nbsp; sowie den Korrelationskoeffizienten&nbsp; $\rho_{XY}$. Die Komponenten werden als mittelwertfrei vorausgesetzt:&nbsp; $m_X = m_X = 0$.
+
Das Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen&nbsp; $XY\hspace{-0.1cm}$, gekennzeichet durch die Standardabweichungen (Streuungen)&nbsp; $\sigma_X$&nbsp; und&nbsp; $\sigma_Y$&nbsp; ihrer beiden Komponenten sowie den Korrelationskoeffizienten&nbsp; $\rho_{XY}$&nbsp;zwischen diesen. Die Komponenten werden als mittelwertfrei vorausgesetzt:&nbsp; $m_X = m_Y = 0$.
  
 
Das Applet zeigt
 
Das Applet zeigt
* die zweidimensionale Wahrscheinlichkeitsdichtefunktion &nbsp;$\rm (2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF)$&nbsp; $f_{XY}(x, \hspace{0.1cm}y)$&nbsp; in dreidimensioanaler Darstellung sowie deren Höhenlinien,
+
* die zweidimensionale Wahrscheinlichkeitsdichtefunktion &nbsp; &rArr; &nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$&nbsp; $f_{XY}(x, \hspace{0.1cm}y)$&nbsp; in dreidimensioanaler Darstellung sowie in Form von Höhenlinien,
* die zweidimensionale Verteilungsfunktion &nbsp;$\rm (2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF)$&nbsp; $F_{XY}(x, \hspace{0.1cm}y)$&nbsp; als 3D-Plot.
+
* die zweidimensionale Verteilungsfunktion &nbsp; &rArr; &nbsp; $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$&nbsp; $F_{XY}(x, \hspace{0.1cm}y)$&nbsp; als 3D-Plot.
 +
 
 +
 
 +
Das Applet verwendet das Framework &nbsp;[https://en.wikipedia.org/wiki/Plotly Plot.ly]
 
    
 
    
  

Revision as of 10:11, 29 July 2019

Open Applet in a new tab

Programmbeschreibung


Das Applet verdeutlicht die Eigenschaften zweidimensionaler Gaußscher Zufallsgrößen  $XY\hspace{-0.1cm}$, gekennzeichet durch die Standardabweichungen (Streuungen)  $\sigma_X$  und  $\sigma_Y$  ihrer beiden Komponenten sowie den Korrelationskoeffizienten  $\rho_{XY}$ zwischen diesen. Die Komponenten werden als mittelwertfrei vorausgesetzt:  $m_X = m_Y = 0$.

Das Applet zeigt

  • die zweidimensionale Wahrscheinlichkeitsdichtefunktion   ⇒   $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}WDF$  $f_{XY}(x, \hspace{0.1cm}y)$  in dreidimensioanaler Darstellung sowie in Form von Höhenlinien,
  • die zweidimensionale Verteilungsfunktion   ⇒   $\rm 2D\hspace{-0.1cm}-\hspace{-0.1cm}VTF$  $F_{XY}(x, \hspace{0.1cm}y)$  als 3D-Plot.


Das Applet verwendet das Framework  Plot.ly


Theoretischer Hintergrund


Verbundwahrscheinlichkeitsdichtefunktion   ⇒   2D–WDF

Wir betrachten zwei wertkontinuierliche Zufallsgrößen  $X$  und  $Y\hspace{-0.1cm}$, zwischen denen statistische Abhängigkeiten bestehen können. Zur Beschreibung der Wechselbeziehungen zwischen diesen Größen ist es zweckmäßig, die beiden Komponenten zu einer  zweidimensionalen Zufallsgröße  $XY =(X, Y)$  zusammenzufassen. Dann gilt:

$\text{Definition:}$  Die  Verbundwahrscheinlichkeitsdichtefunktion  ist die Wahrscheinlichkeitsdichtefunktion (WDF,  englisch:  Probability Density Function, kurz: PDF) der zweidimensionalen Zufallsgröße  $XY$  an der Stelle  $(x, y)$ 

$$f_{XY}(x, \hspace{0.1cm}y) = \lim_{\left.{\Delta x\rightarrow 0 \atop {\Delta y\rightarrow 0} }\right.}\frac{ {\rm Pr}\big [ (x - {\rm \Delta} x/{\rm 2} \le X \le x + {\rm \Delta} x/{\rm 2}) \cap (y - {\rm \Delta} y/{\rm 2} \le Y \le y +{\rm \Delta}y/{\rm 2}) \big] }{ {\rm \Delta} \ x\cdot{\rm \Delta} y}.$$
  • Die Verbundwahrscheinlichkeitsdichtefunktion oder kurz  $\text{2D-WDF}$  ist eine Erweiterung der eindimensionalen WDF.
  • $∩$  kennzeichnet die logische UND-Verknüpfung.
  • $X$  und  $Y$ bezeichnen die beiden Zufallsgrößen, und  $x \in X$  sowie   $y \in Y$ geben Realisierungen hiervon an.
  • Die für dieses Applet verwendete Nomenklatur unterscheidet sich also geringfügig gegenüber der Beschreibung im Theorieteil.


Anhand dieser 2D–WDF  $f_{XY}(x, y)$  werden auch statistische Abhängigkeiten innerhalb der zweidimensionalen Zufallsgröße  $XY$  vollständig erfasst im Gegensatz zu den beiden eindimensionalen Dichtefunktionen   ⇒   Randwahrscheinlichkeitsdichtefunktionen:

$$f_{X}(x) = \int _{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}y ,$$
$$f_{Y}(y) = \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x .$$

Diese beiden Randdichtefunktionen  $f_X(x)$  und  $f_Y(y)$

  • liefern lediglich statistische Aussagen über die Einzelkomponenten  $X$  bzw.  $Y$,
  • nicht jedoch über die Bindungen zwischen diesen.



2D–WDF bei Gaußschen Zufallsgrößen

Für den Sonderfall  Gaußscher Zufallsgrößen  – der Name geht auf den Wissenschaftler  Carl Friedrich Gauß  zurück – können wir weiterhin vermerken:

  • Die Verbund–WDF einer Gaußschen 2D-Zufallsgröße  $XY$  mit Mittelwerten  $m_X = 0$,  $m_Y = 0$  und Korrelationskoeffizienten  $ρ = ρ_{XY}$  lautet:
$$f_{XY}(x,y)=\frac{\rm 1}{\rm 2\it\pi \cdot \sigma_X \cdot \sigma_Y \cdot \sqrt{\rm 1-\rho^2}}\ \cdot\ \exp\Bigg[-\frac{\rm 1}{\rm 2 \cdot (1-\it\rho^{\rm 2} {\rm)}}\cdot(\frac {\it x^{\rm 2}}{\sigma_X^{\rm 2}}+\frac {\it y^{\rm 2}}{\sigma_Y^{\rm 2}}-\rm 2\it\rho\cdot\frac{x \cdot y}{\sigma_x \cdot \sigma_Y}\rm ) \rm \Bigg]\hspace{0.8cm}{\rm mit}\hspace{0.5cm}-1 \le \rho \le +1.$$
  • Ersetzt man  $x$  durch  $(x - m_X)$  sowie  $y$  durch  $(y- m_Y)$, so ergibt sich die allgemeinere WDF einer zweidimensionalen Gaußschen Zufallsgröße mit Mittelwert.
  • Die Randwahrscheinlichkeitsdichtefunktionen  $f_{X}(x)$  und  $f_{Y}(y)$  einer Gaußschen 2D-Zufallsgröße sind ebenfalls gaußförmig mit den Streuungen  $σ_X$  bzw.  $σ_Y$.
  • Bei unkorrelierten Komponenten  $X$  und  $Y$ muss in obiger Gleichung  $ρ = 0$  eingesetzt werden, und man erhält dann das Ergebnis:
$$f_{XY}(x,y)=\frac{1}{\sqrt{2\pi}\cdot\sigma_{X}} \cdot\rm e^{-\it {x^{\rm 2}}\hspace{-0.08cm}/{\rm (}{\rm 2\hspace{0.05cm}\it\sigma_{X}^{\rm 2}} {\rm )}} \cdot\frac{1}{\sqrt{2\pi}\cdot\sigma_{\it Y}}\cdot e^{-\it {y^{\rm 2}}\hspace{-0.08cm}/{\rm (}{\rm 2\hspace{0.05cm}\it\sigma_{Y}^{\rm 2}} {\rm )}} = \it f_{X} \rm ( \it x \rm ) \cdot \it f_{Y} \rm ( \it y \rm ) .$$

$\text{Fazit:}$  Im Sonderfall einer 2D-Zufallsgröße mit Gaußscher WDF  $f_{XY}(x, y)$  folgt aus der  Unkorreliertheit  auch direkt die  statistische Unabhängigkeit:

$$f_{XY}(x,y)= f_{X}(x) \cdot f_{Y}(y) . $$

Bitte beachten Sie:

  • Bei keiner anderen WDF kann aus der  Unkorreliertheit  auf die  statistische Unabhängigkeit  geschlossen werden.
  • Man kann aber stets   ⇒   für jede beliebige 2D–WDF  $f_{XY}(x, y)$  von der  statistischen Unabhängigkeit  auf die  Unkorreliertheit  schließen, weil:
  • Sind zwei Zufallsgrößen  $X$  und  $Y$  völlig voneinander (statistisch) unabhängig, so gibt es zwischen ihnen natürlich auch keine linearen  Abhängigkeiten  
    ⇒   sie sind dann auch unkorreliert.




Höhenlinien bei unkorrelierten Zufallsgrößen

rechts

Aus der Bedingungsgleichung  $f_{XY}(x, y) = {\rm const.}$  können die Höhenlinien der WDF berechnet werden.

Sind die Komponenten  $X$  und  $Y$ unkorreliert  $(ρ = 0)$, so erhält man als Gleichung für die Höhenlinien:

$$\frac{x^{\rm 2}}{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2}}{\sigma_{Y}^{\rm 2}} =\rm const.$$

Die Höhenlinien beschreiben in diesem Fall folgende Figuren:

  • Kreise  (falls  $σ_X = σ_Y$,   grüne Kurve), oder
  • Ellipsen  (für  $σ_X ≠ σ_Y$,   blaue Kurve) in Ausrichtung der beiden Achsen.


Höhenlinien bei korrelierten Zufallsgrößen

Bei korrelierten Komponenten  $(ρ ≠ 0)$  sind die Höhenlinien der WDF (fast) immer elliptisch, also auch für den Sonderfall  $σ_X = σ_Y$. Ausnahme:  $(ρ=\pm 1)$   ⇒   Diracwand; siehe  Aufgabe 4.4  im Buch „Stochastische Signaltheorie”, Teilaufgabe  (5).

Höhenlinien der 2D-WDF bei korrelierten Größen

Hier lautet die Bestimmungsgleichung der WDF-Höhenlinien:

$$f_{XY}(x, y) = {\rm const.} \hspace{0.5cm} \Rightarrow \hspace{0.5cm} \frac{x^{\rm 2} }{\sigma_{X}^{\rm 2}}+\frac{y^{\rm 2} }{\sigma_{Y}^{\rm 2} }-{\rm 2}\cdot\rho\cdot\frac{x\cdot y}{\sigma_X\cdot \sigma_Y}={\rm const.}$$

Die Grafik zeigt in hellerem Blau zwei Höhenlinien für unterschiedliche Parametersätze, jeweils mit  $ρ ≠ 0$.

  • Die Ellipsenhauptachse ist dunkelblau gestrichelt.
  • Die  Korrelationsgerade  $K(x)$  ist durchgehend rot eingezeichnet.


Anhand dieser Darstellung sind folgende Aussagen möglich:

  • Die Ellipsenform hängt außer vom Korrelationskoeffizienten  $ρ$  auch vom Verhältnis der beiden Streuungen  $σ_X$  und  $σ_Y$  ab.
  • Der Neigungswinkel  $α$  der Ellipsenhauptachse (gestrichelte Gerade) gegenüber der  $x$–Achse hängt ebenfalls von  $σ_X$,  $σ_Y$  und  $ρ$  ab:
$$\alpha = {1}/{2} \cdot {\rm arctan } \big ( 2 \cdot \rho \cdot \frac {\sigma_X \cdot \sigma_Y}{\sigma_X^2 - \sigma_Y^2} \big ).$$
  • Die (rote) Korrelationsgerade  $y = K(x)$  einer Gaußschen 2D–Zufallsgröße liegt stets unterhalb der (blau gestrichelten) Ellipsenhauptachse.
  • $K(x)$  kann aus dem Schnittpunkt der Höhenlinien und ihrer vertikalen Tangenten geometrisch konstruiert werden, wie in der Skizze in grüner Farbe angedeutet.



Zweidimensionale Verteilungsfunktion   ⇒   2D–VTF

$\text{Definition:}$  Die  2D-Verteilungsfunktion  ist ebenso wie die 2D-WDF lediglich eine sinnvolle Erweiterung der  eindimensionalen Verteilungsfunktion  (VTF):

$$F_{XY}(x,y) = {\rm Pr}\big [(X \le x) \cap (Y \le y) \big ] .$$


Es ergeben sich folgende Gemeinsamkeiten und Unterschiede zwischen der 1D-VTF und der 2D-VTF:

  • Der Funktionalzusammenhang zwischen 2D–WDF und 2D–VTF ist wie im eindimensionalen Fall durch die Integration gegeben, aber nun in zwei Dimensionen. Bei kontinuierlichen Zufallsgrößen gilt:
$$F_{XY}(x,y)=\int_{-\infty}^{y} \int_{-\infty}^{x} f_{XY}(\xi,\eta) \,\,{\rm d}\xi \,\, {\rm d}\eta .$$
  • Umgekehrt lässt sich die Wahrscheinlichkeitsdichtefunktion aus der Verteilungsfunktion durch partielle Differentiation nach  $x$  und  $y$  angeben: Stimmt das?
$$f_{XY}(x,y)=\frac{{\rm d}^{\rm 2} F_{XY}(\xi,\eta)}{{\rm d} \xi \,\, {\rm d} \eta}\Bigg|_{\left.{x=\xi \atop {y=\eta}}\right.}.$$
  • Bezüglich der Verteilungsfunktion  $F_{XY}(x, y)$  gelten folgende Grenzwerte:
$$F_{XY}(-\infty,-\infty) = 0,\hspace{0.5cm}F_{XY}(x,+\infty)=F_{X}(x ),\hspace{0.5cm} F_{XY}(+\infty,y)=F_{Y}(y ) ,\hspace{0.5cm}F_{XY}+\infty,+\infty) = 1.$$
  • Im Grenzfall $($unendlich große  $x$  und  $y)$  ergibt sich demnach für die 2D-VTF der Wert  $1$. Daraus erhält man die  Normierungsbedingung  für die 2D-Wahrscheinlichkeitsdichtefunktion:
$$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f_{XY}(x,y) \,\,{\rm d}x \,\,{\rm d}y=1 . $$

$\text{Fazit:}$  Beachten Sie den signifikanten Unterschied zwischen eindimensionalen und zweidimensionalen Zufallsgrößen:

  • Bei eindimensionalen Zufallsgrößen ergibt die Fläche unter der WDF stets den Wert $1$.
  • Bei zweidimensionalen Zufallsgrößen ist das WDF-Volumen immer gleich $1$.



Ab hier: Vorratslager

Erwartungswerte zweidimensionaler Zufallsgrößen

Ein Sonderfall der statistischen Abhängigkeit ist die Korrelation.

$\text{Definition:}$  Unter Korrelation versteht man eine lineare Abhängigkeit  zwischen den Einzelkomponenten $x$ und $y$.

  • Korrelierte Zufallsgrößen sind damit stets auch statistisch abhängig.
  • Aber nicht jede statistische Abhängigkeit bedeutet gleichzeitig eine Korrelation.


Zur quantitativen Erfassung der Korrelation verwendet man verschiedene Erwartungswerte der 2D-Zufallsgröße $(x, y)$.

Diese sind analog definiert zum eindimensionalen Fall

  • gemäß Kapitel 2 (bei wertdiskreten Zufallsgrößen)
  • bzw. Kapitel 3 (bei wertkontinuierlichen Zufallsgrößen):


$\text{Definition:}$  Für die (nichtzentrierten) Momente gilt die Beziehung:

$$m_{kl}={\rm E}\big[x^k\cdot y^l\big]=\int_{-\infty}^{+\infty}\hspace{0.2cm}\int_{-\infty}^{+\infty} x\hspace{0.05cm}^{k} \cdot y\hspace{0.05cm}^{l} \cdot f_{xy}(x,y) \, {\rm d}x\, {\rm d}y.$$

Die beiden linearen Mittelwerte sind somit $m_x = m_{10}$ und $m_y = m_{01}.$


$\text{Definition:}$  Die auf $m_x$ bzw. $m_y$ bezogenen Zentralmomente lauten:

$$\mu_{kl} = {\rm E}\big[(x-m_{x})\hspace{0.05cm}^k \cdot (y-m_{y})\hspace{0.05cm}^l\big] .$$

In dieser allgemein gültigen Definitionsgleichung sind die Varianzen $σ_x^2$ und $σ_y^2$ der zwei Einzelkomponenten durch $\mu_{20}$ bzw. $\mu_{02}$ mit enthalten.


$\text{Definition:}$  Besondere Bedeutung besitzt die Kovarianz $(k = l = 1)$, die ein Maß für die lineare statistische Abhängigkeit zwischen den Zufallsgrößen $x$ und $y$ ist:

$$\mu_{11} = {\rm E}\big[(x-m_{x})\cdot(y-m_{y})\big] = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} (x-m_{x}) (y-m_{y})\cdot f_{xy}(x,y) \,{\rm d}x \, {\rm d}y .$$


Im Folgenden bezeichnen wir die Kovarianz $\mu_{11}$ teilweise auch mit $\mu_{xy}$, falls sich die Kovarianz auf die Zufallsgrößen $x$ und $y$ bezieht. Die Kovarianz hängt wie folgt mit dem nichtzentrierten Moment $m_{11} = m_{xy} = {\rm E}\big[x · y\big]$ zusammen:

$$\mu_{xy} = m_{xy} -m_{x }\cdot m_{y}.$$

Anmerkung:

  • Diese Gleichung ist für die numerische Auswertung enorm vorteilhaft, da $m_{xy}$, $m_x$ und $m_y$ aus den Folgen $〈x_v〉$ und $〈y_v〉$ in einem Durchlauf gefunden werden können.
  • Würde man dagegen die Kovarianz $\mu_{xy}$ entsprechend der oberen Definitionsgleichung berechnen, so müsste man in einem ersten Durchlauf die Mittelwerte $m_x$ und $m_y$ ermitteln und dann in einem zweiten Durchlauf den Erwartungswert ${\rm E}\big[(x - m_x) · (y - m_y)\big]$.


$\text{Beispiel 4:}$  In den beiden ersten Zeilen der folgenden Tabelle sind die jeweils ersten Elemente zweier Zufallsfolgen $〈x_ν〉$ und $〈y_ν〉$ eingetragen. In der letzten Zeile sind die jeweiligen Produkte $x_ν · y_ν$ angegeben.

Beispielhafte 2D-Erwartungswerte

Die Tabelle zeigt folgenden Sachverhalt:

  • Durch Mittelung über die jeweils zehn Folgenelemente erhält man $m_x =0.5$, $m_y = 1$ und $m_{xy} = 0.69$.
  • Daraus ergibt sich die Kovarianz zu $\mu_{xy} = 0.69 - 0.5 · 1 = 0.19.$
  • Ohne Kenntnis der Gleichung $\mu_{xy} = m_{xy} - m_x · m_y$ hätte man zunächst im ersten Durchlauf die Mittelwerte $m_x$ und $m_y$ ermitteln müssen, um im zweiten Durchlauf die Kovarianz $\mu_{xy}$ als Erwartungswert des Produkts der mittelwertfreien Größen bestimmen zu können.

Korrelationskoeffizient

Man spricht von „vollständiger Korrelation”, wenn die (deterministische) Abhängigkeit zwischen  $X$  und  $Y$  durch die Gleichung  $y = K · x$  ausgedrückt wird. Dann ergibt sich für die Kovarianz:

  • $\mu_{XY} = σ_X · σ_Y$  bei positivem Wert von  $K$,
  • $\mu_{XY} = -σ_X · σ_Y$  bei negativem  $K$–Wert.


Deshalb verwendet man häufig als Beschreibungsgröße anstelle der Kovarianz den so genannten Korrelationskoeffizienten.

$\text{Definition:}$  Der  Korrelationskoeffizient  ist der Quotient aus Kovarianz  $\mu_{XY}$  und dem Produkt der Effektivwerte  $σ_X$  und $σ_Y$ der beiden Komponenten:

$$\rho_{XY}=\frac{\mu_{XY} }{\sigma_X \cdot \sigma_Y}.$$


Der Korrelationskoeffizient $\rho_{xy}$ weist folgende Eigenschaften auf:

  • Aufgrund der Normierung gilt stets $-1 \le ρ_{xy} ≤ +1$.
  • Sind die beiden Zufallsgrößen $x$ und $y$ unkorreliert, so ist $ρ_{xy} = 0$.
  • Bei strenger linearer Abhängigkeit zwischen $x$ und $y$ ist $ρ_{xy}= ±1$   ⇒   vollständige Korrelation.
  • Ein positiver Korrelationskoeffizient bedeutet, dass bei größerem $x$–Wert im statistischen Mittel auch $y$  größer ist als bei kleinerem $x$.
  • Dagegen drückt ein negativer Korrelationskoeffizient aus, dass $y$  mit steigendem $x$ im Mittel kleiner wird.


Gaußsche 2D-WDF mit Korrelation

$\text{Beispiel 5:}$  Es gelten folgende Voraussetzungen:

  • Die betrachteten Komponenten $x$ und $y$ besitzen jeweils eine gaußförmige WDF.
  • Die beiden Streuungen sind unterschiedlich $(σ_y < σ_x)$.
  • Der Korrelationskoeffizient beträgt $ρ_{xy} = 0.8$.


Im Unterschied zum Beispiel 2 mit statistisch unabhängigen Komponenten   ⇒   $ρ_{xy} = 0$ (trotz $σ_y < σ_x$) erkennt man, dass hier bei größerem $x$–Wert im statistischen Mittel auch $y$ größer ist als bei kleinerem $x$.


Korrelationsgerade


Gaußsche 2D-WDF mit Korrelationsgerade

$\text{Definition:}$  Als Korrelationsgerade bezeichnet man die Gerade $y = K(x)$ in der $(x, y)$–Ebene durch den „Mittelpunkt” $(m_x, m_y)$. Manchmal wird diese Gerade auch Regressionsgerade genannt.

Die Korrelationsgerade besitzt folgende Eigenschaften:

  • Die mittlere quadratische Abweichung von dieser Geraden – in $y$–Richtung betrachtet und über alle $N$ Punkte gemittelt – ist minimal:
$$\overline{\varepsilon_y^{\rm 2} }=\frac{\rm 1}{N} \cdot \sum_{\nu=\rm 1}^{N}\; \;\big [y_\nu - K(x_{\nu})\big ]^{\rm 2}={\rm Minimum}.$$
  • Die Korrelationsgerade kann als eine Art „statistische Symmetrieachse“ interpretiert werden. Die Geradengleichung lautet:
$$y=K(x)=\frac{\sigma_y}{\sigma_x}\cdot\rho_{xy}\cdot(x - m_x)+m_y.$$


Der Winkel, den die Korrelationsgerade zur $x$–Achse einnimmt, beträgt:

$$\theta_{y\hspace{0.05cm}\rightarrow \hspace{0.05cm}x}={\rm arctan}(\frac{\sigma_{y} }{\sigma_{x} }\cdot \rho_{xy}).$$

Durch diese Nomenklatur soll deutlich gemacht werden, dass es sich hier um die Regression von $y$ auf $x$ handelt.

  • Die Regression in Gegenrichtung – also von $x$ auf $y$ – bedeutet dagegen die Minimierung der mittleren quadratischen Abweichung in $x$–Richtung.
  • Das interaktive Applet Korrelationskoeffizient und Regressionsgerade verdeutlicht, dass sich im Allgemeinen (falls $σ_y \ne σ_x$) für die Regression von $x$ auf $y$ ein anderer Winkel und damit auch eine andere Regressionsgerade ergeben wird:
$$\theta_{x\hspace{0.05cm}\rightarrow \hspace{0.05cm} y}={\rm arctan}(\frac{\sigma_{x}}{\sigma_{y}}\cdot \rho_{xy}).$$








Versuchsdurchführung

Exercises binomial fertig.png
  • Wählen Sie zunächst die Nummer 1 ... 6 der zu bearbeitenden Aufgabe.
  • Eine Aufgabenbeschreibung wird angezeigt. Die Parameterwerte sind angepasst.
  • Lösung nach Drücken von „Hide solution”.
  • Aufgabenstellung und Lösung in Englisch.


Die Nummer 0 entspricht einem „Reset”:

  • Gleiche Einstellung wie beim Programmstart.
  • Ausgabe eines „Reset–Textes” mit weiteren Erläuterungen zum Applet.


In der folgenden Beschreibung bedeutet

  • Blau:   Verteilungsfunktion 1 (im Applet blau markiert),
  • Rot:     Verteilungsfunktion 2 (im Applet rot markiert).


(1)  Setzen Sie Blau: Binomialverteilung $(I=5, \ p=0.4)$ und Rot: Binomialverteilung $(I=10, \ p=0.2)$.

Wie lauten die Wahrscheinlichkeiten ${\rm Pr}(z=0)$ und ${\rm Pr}(z=1)$?


$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Blau: }{\rm Pr}(z=0)=0.6^5=7.78\%, \hspace{0.3cm}{\rm Pr}(z=1)=0.4 \cdot 0.6^4=25.92\%;$

$\hspace{1.85cm}\text{Rot: }{\rm Pr}(z=0)=0.8^10=10.74\%, \hspace{0.3cm}{\rm Pr}(z=1)=0.2 \cdot 0.8^9=26.84\%.$

(2)  Es gelten weiter die Einstellungen von (1). Wie groß sind die Wahrscheinlichkeiten ${\rm Pr}(3 \le z \le 5)$?


$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Es gilt }{\rm Pr}(3 \le z \le 5) = {\rm Pr}(z=3) + {\rm Pr}(z=4) + {\rm Pr}(z=5)\text{, oder } {\rm Pr}(3 \le z \le 5) = {\rm Pr}(z \le 5) - {\rm Pr}(z \le 2)$.

$\hspace{1.85cm}\text{Blau: }{\rm Pr}(3 \le z \le 5) = 0.2304+ 0.0768 + 0.0102 =1 - 0.6826 = 0.3174;$

$\hspace{1.85cm}\text{Rot: }{\rm Pr}(3 \le z \le 5) = 0.2013 + 0.0881 + 0.0264 = 0.9936 - 0.6778 = 0.3158.$

(3)  Es gelten weiter die Einstellungen von (1). Wie unterscheiden sich der Mittelwert $m_1$ und die Streuung $\sigma$ der beiden Binomialverteilungen?


$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Mittelwert:}\hspace{0.2cm}m_\text{1} = I \cdot p\hspace{0.3cm} \Rightarrow\hspace{0.3cm} m_\text{1, Blau} = 5 \cdot 0.4\underline{ = 2 =} \ m_\text{1, Rot} = 10 \cdot 0.2; $

$\hspace{1.85cm}\text{Streuung:}\hspace{0.4cm}\sigma = \sqrt{I \cdot p \cdot (1-p)} = \sqrt{m_1 \cdot (1-p)}\hspace{0.3cm}\Rightarrow\hspace{0.3cm} \sigma_{\rm Blau} = \sqrt{2 \cdot 0.6} =1.095 < \sigma_{\rm Rot} = \sqrt{2 \cdot 0.8} = 1.265.$

(4)  Setzen Sie Blau: Binomialverteilung $(I=15, p=0.3)$ und Rot: Poissonverteilung $(\lambda=4.5)$.

Welche Unterschiede ergeben sich zwischen beiden Verteilungen hinsichtlich Mittelwert $m_1$ und Varianz $\sigma^2$?


$\hspace{1.0cm}\Rightarrow\hspace{0.3cm}\text{Beide Verteilungern haben gleichen Mittelwert:}\hspace{0.2cm}m_\text{1, Blau} = I \cdot p\ = 15 \cdot 0.3\hspace{0.15cm}\underline{ = 4.5 =} \ m_\text{1, Rot} = \lambda$;

$\hspace{1.85cm} \text{Binomialverteilung: }\hspace{0.2cm} \sigma_\text{Blau}^2 = m_\text{1, Blau} \cdot (1-p)\hspace{0.15cm}\underline { = 3.15} \le \text{Poissonverteilung: }\hspace{0.2cm} \sigma_\text{Rot}^2 = \lambda\hspace{0.15cm}\underline { = 4.5}$;

(5)  Es gelten die Einstellungen von (4). Wie groß sind die Wahrscheinlichkeiten ${\rm Pr}(z \gt 10)$ und ${\rm Pr}(z \gt 15)$?


$\hspace{1.0cm}\Rightarrow\hspace{0.3cm} \text{Binomial: }\hspace{0.2cm} {\rm Pr}(z \gt 10) = 1 - {\rm Pr}(z \le 10) = 1 - 0.9993 = 0.0007;\hspace{0.3cm} {\rm Pr}(z \gt 15) = 0 \ {\rm (exakt)}$.

$\hspace{1.85cm}\text{Poisson: }\hspace{0.2cm} {\rm Pr}(z \gt 10) = 1 - 0.9933 = 0.0067;\hspace{0.3cm}{\rm Pr}(z \gt 15) \gt 0 \ ( \approx 0)$

$\hspace{1.85cm} \text{Näherung: }\hspace{0.2cm}{\rm Pr}(z \gt 15) \ge {\rm Pr}(z = 16) = \lambda^{16}/{16!}\approx 2 \cdot 10^{-22}$.

(6)  Es gelten weiter die Einstellungen von (4). Mit welchen Parametern ergeben sich symmetrische Verteilungen um $m_1$?


$\hspace{1.0cm}\Rightarrow\hspace{0.3cm} \text{Binomialverung mit }p = 0.5\text{: }p_\mu = {\rm Pr}(z = \mu)\text{ symmetrisch um } m_1 = I/2 = 7.5 \ ⇒ \ p_μ = p_{I–μ}\ ⇒ \ p_8 = p_7, \ p_9 = p_6, \text{usw.}$

$\hspace{1.85cm}\text{Die Poissonverteilung wird dagegen nie symmetrisch, da sie sich bis ins Unendliche erstreckt!}$

Zur Handhabung des Applets

Handhabung binomial.png

    (A)     Vorauswahl für blauen Parametersatz

    (B)     Parametereingabe $I$ und $p$ per Slider

    (C)     Vorauswahl für roten Parametersatz

    (D)     Parametereingabe $\lambda$ per Slider

    (E)     Graphische Darstellung der Verteilungen

    (F)     Momentenausgabe für blauen Parametersatz

    (G)     Momentenausgabe für roten Parametersatz

    (H)     Variation der grafischen Darstellung


$\hspace{1.5cm}$„$+$” (Vergrößern),

$\hspace{1.5cm}$ „$-$” (Verkleinern)

$\hspace{1.5cm}$ „$\rm o$” (Zurücksetzen)

$\hspace{1.5cm}$ „$\leftarrow$” (Verschieben nach links), usw.

    ( I )     Ausgabe von ${\rm Pr} (z = \mu)$ und ${\rm Pr} (z \le \mu)$

    (J)     Bereich für die Versuchsdurchführung

Andere Möglichkeiten zur Variation der grafischen Darstellung:

  • Gedrückte Shifttaste und Scrollen: Zoomen im Koordinatensystem,
  • Gedrückte Shifttaste und linke Maustaste: Verschieben des Koordinatensystems.

Über die Autoren

Dieses interaktive Berechnungstool wurde am Lehrstuhl für Nachrichtentechnik der Technischen Universität München konzipiert und realisiert.

  • Die erste Version wurde 2003 von Ji Li im Rahmen ihrer Diplomarbeit mit „FlashMX–Actionscript” erstellt (Betreuer: Günter Söder).
  • 2018 wurde das Programm von Jimmy He (Bachelorarbeit, Betreuer: Tasnád Kernetzky ) auf „HTML5” umgesetzt und neu gestaltet.

Nochmalige Aufrufmöglichkeit des Applets in neuem Fenster

Open Applet in a new tab