Difference between revisions of "Aufgaben:Exercise 4.16: Eigenvalues and Eigenvectors"
Line 9: | Line 9: | ||
Die Zufallsgrößen $\mathbf{y}$ und $\mathbf{z}$ geben zwei Spezialfälle von $\mathbf{x}$ an, deren Prozessparameter aus den Korrelationsmatrix $\mathbf{K_y}$ bzw. $\mathbf{K_z}$ bestimmt werden können. | Die Zufallsgrößen $\mathbf{y}$ und $\mathbf{z}$ geben zwei Spezialfälle von $\mathbf{x}$ an, deren Prozessparameter aus den Korrelationsmatrix $\mathbf{K_y}$ bzw. $\mathbf{K_z}$ bestimmt werden können. | ||
+ | |||
+ | |||
Line 79: | Line 81: | ||
{{ML-Kopf}} | {{ML-Kopf}} | ||
'''(1)''' Richtig sind <u>die Lösungsvorschläge 1 und 2</u>: | '''(1)''' Richtig sind <u>die Lösungsvorschläge 1 und 2</u>: | ||
− | *$\mathbf{K_y}$ ist tatsächlich die allgemeinste | + | *$\mathbf{K_y}$ ist tatsächlich die allgemeinste Korrelationsmatrix einer 2D-Zufallsgröße mit $\sigma_1 = \sigma_2 = \sigma$. |
*Der Parameter $\rho$ gibt den Korrelationskoeffizienten an. Dieser kann alle Werte zwischen $\pm 1$ inclusive dieser Randwerte annehmen. | *Der Parameter $\rho$ gibt den Korrelationskoeffizienten an. Dieser kann alle Werte zwischen $\pm 1$ inclusive dieser Randwerte annehmen. | ||
Line 90: | Line 92: | ||
(1- \lambda)^2 = 0\hspace{0.3cm}\Rightarrow | (1- \lambda)^2 = 0\hspace{0.3cm}\Rightarrow | ||
\hspace{0.3cm} \hspace{0.15cm}\underline{\lambda_{1/2} =1}.$$ | \hspace{0.3cm} \hspace{0.15cm}\underline{\lambda_{1/2} =1}.$$ | ||
+ | |||
'''(3)''' Bei positivem $\rho$ lautet die Bestimmungsgleichung der Eigenwerte: | '''(3)''' Bei positivem $\rho$ lautet die Bestimmungsgleichung der Eigenwerte: | ||
− | :$$(1- \lambda)^2 -\rho^2 = 0\hspace{0. | + | :$$(1- \lambda)^2 -\rho^2 = 0\hspace{0.5cm}\Rightarrow |
− | \hspace{0. | + | \hspace{0.5cm}\lambda^2 - 2\lambda + 1 - \rho^2 = |
− | 0\hspace{0. | + | 0\hspace{0.5cm}\Rightarrow\hspace{0.5cm}\lambda_{1/2} =1 \pm \rho.$$ |
− | Für $\rho= 0.5$ erhält man $\underline{\lambda_{1} =1.5}$ und $\underline{\lambda_{2} =0.5}$. Die Gleichung gilt übrigens im gesamten Definitionsbereich $-1 \le \rho \le +1$. | + | *Für $\rho= 0.5$ erhält man $\underline{\lambda_{1} =1.5}$ und $\underline{\lambda_{2} =0.5}$. |
− | *Für $\rho = 0$ ist $\lambda_1 = \lambda_2 = +1$ | + | *Die Gleichung gilt übrigens im gesamten Definitionsbereich $-1 \le \rho \le +1$. |
+ | *Für $\rho = 0$ ist $\lambda_1 = \lambda_2 = +1$ ⇒ siehe Teilaufgabe '''(2)'''. | ||
*Bei $\rho = \pm 1$ ergibt sich $\lambda_1 = 2$ und $\lambda_2 = 0$. | *Bei $\rho = \pm 1$ ergibt sich $\lambda_1 = 2$ und $\lambda_2 = 0$. | ||
− | '''(4)''' Die Eigenvektoren erhält man durch Einsetzen der Eigenwerte $\lambda_1$ und $\lambda_2$ in die | + | '''(4)''' Die Eigenvektoren erhält man durch Einsetzen der Eigenwerte $\lambda_1$ und $\lambda_2$ in die Korrelationsmatrix: |
:$$\left[ \begin{array}{cc} | :$$\left[ \begin{array}{cc} | ||
1- (1+\rho) & \rho \\ | 1- (1+\rho) & \rho \\ | ||
Line 139: | Line 143: | ||
\end{array} \right].$$ | \end{array} \right].$$ | ||
− | [[File:P_ID676__Sto_A_4_16_d.png|right|Zur Drehung des Koordinatensystems]] | + | [[File:P_ID676__Sto_A_4_16_d.png|right|frame|Zur Drehung des Koordinatensystems]] |
Bringt man diese in die so genannte Orthonormalform, so gilt: | Bringt man diese in die so genannte Orthonormalform, so gilt: | ||
:$${\boldsymbol{\eta_1}}= \frac{1}{\sqrt{2}}\cdot \left[ | :$${\boldsymbol{\eta_1}}= \frac{1}{\sqrt{2}}\cdot \left[ | ||
Line 154: | Line 158: | ||
In der nebenstehenden Skizze ist das Ergebnis verdeutlicht: | In der nebenstehenden Skizze ist das Ergebnis verdeutlicht: | ||
*Das neue, durch $\mathbf{\eta_1}$ und $\mathbf{\eta_2}$ festgelegte Koordinatensystem liegt tatsächlich in Richtung der Hauptachsen des ursprünglichen Systems. | *Das neue, durch $\mathbf{\eta_1}$ und $\mathbf{\eta_2}$ festgelegte Koordinatensystem liegt tatsächlich in Richtung der Hauptachsen des ursprünglichen Systems. | ||
− | *Mit $\sigma_1 = \sigma_2$ ergibt sich fast immer (Ausnahme: $\rho= 0$) der Drehwinkel $\alpha = 45^\circ$. Dies folgt auch aus der im Theorieteil angegebenen Gleichung: | + | *Mit $\sigma_1 = \sigma_2$ ergibt sich fast immer (Ausnahme: $\rho= 0$) der Drehwinkel $\alpha = 45^\circ$. |
+ | *Dies folgt auch aus der im Theorieteil angegebenen Gleichung: | ||
:$$\alpha = {1}/{2}\cdot \arctan (2 \cdot\rho \cdot | :$$\alpha = {1}/{2}\cdot \arctan (2 \cdot\rho \cdot | ||
\frac{\sigma_1\cdot\sigma_2}{\sigma_1^2 -\sigma_2^2})= | \frac{\sigma_1\cdot\sigma_2}{\sigma_1^2 -\sigma_2^2})= | ||
{1}/{2}\cdot \arctan | {1}/{2}\cdot \arctan | ||
(\infty)\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\alpha = 45^\circ.$$ | (\infty)\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\alpha = 45^\circ.$$ | ||
− | *Die Eigenwerte $\lambda_1$ und $\lambda_2$ kennzeichnen nicht die Streuungen bezüglich der neuen Achsen, sondern die | + | *Die Eigenwerte $\lambda_1$ und $\lambda_2$ kennzeichnen nicht die Streuungen bezüglich der neuen Achsen, sondern die Varianzen. |
Richtig sind also <u>die Lösungsvorschläge 1 und 2</u>. | Richtig sind also <u>die Lösungsvorschläge 1 und 2</u>. | ||
+ | |||
'''(5)''' Durch Vergleich der Matrizen $\mathbf{K_x}$ und $\mathbf{K_z}$ erhält man | '''(5)''' Durch Vergleich der Matrizen $\mathbf{K_x}$ und $\mathbf{K_z}$ erhält man | ||
Line 175: | Line 181: | ||
0\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\hspace{0.15cm}\underline{\lambda_{1} | 0\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\hspace{0.15cm}\underline{\lambda_{1} | ||
=5,\hspace{0.1cm} \lambda_{2} =0}.$$ | =5,\hspace{0.1cm} \lambda_{2} =0}.$$ | ||
+ | |||
'''(7)''' Nach der auf dem Angabenblatt vorgegebenen Gleichung gilt: | '''(7)''' Nach der auf dem Angabenblatt vorgegebenen Gleichung gilt: | ||
Line 181: | Line 188: | ||
26.56^\circ.$$ | 26.56^\circ.$$ | ||
− | [[File:P_ID677__Sto_A_4_16_g.png|right|Dekorrelation | + | [[File:P_ID677__Sto_A_4_16_g.png|right|frame|Bestmögliche Dekorrelation]] |
Zum gleichen Ergebnis gelangt man über den Eigenvektor: | Zum gleichen Ergebnis gelangt man über den Eigenvektor: | ||
:$$\left[ \begin{array}{cc} | :$$\left[ \begin{array}{cc} | ||
Line 199: | Line 206: | ||
* Wegen $\rho = 1$ liegen alle Werte auf der Korrelationsgeraden mit den Koordinaten $z_1$ und $z_2 = z_1/2$. | * Wegen $\rho = 1$ liegen alle Werte auf der Korrelationsgeraden mit den Koordinaten $z_1$ und $z_2 = z_1/2$. | ||
*Durch die Drehung um den Winkel $\alpha = \arctan(0.5) = 26.56^\circ$ entsteht ein neues Koordinatensystem. | *Durch die Drehung um den Winkel $\alpha = \arctan(0.5) = 26.56^\circ$ entsteht ein neues Koordinatensystem. | ||
− | *Die Varianz entlang der Achse $ | + | *Die Varianz entlang der Achse $\mathbf{\zeta_1}$ beträgt $\lambda_1 = 5$ (Streuung $\sigma_1 = \sqrt{5} = 2.236$), |
+ | *während in der dazu orthogonalen Richtung $\mathbf{\zeta_2}$ die Zufallsgröße nicht ausgedehnt ist $(\lambda_2 = \sigma_2 = 0)$. | ||
{{ML-Fuß}} | {{ML-Fuß}} | ||
Revision as of 09:36, 22 August 2018
Obwohl die Beschreibung Gaußscher Zufallsgrößen mit Hilfe von Vektoren und Matrizen eigentlich nur bei mehr als $N = 2$ Dimensionen erforderlich ist und Sinn macht, beschränken wir uns hier zur Vereinfachung auf den Sonderfall zweidimensionaler Zufallsgrößen.
In der Grafik ist oben die allgemeine Korrelationsmatrix $\mathbf{K_x}$ der 2D–Zufallsgröße $\mathbf{x} = (x_1, x_2)^{\rm T}$ angegeben, wobei $\sigma_1^2$ und $\sigma_2^2$ die Varianzen der Einzelkomponenten beschreiben. $\rho$ bezeichnet den Korrelationskoeffizienten zwischen den beiden Komponenten.
Die Zufallsgrößen $\mathbf{y}$ und $\mathbf{z}$ geben zwei Spezialfälle von $\mathbf{x}$ an, deren Prozessparameter aus den Korrelationsmatrix $\mathbf{K_y}$ bzw. $\mathbf{K_z}$ bestimmt werden können.
Hinweise:
- Die Aufgabe gehört zum Kapitel Verallgemeinerung auf N-dimensionale Zufallsgrößen.
- Einige Grundlagen zur Anwendung von Vektoren und Matrizen finden sich auf den Seiten Determinante einer Matrix sowie Inverse einer Matrix.
- Entsprechend der Seite Höhenlinien bei korrelierten Zufallsgrößen ist der Winkel $\alpha$ zwischen dem alten und dem neuen System durch folgende Gleichung gegeben:
- $$\alpha = {1}/{2}\cdot \arctan (2 \cdot\rho \cdot \frac{\sigma_1\cdot\sigma_2}{\sigma_1^2 -\sigma_2^2}).$$
- Insbesondere ist zu beachten:
- Eine $2×2$-Kovarianzmatrix besitzt zwei reelle Eigenwerte $\lambda_1$ und $\lambda_2$.
- Diese beiden Eigenwerte bestimmen zwei Eigenvektoren $\xi_1$ und $\xi_2$.
- Diese spannen ein neues Koordinatensystem in Richtung der Hauptachsen des alten Systems auf.
Fragebogen
Musterlösung
- $\mathbf{K_y}$ ist tatsächlich die allgemeinste Korrelationsmatrix einer 2D-Zufallsgröße mit $\sigma_1 = \sigma_2 = \sigma$.
- Der Parameter $\rho$ gibt den Korrelationskoeffizienten an. Dieser kann alle Werte zwischen $\pm 1$ inclusive dieser Randwerte annehmen.
(2) In diesem Fall lautet die Bestimmungsgleichung:
- $${\rm det}\left[ \begin{array}{cc} 1- \lambda & 0 \\ 0 & 1- \lambda \end{array} \right] = 0 \hspace{0.3cm}\Rightarrow \hspace{0.3cm} (1- \lambda)^2 = 0\hspace{0.3cm}\Rightarrow \hspace{0.3cm} \hspace{0.15cm}\underline{\lambda_{1/2} =1}.$$
(3) Bei positivem $\rho$ lautet die Bestimmungsgleichung der Eigenwerte:
- $$(1- \lambda)^2 -\rho^2 = 0\hspace{0.5cm}\Rightarrow \hspace{0.5cm}\lambda^2 - 2\lambda + 1 - \rho^2 = 0\hspace{0.5cm}\Rightarrow\hspace{0.5cm}\lambda_{1/2} =1 \pm \rho.$$
- Für $\rho= 0.5$ erhält man $\underline{\lambda_{1} =1.5}$ und $\underline{\lambda_{2} =0.5}$.
- Die Gleichung gilt übrigens im gesamten Definitionsbereich $-1 \le \rho \le +1$.
- Für $\rho = 0$ ist $\lambda_1 = \lambda_2 = +1$ ⇒ siehe Teilaufgabe (2).
- Bei $\rho = \pm 1$ ergibt sich $\lambda_1 = 2$ und $\lambda_2 = 0$.
(4) Die Eigenvektoren erhält man durch Einsetzen der Eigenwerte $\lambda_1$ und $\lambda_2$ in die Korrelationsmatrix:
- $$\left[ \begin{array}{cc} 1- (1+\rho) & \rho \\ \rho & 1- (1+\rho) \end{array} \right]\cdot{\boldsymbol{\eta_1}} = \left[ \begin{array}{cc} -\rho & \rho \\ \rho & -\rho \end{array} \right]\cdot \left[ \begin{array}{c} \eta_{11} \\ \eta_{12} \end{array} \right]=0$$
- $$\Rightarrow\hspace{0.3cm}-\rho \cdot \eta_{11} + \rho \cdot \eta_{12} = 0\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\eta_{11}= {\rm const} \cdot \eta_{12}\hspace{0.3cm}\Rightarrow\hspace{0.3cm}{\boldsymbol{\eta_1}}= {\rm const}\cdot \left[ \begin{array}{c} 1 \\ 1 \end{array} \right];$$
- $$\left[ \begin{array}{cc} 1- (1-\rho) & \rho \\ \rho & 1- (1-\rho) \end{array} \right]\cdot{\boldsymbol{\eta_2}} = \left[ \begin{array}{cc} \rho & \rho \\ \rho & \rho \end{array} \right]\cdot \left[ \begin{array}{c} \eta_{21} \\ \eta_{22} \end{array} \right]=0$$
- $$\Rightarrow\hspace{0.3cm}\rho \cdot \eta_{21} + \rho \cdot \eta_{22} = 0\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\eta_{21}= -{\rm const} \cdot \eta_{22}\hspace{0.3cm}\Rightarrow\hspace{0.3cm}{\boldsymbol{\eta_2}}= {\rm const}\cdot \left[ \begin{array}{c} -1 \\ 1 \end{array} \right].$$
Bringt man diese in die so genannte Orthonormalform, so gilt:
- $${\boldsymbol{\eta_1}}= \frac{1}{\sqrt{2}}\cdot \left[ \begin{array}{c} 1 \\ 1 \end{array} \right],\hspace{0.5cm} {\boldsymbol{\eta_2}}= \frac{1}{\sqrt{2}}\cdot \left[ \begin{array}{c} -1 \\ 1 \end{array} \right].$$
In der nebenstehenden Skizze ist das Ergebnis verdeutlicht:
- Das neue, durch $\mathbf{\eta_1}$ und $\mathbf{\eta_2}$ festgelegte Koordinatensystem liegt tatsächlich in Richtung der Hauptachsen des ursprünglichen Systems.
- Mit $\sigma_1 = \sigma_2$ ergibt sich fast immer (Ausnahme: $\rho= 0$) der Drehwinkel $\alpha = 45^\circ$.
- Dies folgt auch aus der im Theorieteil angegebenen Gleichung:
- $$\alpha = {1}/{2}\cdot \arctan (2 \cdot\rho \cdot \frac{\sigma_1\cdot\sigma_2}{\sigma_1^2 -\sigma_2^2})= {1}/{2}\cdot \arctan (\infty)\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\alpha = 45^\circ.$$
- Die Eigenwerte $\lambda_1$ und $\lambda_2$ kennzeichnen nicht die Streuungen bezüglich der neuen Achsen, sondern die Varianzen.
Richtig sind also die Lösungsvorschläge 1 und 2.
(5) Durch Vergleich der Matrizen $\mathbf{K_x}$ und $\mathbf{K_z}$ erhält man
- $\sigma_{1}\hspace{0.15cm}\underline{ =2}$,
- $\sigma_{2}\hspace{0.15cm}\underline{ =1}$,
- $\rho = 2/(\sigma_{1} \cdot \sigma_{2})\hspace{0.15cm}\underline{ =1}$.
(6) Nach dem inzwischen altbekannten Schema gilt:
- $$(4- \lambda) \cdot (1- \lambda) -4 = 0\hspace{0.3cm}\Rightarrow \hspace{0.3cm}\lambda^2 - 5\lambda = 0\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\hspace{0.15cm}\underline{\lambda_{1} =5,\hspace{0.1cm} \lambda_{2} =0}.$$
(7) Nach der auf dem Angabenblatt vorgegebenen Gleichung gilt:
- $$\alpha ={1}/{2}\cdot \arctan (2 \cdot 1 \cdot \frac{2 \cdot 1}{2^2 -1^2})= {1}/{2}\cdot \arctan ({4}/{3}) = 26.56^\circ.$$
Zum gleichen Ergebnis gelangt man über den Eigenvektor:
- $$\left[ \begin{array}{cc} 4-5 & 2 \\ 2 & 1-5 \end{array} \right]\cdot \left[ \begin{array}{c} \zeta_{11} \\ \zeta_{12} \end{array} \right]=0 \hspace{0.3cm} \Rightarrow\hspace{0.3cm}-\zeta_{11}= 2\zeta_{12}=0\hspace{0.3cm}\Rightarrow\hspace{0.3cm}\zeta_{12}={\zeta_{11}}/{2}$$
- $$\Rightarrow\hspace{0.3cm}\alpha = \arctan ({\zeta_{12}}/{\zeta_{11}}) = \arctan(0.5) \hspace{0.15cm}\underline{= 26.56^\circ}.$$
Die nebenstehende Skizze zeigt die 2D-WDF der Zufallsgröße $\mathbf{z}$:
- Wegen $\rho = 1$ liegen alle Werte auf der Korrelationsgeraden mit den Koordinaten $z_1$ und $z_2 = z_1/2$.
- Durch die Drehung um den Winkel $\alpha = \arctan(0.5) = 26.56^\circ$ entsteht ein neues Koordinatensystem.
- Die Varianz entlang der Achse $\mathbf{\zeta_1}$ beträgt $\lambda_1 = 5$ (Streuung $\sigma_1 = \sqrt{5} = 2.236$),
- während in der dazu orthogonalen Richtung $\mathbf{\zeta_2}$ die Zufallsgröße nicht ausgedehnt ist $(\lambda_2 = \sigma_2 = 0)$.