Expected Values and Moments

From LNTwww

Momentenberechnung als Scharmittelwert


Die Wahrscheinlichkeitsdichtefunktion (WDF) bietet ebenso wie die Verteilungsfunktion (VTF) sehr weitreichende Informationen über die betrachtete Zufallsgröße.  Weniger, aber dafür kompaktere Informationen liefern die so genannten  Erwartungswerte  und  Momente.

  • Deren Berechnungsmöglichkeiten wurden für diskrete Zufallsgrößen bereits im Kapitel  Momente einer diskreten Zufallsgröße  angegeben.
  • Nun werden diese integrativen Beschreibungsgrößen "Erwartungswert" und "Moment" im Zusammenhang mit der Wahrscheinlichkeitsdichtefunktion (WDF) kontinuierlicher Zufallsgrößen betrachtet und dadurch allgemeiner formuliert.


$\text{Definition:}$  Der  Erwartungswert  bezüglich einer beliebigen Gewichtungsfunktion $g(x)$ kann mit der WDF  $f_{\rm x}(x)$  in folgender Weise berechnet werden:

$${\rm E}\big[g (x ) \big] = \int_{-\infty}^{+\infty} g(x)\cdot f_{x}(x) \,{\rm d}x.$$

Setzt man in diese Gleichung für  $g(x) = x^k$  ein, so erhält man das  Moment $k$-ter Ordnung:

$$m_k = {\rm E}\big[x^k \big] = \int_{-\infty}^{+\infty} x^k\cdot f_{x} (x ) \, {\rm d}x.$$


Aus dieser Gleichung folgt

  • mit  $k = 1$  für den  linearen Mittelwert:
$$m_1 = {\rm E}\big[x \big] = \int_{-\infty}^{ \rm +\infty} x\cdot f_{x} (x ) \,{\rm d}x,$$
  • mit  $k = 2$  für den  quadratischen Mittelwert:
$$m_2 = {\rm E}\big[x^{\rm 2} \big] = \int_{-\infty}^{ \rm +\infty} x^{ 2}\cdot f_{ x} (x) \,{\rm d}x.$$

Bei einer diskreten, $M$–stufigen Zufallsgröße erhält man auch mit den hier angegebenen Formeln wieder die bereits im zweiten Kapitel angegebenen Gleichungen (Berechnung als Scharmittelwert):

$$m_1 = \sum\limits_{\mu=1}^{ M}\hspace{0.15cm}p_\mu\cdot x_\mu,$$
$$m_2 = \sum\limits_{\mu= 1}^{ M}\hspace{0.15cm}p_\mu\cdot x_\mu^2.$$

Hierbei ist berücksichtigt, dass das Integral über die Diracfunktion  $δ(x)$  gleich  $1$  ist.

In Zusammenhang mit Signalen sind auch folgende Bezeichnungen üblich:

  • $m_1$  gibt den Gleichanteil  an,
  • $m_2$  entspricht der  (auf den Einheitswiderstand  $1 \ Ω$  bezogenen)  Signalleistung.


Bezeichnet  $x$  beispielsweise eine Spannung, so hat nach diesen Gleichungen 

  • $m_1$  die Einheit  ${\rm V}$  und 
  • $m_2$  die Einheit  ${\rm V}^2$. 


Will man die Leistung in „Watt”  $\rm (W)$  angeben, so muss  $m_2$  noch durch den Widerstandswert  $R$  dividiert werden.

Zentralmomente


$\text{Definition:}$  Besonders große Bedeutung haben in der Statistik die  Zentralmomente, die im Gegensatz zu den herkömmlichen Momenten jeweils auf den Mittelwert  $m_1$  bezogen sind:

$$\mu_k = {\rm E}\big[(x-m_{\rm 1})^k\big] = \int_{-\infty}^{+\infty} (x-m_{\rm 1})^k\cdot f_x(x) \,\rm d \it x.$$


Die nichtzentrierten Momente  $m_k$  kann man direkt in die zentrierten Momente  $\mu_k$  umrechnen:

$$\mu_k = \sum\limits_{\kappa= 0}^{k} \left( \begin{array}{*{2}{c}} k \\ \kappa \\ \end{array} \right)\cdot m_\kappa \cdot (-m_1)^{k-\kappa}.$$

Nach den allgemein gültigen Gleichungen der  letzten Seite  ergeben sich die formalen Größen  $m_0 = 1$  und  $\mu_0 = 1$. Für das Zentralmoment erster Ordnung gilt nach obiger Definition stets  $\mu_1 = 0$.

In der Gegenrichtung gelten folgende Gleichungen für  $k = 1$,  $k = 2$,  usw.:

$$m_k = \sum\limits_{\kappa= 0}^{k} \left( \begin{array}{*{2}{c}} k \\ \kappa \\ \end{array} \right)\cdot \mu_\kappa \cdot {m_1}^{k-\kappa}.$$

$\text{Beispiel 1:}$  Alle Momente einer binären Zufallsgröße mit den Wahrscheinlichkeiten  ${\rm Pr}(0) = 1 – p$   und  ${\rm Pr}(1) = p$  sind gleich groß:

$$m_1 = m_2 = m_3 = m_4 = \hspace{0.05cm}\text{...} \hspace{0.05cm}= p.$$

Mit obigen Gleichungen erhält man dann für die ersten drei Zentralmomente:

$$\mu_2 = m_2 - m_1^2 = p -p^2, $$
$$\mu_3 = m_3 - 3 \cdot m_2 \cdot m_1 + 2 \cdot m_1^3 = p - 3 \cdot p^2 + 2 \cdot p^3, $$
$$ \mu_4 = m_4 - 4 \cdot m_3 \cdot m_1 + 6 \cdot m_2 \cdot m_1^2 - 3 \cdot m_1^4 = p - 4 \cdot p^2 + 6 \cdot p^3- 3 \cdot p^4. $$

Some common central moments


Aus der  letzten Definition  können folgende weitere Kenngrößen abgeleitet werden:

$\text{Definition:}$  Die  Varianz  $σ^2$  der betrachteten Zufallsgröße ist das Zentralmoment zweiter Ordnung   ⇒   $\mu_2.$

  • Die Varianz  $σ^2$  entspricht physikalisch der Wechselleistung  und die Streuung  $σ$  gibt den Effektivwert  an.
  • Aus dem linearen und dem quadratischen Mittelwert ist die Varianz nach dem Satz von Steiner  in folgender Weise berechenbar:
$$\sigma^{2} = m_2 - m_1^{2}.$$


$\text{Definition:}$  Die  Charliersche Schiefe  $S$ bezeichnet das auf  $σ^3$  bezogene dritte Zentralmoment.

  • Bei symmetrischer Dichtefunktion ist diese Kenngröße immer  $S=0$.
  • Je größer  $S = \mu_3/σ^3$  ist, um so unsymmetrischer verläuft die WDF um den Mittelwert  $m_1$.
  • Beispielsweise ergibt sich für die  Exponentialverteilung  die (positive) Schiefe $S =2$, und zwar unabhängig vom Verteilungsparameter  $λ$.
  • Bei positiver Schiefe  $(S > 0)$  spricht man von "einer rechtsschiefen oder linkssteilen Verteilung";  diese fällt auf der rechten Seite flacher ab als auf der linken.
  • Bei negativer Schiefe  $(S < 0)$  liegt eine "linksschiefe oder rechtssteile Verteilung" vor;  eine solche fällt auf der linken Seite flacher ab als auf der rechten.


$\text{Definition:}$  Auch das Zentralmoment vierter Ordnung wird für statistische Analysen herangezogen.  Als  Kurtosis  bezeichnet man den Quotienten  $K = \mu_4/σ^4.$

  • Bei einer  gaußverteilten Zufallsgröße  ergibt sich hierfür immer der Wert  $K = 3$.
  • Verwendet wird auch der sogenannte  Exzess  $\gamma = K - 3$ ,  auch bekannt unter dem Begriff "Überkurtosis".
  • Anhand dieser Kenngröße kann man beispielsweise überprüfen, ob eine vorliegende Zufallsgröße näherungsweise gaußisch ist:  $\gamma \approx 0$.


$\text{Beispiel 2:}$ 

  • Weist die WDF weniger Ausläufer auf als die Gaußverteilung, so ist die Kurtosis  $K < 3$.  Zum Beispiel ergibt sich für die Gleichverteilung  $K = 1.8$  ⇒   $\gamma = - 1.2$.
  • Dagegen weist  $K > 3$  darauf hin, dass die Ausläufer ausgeprägter sind als bei der Gaußverteilung. Zum Beispiel gilt für die  Exponentialverteilung   $K = 9$.
  • Für die  Laplaceverteilung  ⇒   zweiseitige Exponentialverteilung ergibt sich eine etwas kleinere Kurtosis  $K = 6$  und der Exzess $\gamma = 3$.

Momentenberechnung als Zeitmittelwert


Die Erwartungswertberechnung nach den bisherigen Gleichungen dieses Abschnitts entspricht einer  Scharmittelung, das heißt der Mittelung über alle möglichen Werte  $x_\mu$.

Die Momente  $m_k$  können aber auch als  Zeitmittelwerte  bestimmt werden, wenn der die Zufallsgröße erzeugende stochastische Prozess stationär und ergodisch ist:

  • Die genaue Definition für einen solchen stationären und ergodischen Zufallsprozess finden Sie im  Kapitel 4.4.
  • Eine Zeitmittelung wird im Folgenden stets durch eine überstreichende Linie gekennzeichnet.
  • Bei zeitdiskreter Betrachtung wird das Zufallssignal  $x(t)$  durch die Zufallsfolge  $〈x_ν〉$  ersetzt.
  • Bei endlicher Folgenlänge lauten diese Zeitmittelwerte mit  $ν = 1, 2,\hspace{0.05cm}\text{...}\hspace{0.05cm} , N$:
$$m_k=\overline{x_{\nu}^{k}}=\frac{1}{N} \cdot \sum\limits_{\nu=1}^{N}x_{\nu}^{k},$$
$$m_1=\overline{x_{\nu}}=\frac{1}{N} \cdot \sum\limits_{\nu=1}^{N}x_{\nu},$$
$$m_2=\overline{x_{\nu}^{2}}=\frac{1}{N} \cdot \sum\limits_{\nu=1}^{N}x_{\nu}^{2}.$$

Sollen die Momente (oder Erwartungswerte) per Simulation bestimmt werden, so geschieht dies in der Praxis meist durch Zeitmittelung.  Der entsprechende Berechnungsalgorithmus unterscheidet sich bei diskreten und kontinuierlichen Zufallsgrößen nur mariginal.

Die in diesem Abschnitt behandelte Thematik ist im Lernvideo  Momentenberechnung bei diskreten Zufallsgrößen  zusammengefasst.


Charakteristische Funktion


$\text{Definition:}$  Ein weiterer Sonderfall eines Erwartungswertes ist die  charakteristische Funktion, wobei hier für die Bewertungsfunktion  $g(x) = {\rm e}^{\hspace{0.03cm}{\rm j} \hspace{0.03cm}{\it Ω}\hspace{0.05cm}x}$  zu setzen ist:

$$C_x({\it \Omega}) = {\rm E}\big[{\rm e}^{ {\rm j} \hspace{0.05cm} {\it \Omega} \hspace{0.05cm} x}\big] = \int_{-\infty}^{+\infty} {\rm e}^{ {\rm j} \hspace{0.05cm} {\it \Omega} \hspace{0.05cm} x}\cdot f_{\rm x}(x) \hspace{0.1cm}{\rm d}x.$$

Ein Vergleich mit dem Kapitel  Fouriertransformation und Fourierrücktransformation  im Buch "Signaldarstellung" zeigt, dass die charakteristische Funktion als die Fourierrücktransformierte der Wahrscheinlichkeitsdichtefunktion interpretiert werden kann:

$$C_x ({\it \Omega}) \hspace{0.3cm} \circ \!\!-\!\!\!-\!\!\!-\!\! \bullet \hspace{0.3cm} f_{x}(x).$$


Ist die Zufallsgröße  $x$  dimensionslos, so ist auch das Argument  $\it Ω$  der charakteristischen Funktion ohne Einheit.

  • Das Symbol  $\it Ω$  wurde gewählt, da das Argument hier einen gewissen Bezug zur Kreisfrequenz beim zweiten Fourierintegral aufweist  (gegenüber der Darstellung im  $f$–Bereich fehlt allerdings der Faktor  $2\pi$  im Exponenten).
  • Es wird aber nochmals eindringlich darauf hingewiesen, dass – wenn man einen Bezug zur Systemtheorie herstellen will – $C_x({\it Ω})$  der „Zeitfunktion” und  $f_{x}(x)$  der „Spektralfunktion” entsprechen würde.


$\text{Berechnungsmöglichkeit:}$  Entwickelt man die komplexe Funktion  ${\rm e}^{\hspace{0.03cm}{\rm j} \hspace{0.03cm}{\it Ω}\hspace{0.05cm}x}$  in eine Potenzreihe  und vertauscht Erwartungswertbildung und Summation, so folgt die Reihendarstellung der charakteristischen Funktion:

$$C_x ( {\it \Omega}) = 1 + \sum_{k=1}^{\infty}\hspace{0.2cm}\frac{m_k}{k!} \cdot ({\rm j} \hspace{0.01cm}{\it \Omega})^k .$$

Die  Aufgabe 3.4  zeigt weitere Eigenschaften der charakteristischen Funktion auf.


$\text{Beispiel 3:}$ 

  • Bei einer symmetrischen binären (zweipunktverteilten) Zufallsgröße  $x ∈ \{\pm1\}$  mit den Wahrscheinlichkeiten  ${\rm Pr}(–1) = {\rm Pr}(+1) = 1/2$  verläuft die charakteristische Funktion cosinusförmig.
  • Das Analogon in der Systemtheorie ist, dass das Spektrum eines Cosinussignals mit der Kreisfrequenz  ${\it Ω}_{\hspace{0.03cm}0}$  aus zwei Diracfunktionen bei  $±{\it Ω}_{\hspace{0.03cm}0}$  besteht.


$\text{Beispiel 4:}$ 

$$C_y({\it \Omega}) = \frac{1}{2 y_0} \cdot \int_{-y_0}^{+y_0} {\rm e}^{ {\rm j} \hspace{0.05cm} {\it \Omega} \hspace{0.05cm} y} \,{\rm d}y = \frac{ {\rm e}^{ {\rm j} \hspace{0.05cm} y_0 \hspace{0.05cm}{\it \Omega} } - {\rm e}^{ - {\rm j} \hspace{0.05cm} y_0 \hspace{0.05cm} {\it \Omega} } }{2 {\rm j} \cdot y_0 \cdot {\it \Omega} } = \frac{ {\rm sin}(y_0 \cdot {\it \Omega})}{ y_0 \cdot {\it \Omega} } = {\rm si}(y_0 \cdot {\it \Omega}). $$
  • Die Funktion  ${\rm si}(x) = \sin(x)/x$  kennen wir bereits aus dem Buch  Signaldarstellung.
  • Sie ist auch unter dem Namen  Spaltfunktion  bekannt.

Aufgaben zum Kapitel


Aufgabe 3.3: Momente bei $\cos^2$–WDF

Aufgabe 3.3Z: Momente bei Dreieck–WDF

Aufgabe 3.4: Charakteristische Funktion