Difference between revisions of "Aufgaben:Exercise 3.11: Chebyshev's Inequality"

From LNTwww
m (Guenter verschob die Seite 3.11 Tschebyscheff nach 3.11 Tschebyscheffsche Ungleichung)
 
(25 intermediate revisions by 5 users not shown)
Line 1: Line 1:
  
{{quiz-Header|Buchseite=Stochastische Signaltheorie/Weitere Verteilungen
+
{{quiz-Header|Buchseite=Theory_of_Stochastic_Signals/Further_Distributions
 
}}
 
}}
  
[[File:P_ID139__Sto_A_3_11.png|right|]]
+
[[File:EN_Sto_A_3_11_neu.png|right|frame|Exemplary Chebyshev bound]]
:Ist &uuml;ber eine Zufallsgr&ouml;&szlig;e <i>x</i> nichts weiter bekannt als nur der Mittelwert <i>m<sub>x</sub></i> und die Streuung <i>&sigma;<sub>x</sub></i>, so gibt die  <i>Tschebyscheffsche Ungleichung</i> eine obere Schranke f&uuml;r die Wahrscheinlichkeit an, dass <i>x</i> betragsm&auml;&szlig;ig mehr als einen Wert <i>&epsilon;</i> von seinem Mittelwert <i>m<sub>x</sub></i> abweicht:
 
:$$\rm Pr(|\it x-m_x|\ge \varepsilon)\le \it \frac{\sigma_x^{\rm 2}}{\varepsilon^{\rm 2}}.$$
 
  
:In der Grafik ist diese obere Schranke rot eingezeichnet. Der gr&uuml;ne Kurvenverlauf zeigt die tatsächliche Wahrscheinlichkeit bei der Gleichverteilung, die blauen Punkte gelten f&uuml;r die Exponentialverteilung. Aus dieser Darstellung ist zu erkennen, dass die <i>Tschebyscheffsche Ungleichung</i> nur eine sehr grobe Schranke darstellt. Sie sollte nur dann verwendet werden, wenn von der Zufallsgr&ouml;&szlig;e wirklich nur der Mittelwert und die Streuung bekannt sind.
+
[[File:P_ID921__Sto_A_3_11_b.png|frame|Values of the&nbsp; "complementary Gaussian error function"]]
 +
If nothing else is known about a random variable&nbsp; $x$&nbsp; than only
 +
*the mean value&nbsp; $m_x$,&nbsp; and
 +
*the standard deviation&nbsp; $\sigma_x$,
  
:<b>Hinweis</b>: Die Aufgabe bezieht sich auf die Seite Tschebyscheffsche Ungleichung im Kapitel 3.7.
 
  
:Nachfolgend finden Sie eine Tabelle mit Werten der komplementären Gaußschen Fehlerfunktion.
+
so the&nbsp;  "Chebyshev's Inequality"&nbsp; gives an upper bound on the probability that $x$&nbsp; deviates by more than a value&nbsp; $\varepsilon$&nbsp; from its mean.&nbsp; This bound is:
 +
:$${\rm Pr}(|x-m_x|\ge \varepsilon) \le {\sigma_x^{\rm 2}}/{\varepsilon^{\rm 2}}.$$
  
[[File:P_ID921__Sto_A_3_11_b.png|center|]]
+
To explain:
 +
*In the graph,&nbsp; this upper bound is drawn in red.
 +
*The green curve shows the actual probability for the uniform distribution.
 +
*The blue points are for the exponential distribution.  
  
  
===Fragebogen===
+
From this plot it can be seen that the&nbsp; "Chebyshev's Inequality"&nbsp; is only a very rough bound.&nbsp; <br>It should be used only if really only the mean and the standard deviation are known from the random size.
 +
 
 +
 
 +
<br>
 +
Hints:
 +
*The exercise belongs to the chapter&nbsp; [[Theory_of_Stochastic_Signals/Further_Distributions|"Further Distributions"]].
 +
*In particular,&nbsp; reference is made to the section&nbsp;  [[Theory_of_Stochastic_Signals/Further_Distributions#Chebyshev.27s_inequality|"Chebyshev's inequality"]]&nbsp;.
 +
 +
*On the right,&nbsp; values of the complementary Gaussian error function&nbsp; ${\rm Q}(x)$&nbsp; are given.
 +
 
 +
 
 +
 
 +
 
 +
 
 +
===Questions===
  
 
<quiz display=simple>
 
<quiz display=simple>
{Welche der nachfolgenden Aussagen sind zutreffend?
+
{Which of the following statements are true?
 
|type="[]"}
 
|type="[]"}
- Vorstellbar ist eine Zufallsgröße mit Pr(|<i>x</i> - <i>m<sub>x</sub></i> | &#8805; 3<i>&sigma;<sub>x</sub></i>) = 1/4.
+
- Conceivably,&nbsp; a random variable with&nbsp; ${\rm Pr}(|x -m_x | \ge 3\sigma_x) = 1/4$.
+ &bdquo;Tschebyscheff&rdquo; liefert f&uuml;r <i>&epsilon;</i> < <i>&sigma;<sub>x</sub></i> keine Information.
+
+ "Chebyshev"&nbsp; yields for&nbsp; $\varepsilon < \sigma_x$&nbsp; no information.
+ Pr(|<i>x</i> - <i>m<sub>x</sub></i> | &#8805; <i>&epsilon;</i>) ist für große <i>&epsilon;</i> identisch 0, wenn <i>x</i> begrenzt ist.
+
+ ${\rm Pr}(|x -m_x | \ge \sigma_x)$&nbsp; is identically zero for large&nbsp; $\varepsilon$&nbsp; if&nbsp; $x$&nbsp; is bounded.
  
  
{Geben Sie die Überschreitungswahrscheinlichkeit <i>p<sub>k</sub></i> = Pr(|<i>x</i> &ndash; <i>m<sub>x</sub></i>| &#8805; <i>k &middot; &sigma;<sub>x</sub></i>) für die Gau&szlig;verteilung an (mit <i>k</i> = 1, 2, 3, 4). Wie gro&szlig; ist <i>p</i><sub>3</sub>?
+
{It holds&nbsp; $k = 1, \ 2, \ 3, \ 4$.&nbsp; Give the excess probability&nbsp; $p_k = {\rm Pr}(|x -m_x | \ge k \cdot \sigma_x)$&nbsp; for the <u>Gaussian distribution</u>.&nbsp; How large is&nbsp; $p_3$?
 
|type="{}"}
 
|type="{}"}
$Pr(|x - m_x| 3\sigma_x)$ = { 0.0026 3% }
+
${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $ { 0.26 3% } $\ \%$
  
  
{Wie lauten diese Überschreitungswahrscheinlichkeiten <i>p<sub>k</sub></i>  (<i>k</i> = 1, 2, 3, 4) bei der Exponentialverteilung. Hier gilt: <i>m<sub>x</sub></i> = <i>&sigma;<sub>x</sub></i> = 1/<i>&lambda;</i>. Wie gro&szlig; ist <i>p</i><sub>3</sub>?
+
{What are the excess probabilities&nbsp; $p_k$&nbsp; for the&nbsp; <u>exponential distribution</u>.&nbsp; Here &nbsp; $m_x = \sigma_x = 1/\lambda$.&nbsp; What is&nbsp; $p_3$?
 
|type="{}"}
 
|type="{}"}
$Pr(|x - m_x| 3\sigma_x)$ = { 0.0183 3% }
+
${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $ { 1.83 3% } $\ \%$
  
  
Line 39: Line 57:
 
</quiz>
 
</quiz>
  
===Musterlösung===
+
===Solution===
 
{{ML-Kopf}}
 
{{ML-Kopf}}
:<b>1.</b>&nbsp;&nbsp;Die erste Aussage ist falsch. Die Tschebyscheffsche Ungleichung liefert hier die Schranke 1/9. Bei keiner Verteilung kann die hier betrachtete Wahrscheinlichkeit gr&ouml;&szlig;er sein.  
+
'''(1)'''&nbsp; Correct are&nbsp; <u>the proposed solutions 2 and 3</u>:
 
+
*The first statement is false.&nbsp; Here,&nbsp; Chebyshev's inequality provides the bound&nbsp; $1/9$.  
:F&uuml;r <i>&epsilon;</i> < <i>&sigma;<sub>x</sub></i> liefert Tschebyscheff einen Wert gr&ouml;&szlig;er als 1. Da eine Wahrscheinlichkeit nie gr&ouml;&szlig;er als 1 sein kann, ist diese Information nutzlos.
+
*For no distribution the probability considered here can be equal&nbsp; $1/4$.  
 +
*For&nbsp; $\varepsilon < \sigma_x$ &nbsp; &rArr; &nbsp; Chebyshev yields a probability greater&nbsp; $1$.&nbsp; This information is useless.
 +
*The last statement is true.&nbsp; For example,&nbsp; with the uniform distribution:
 +
:$${\rm Pr}(| x- m_x | \ge \varepsilon)=\left\{ \begin{array}{*{4}{c}} 1-{\varepsilon}/{\varepsilon_{\rm 0}} & \rm for\hspace{0.1cm}{\it \varepsilon<\varepsilon_{\rm 0}=\sqrt{\rm 3}\cdot\sigma_x},\\\rm 0 & \rm else. \end{array} \right. $$
  
:Auch die letzte Aussage ist zutreffend. Beispielsweise gilt bei der Gleichverteilung:
 
:$$\rm Pr(|\it x- m_x | \ge \varepsilon)=\left\{ \begin{array}{*{4}{c}} 1-{\varepsilon}/{\varepsilon_{\rm 0}} & \rm f\ddot{u}r\hspace{0.1cm}{\it \varepsilon<\varepsilon_{\rm 0}=\sqrt{\rm 3}\cdot\sigma_x},\\\rm 0 & \rm sonst. \end{array} \right. $$
 
  
:Richtig sind demnach <u>die Lösungsvorschläge 2 und 3</u>
+
'''(2)'''&nbsp; For the Gaussian distribution holds:
 +
:$$p_k={\rm Pr}(| x-m_x| \ge k\cdot\sigma_{x})=\rm 2\cdot \rm Q(\it k).$$
  
:<b>2.</b>&nbsp;&nbsp;Bei der Gau&szlig;verteilung gilt:
+
*This results in the following numerical values&nbsp; $($in brackets: &nbsp; bound according to Chebyshev$)$:
:$$p_k=\rm Pr(|\it x-m_x| \ge k\cdot\sigma_{x})=\rm 2\cdot \rm Q(\it k).$$
+
:$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x}) = 31.7 \% \hspace{0.3cm}(100 \%),$$
 +
:$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x}) = 4.54 \% \hspace{0.3cm}(25 \%),$$
 +
:$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})\hspace{0.15cm}\underline{ = 0.26 \%} \hspace{0.3cm}(11.1 \%),$$
 +
:$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = 0.0064 \% \hspace{0.3cm}(6.25 \%).$$
  
:Daraus ergeben sich folgende Zahlenwerte (in Klammern: Schranke nach Tschebyscheff):
 
:$$k=\rm 1: \rm Pr(|\it x-m_x| \ge \sigma_{x}) = \rm 0.317 \hspace{0.3cm}(1.000),$$
 
:$$k=\rm 2: \rm Pr(|\it x-\it m_x| \ge \rm 2\it \cdot\sigma_{x}) = \rm 0.454\cdot 10^{-1}  \hspace{0.3cm}(0.250),$$
 
:$$k=\rm 3: \rm Pr(|\it x- \it m_x| \ge \rm 3\cdot\it \sigma_{x})
 
\hspace{0.15cm}\underline{ = \rm 0.26\cdot 10^{-2}}  \hspace{0.45cm}\rm (0.111),$$
 
:$$k=\rm 4: \rm Pr(|\it x- \it m_x| \ge \rm 4\cdot\it \sigma_{x}) = \rm 0.64\cdot 10^{-4}  \hspace{0.3cm}(0.0625).$$
 
  
:<b>3.</b>&nbsp;&nbsp;Ohne Einschr&auml;nkung der Allgemeing&uuml;ltigkeit setzen wir <i>&lambda;</i> = 1  
+
'''(3)'''&nbsp; Without restricting generality,&nbsp; we set&nbsp; $\lambda = 1$
:&nbsp;&#8658;&nbsp; <i>m<sub>x</sub></i> = <i>&sigma;<sub>x</sub></i> = 1. Dann gilt:
+
&nbsp; &#8658; &nbsp; $m_x = \sigma_x = 1$.&nbsp; Then holds:
:$$\rm Pr(|\it x - \it m_x| \ge \it k\cdot\sigma_{x}) = \rm Pr(|\it x-\rm 1| \ge \it k).$$
+
:$${\rm Pr}(|x - m_x| \ge k\cdot\sigma_{x}) = {\rm Pr}(| x-1| \ge k).$$
  
:Da in diesem Sonderfall die Zufallsgröße <i>x</i> stets größer als 0 ist, gilt weiter:
+
*Since in this special case the random variable is always&nbsp; $x >0$,&nbsp; it further holds:
:$$\it p_k= \rm Pr(\it x \ge k+\rm 1)=\int_{\it k+\rm 1}^{\infty}\hspace{-0.15cm}
+
:$$p_k= {\rm Pr}( x \ge k+1)=\int_{k+\rm 1}^{\infty}\hspace{-0.15cm}
\rm e^{-\it x}\, {\rm d}\it x=\rm \rm e^{-(\it k + \rm 1)}.$$
+
{\rm e}^{-x}\, {\rm d} x={\rm e}^{-( k + 1)}.$$
  
:Daraus ergeben sich folgende Zahlenwerte für die Exponentialverteilung:
+
*This yields the following numerical values for the exponential distribution:
:$$k=\rm 1: \rm Pr(|\it x-m_x| \ge \sigma_{x}) = \rm \rm e^{-2}= \rm 0.1353,$$
+
:$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x})= \rm e^{-2}= \rm 13.53\%,$$
:$$k=\rm 2: \rm Pr(|\it x- \it m_x| \ge \rm 2\it \cdot\sigma_{x}) = \rm \rm e^{-3}=\rm 0.0497 ,$$
+
:$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x})= \rm \rm e^{-3}=\rm 4.97\% ,$$
:$$k=\rm 3: \rm Pr(|\it x-\it m_x| \ge \rm 3\cdot\it \sigma_{x}) = \rm \rm e^{-4}\hspace{0.15cm}\underline{ =\rm 0.0183 },$$
+
:$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})= \rm \rm e^{-4}\hspace{0.15cm}\underline{ =\rm 1.83\% },$$
:$$k=\rm 4: \rm Pr(|\it x- \it m_x| \ge \rm 4\cdot\it \sigma_{x}) = \rm \rm e^{-5}= \rm 0.0067.$$
+
:$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = \rm e^{-5}= \rm 0.67\%.$$
 
{{ML-Fuß}}
 
{{ML-Fuß}}
  
  
  
[[Category:Aufgaben zu Stochastische Signaltheorie|^3.7 Weitere Verteilungen^]]
+
[[Category:Theory of Stochastic Signals: Exercises|^3.7 Further Distributions^]]

Latest revision as of 17:39, 13 March 2023

Exemplary Chebyshev bound
Values of the  "complementary Gaussian error function"

If nothing else is known about a random variable  $x$  than only

  • the mean value  $m_x$,  and
  • the standard deviation  $\sigma_x$,


so the  "Chebyshev's Inequality"  gives an upper bound on the probability that $x$  deviates by more than a value  $\varepsilon$  from its mean.  This bound is:

$${\rm Pr}(|x-m_x|\ge \varepsilon) \le {\sigma_x^{\rm 2}}/{\varepsilon^{\rm 2}}.$$

To explain:

  • In the graph,  this upper bound is drawn in red.
  • The green curve shows the actual probability for the uniform distribution.
  • The blue points are for the exponential distribution.


From this plot it can be seen that the  "Chebyshev's Inequality"  is only a very rough bound. 
It should be used only if really only the mean and the standard deviation are known from the random size.



Hints:

  • On the right,  values of the complementary Gaussian error function  ${\rm Q}(x)$  are given.



Questions

1

Which of the following statements are true?

Conceivably,  a random variable with  ${\rm Pr}(|x -m_x | \ge 3\sigma_x) = 1/4$.
"Chebyshev"  yields for  $\varepsilon < \sigma_x$  no information.
${\rm Pr}(|x -m_x | \ge \sigma_x)$  is identically zero for large  $\varepsilon$  if  $x$  is bounded.

2

It holds  $k = 1, \ 2, \ 3, \ 4$.  Give the excess probability  $p_k = {\rm Pr}(|x -m_x | \ge k \cdot \sigma_x)$  for the Gaussian distribution.  How large is  $p_3$?

${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $

$\ \%$

3

What are the excess probabilities  $p_k$  for the  exponential distribution.  Here   $m_x = \sigma_x = 1/\lambda$.  What is  $p_3$?

${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $

$\ \%$


Solution

(1)  Correct are  the proposed solutions 2 and 3:

  • The first statement is false.  Here,  Chebyshev's inequality provides the bound  $1/9$.
  • For no distribution the probability considered here can be equal  $1/4$.
  • For  $\varepsilon < \sigma_x$   ⇒   Chebyshev yields a probability greater  $1$.  This information is useless.
  • The last statement is true.  For example,  with the uniform distribution:
$${\rm Pr}(| x- m_x | \ge \varepsilon)=\left\{ \begin{array}{*{4}{c}} 1-{\varepsilon}/{\varepsilon_{\rm 0}} & \rm for\hspace{0.1cm}{\it \varepsilon<\varepsilon_{\rm 0}=\sqrt{\rm 3}\cdot\sigma_x},\\\rm 0 & \rm else. \end{array} \right. $$


(2)  For the Gaussian distribution holds:

$$p_k={\rm Pr}(| x-m_x| \ge k\cdot\sigma_{x})=\rm 2\cdot \rm Q(\it k).$$
  • This results in the following numerical values  $($in brackets:   bound according to Chebyshev$)$:
$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x}) = 31.7 \% \hspace{0.3cm}(100 \%),$$
$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x}) = 4.54 \% \hspace{0.3cm}(25 \%),$$
$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})\hspace{0.15cm}\underline{ = 0.26 \%} \hspace{0.3cm}(11.1 \%),$$
$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = 0.0064 \% \hspace{0.3cm}(6.25 \%).$$


(3)  Without restricting generality,  we set  $\lambda = 1$   ⇒   $m_x = \sigma_x = 1$.  Then holds:

$${\rm Pr}(|x - m_x| \ge k\cdot\sigma_{x}) = {\rm Pr}(| x-1| \ge k).$$
  • Since in this special case the random variable is always  $x >0$,  it further holds:
$$p_k= {\rm Pr}( x \ge k+1)=\int_{k+\rm 1}^{\infty}\hspace{-0.15cm} {\rm e}^{-x}\, {\rm d} x={\rm e}^{-( k + 1)}.$$
  • This yields the following numerical values for the exponential distribution:
$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x})= \rm e^{-2}= \rm 13.53\%,$$
$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x})= \rm \rm e^{-3}=\rm 4.97\% ,$$
$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})= \rm \rm e^{-4}\hspace{0.15cm}\underline{ =\rm 1.83\% },$$
$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = \rm e^{-5}= \rm 0.67\%.$$