Difference between revisions of "Aufgaben:Exercise 3.11: Chebyshev's Inequality"

From LNTwww
 
(7 intermediate revisions by 3 users not shown)
Line 1: Line 1:
  
{{quiz-Header|Buchseite=Stochastische Signaltheorie/Weitere Verteilungen
+
{{quiz-Header|Buchseite=Theory_of_Stochastic_Signals/Further_Distributions
 
}}
 
}}
  
[[File:EN_Sto_A_3_11.png|right|frame|Beispielhafte Tschebyscheffsch–Schranke]]
+
[[File:EN_Sto_A_3_11_neu.png|right|frame|Exemplary Chebyshev bound]]
Ist über eine Zufallsgröße  $x$  nichts weiter bekannt als nur
 
*der Mittelwert  $m_x$  und
 
*die Streuung  $\sigma_x$,
 
  
 +
[[File:P_ID921__Sto_A_3_11_b.png|frame|Values of the  "complementary Gaussian error function"]]
 +
If nothing else is known about a random variable  $x$  than only
 +
*the mean value  $m_x$,  and
 +
*the standard deviation  $\sigma_x$,
  
so gibt die&nbsp;  <i>Tschebyscheffsche Ungleichung</i>&nbsp; eine obere Schranke f&uuml;r die Wahrscheinlichkeit an, dass&nbsp; $x$&nbsp; betragsm&auml;&szlig;ig mehr als einen Wert&nbsp; $\varepsilon$&nbsp; von seinem Mittelwert&nbsp; $m_x$&nbsp; abweicht.
 
  
Diese Schranke lautet:
+
so the&nbsp;  "Chebyshev's Inequality"&nbsp; gives an upper bound on the probability that $x$&nbsp; deviates by more than a value&nbsp; $\varepsilon$&nbsp; from its mean.&nbsp; This bound is:
:$${\rm Pr}(|x-m_x|\ge \varepsilon) \le {\sigma_x^{\rm 2}}/{\varepsilon^{\rm 2}}.$$
+
:$${\rm Pr}(|x-m_x|\ge \varepsilon) \le {\sigma_x^{\rm 2}}/{\varepsilon^{\rm 2}}.$$
  
Zur Erläuterung:
+
To explain:
*In der Grafik ist diese obere Schranke rot eingezeichnet.  
+
*In the graph,&nbsp; this upper bound is drawn in red.  
*Der gr&uuml;ne Kurvenverlauf zeigt die tatsächliche Wahrscheinlichkeit bei der Gleichverteilung.  
+
*The green curve shows the actual probability for the uniform distribution.  
*Die blauen Punkte gelten f&uuml;r die Exponentialverteilung.  
+
*The blue points are for the exponential distribution.  
  
  
Aus dieser Darstellung ist zu erkennen, dass die&nbsp; <i>Tschebyscheffsche Ungleichung</i>&nbsp; nur eine sehr grobe Schranke darstellt.&nbsp; <br>Sie sollte nur dann verwendet werden, wenn von der Zufallsgr&ouml;&szlig;e wirklich nur der Mittelwert und die Streuung bekannt sind.
+
From this plot it can be seen that the&nbsp; "Chebyshev's Inequality"&nbsp; is only a very rough bound.&nbsp; <br>It should be used only if really only the mean and the standard deviation are known from the random size.
 +
 
  
[[File:P_ID921__Sto_A_3_11_b.png|frame|Werte der komplementären Gaußschen Fehlerfunktion]]
 
 
<br>
 
<br>
''Hinweise:''
+
Hints:  
*Die Aufgabe gehört zum  Kapitel&nbsp; [[Theory_of_Stochastic_Signals/Weitere_Verteilungen|Weitere Verteilungen]].
+
*The exercise belongs to the chapter&nbsp; [[Theory_of_Stochastic_Signals/Further_Distributions|"Further Distributions"]].
*Insbesondere wird auf die Seite&nbsp;  [[Theory_of_Stochastic_Signals/Weitere_Verteilungen#Tschebyscheffsche_Ungleichung|Tschebyscheffsche Ungleichung]]&nbsp; Bezug genommen .
+
*In particular,&nbsp; reference is made to the section&nbsp;  [[Theory_of_Stochastic_Signals/Further_Distributions#Chebyshev.27s_inequality|"Chebyshev's inequality"]]&nbsp;.
 
   
 
   
*Rechts sind Werte der komplementären Gaußschen Fehlerfunktion&nbsp; ${\rm Q}(x)$&nbsp; angegeben.
+
*On the right,&nbsp; values of the complementary Gaussian error function&nbsp; ${\rm Q}(x)$&nbsp; are given.
  
  
Line 34: Line 34:
  
  
===Fragebogen===
+
===Questions===
  
 
<quiz display=simple>
 
<quiz display=simple>
{Welche der folgenden Aussagen sind zutreffend?
+
{Which of the following statements are true?
 
|type="[]"}
 
|type="[]"}
- Vorstellbar ist eine Zufallsgröße mit&nbsp; ${\rm Pr}(|x -m_x> | \ge 3\sigma_x) = 1/4$.
+
- Conceivably,&nbsp; a random variable with&nbsp; ${\rm Pr}(|x -m_x | \ge 3\sigma_x) = 1/4$.
+ "Tschebyscheff" liefert f&uuml;r&nbsp; $\varepsilon < \sigma_x$&nbsp; keine Information.
+
+ "Chebyshev"&nbsp; yields for&nbsp; $\varepsilon < \sigma_x$&nbsp; no information.
+ ${\rm Pr}(|x -m_x> | \ge \sigma_x)$&nbsp; ist für große&nbsp; $\varepsilon$&nbsp; identisch Null, wenn&nbsp; $x$&nbsp; begrenzt ist.
+
+ ${\rm Pr}(|x -m_x | \ge \sigma_x)$&nbsp; is identically zero for large&nbsp; $\varepsilon$&nbsp; if&nbsp; $x$&nbsp; is bounded.
  
  
{Es gelte&nbsp; $k = 1, \ 2, \ 3, \ 4$.&nbsp; Geben Sie die Überschreitungswahrscheinlichkeit&nbsp; $p_k = {\rm Pr}(|x -m_x | \ge k \cdot \sigma_x)$&nbsp; für die <u>Gau&szlig;verteilung</u> an.&nbsp; Wie gro&szlig; ist&nbsp; $p_3$?
+
{It holds&nbsp; $k = 1, \ 2, \ 3, \ 4$.&nbsp; Give the excess probability&nbsp; $p_k = {\rm Pr}(|x -m_x | \ge k \cdot \sigma_x)$&nbsp; for the <u>Gaussian distribution</u>.&nbsp; How large is&nbsp; $p_3$?
 
|type="{}"}
 
|type="{}"}
 
${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $ { 0.26 3% } $\ \%$
 
${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $ { 0.26 3% } $\ \%$
  
  
{Welche Überschreitungswahrscheinlichkeiten&nbsp; $p_k$&nbsp; ergeben sich bei der&nbsp; <u>Exponentialverteilung</u>.&nbsp; Hier gilt &nbsp; $m_x = \sigma_x = 1/\lambda$.&nbsp; Wie gro&szlig; ist&nbsp; $p_3$?
+
{What are the excess probabilities&nbsp; $p_k$&nbsp; for the&nbsp; <u>exponential distribution</u>.&nbsp; Here &nbsp; $m_x = \sigma_x = 1/\lambda$.&nbsp; What is&nbsp; $p_3$?
 
|type="{}"}
 
|type="{}"}
 
${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $ { 1.83 3% } $\ \%$
 
${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $ { 1.83 3% } $\ \%$
Line 57: Line 57:
 
</quiz>
 
</quiz>
  
===Musterlösung===
+
===Solution===
 
{{ML-Kopf}}
 
{{ML-Kopf}}
'''(1)'''&nbsp; Richtig sind <u>die Lösungsvorschläge 2 und 3</u>:
+
'''(1)'''&nbsp; Correct are&nbsp; <u>the proposed solutions 2 and 3</u>:
*Die erste Aussage ist falsch.&nbsp; Die Tschebyscheffsche Ungleichung liefert hier die Schranke&nbsp; $1/9$.  
+
*The first statement is false.&nbsp; Here,&nbsp; Chebyshev's inequality provides the bound&nbsp; $1/9$.  
*Bei keiner Verteilung kann die hier betrachtete Wahrscheinlichkeit gleich&nbsp; $1/4$&nbsp; sein.  
+
*For no distribution the probability considered here can be equal&nbsp; $1/4$.  
*Für&nbsp; $\varepsilon < \sigma_x$&nbsp; liefert Tschebyscheff eine Wahrscheinlichkeit gr&ouml;&szlig;er als&nbsp; $1$.&nbsp; Diese Information ist  nutzlos.
+
*For&nbsp; $\varepsilon < \sigma_x$ &nbsp; &rArr; &nbsp; Chebyshev yields a probability greater&nbsp; $1$.&nbsp; This information is useless.
*Die letzte Aussage ist zutreffend.&nbsp; Beispielsweise gilt bei der Gleichverteilung:
+
*The last statement is true.&nbsp; For example,&nbsp; with the uniform distribution:
:$${\rm Pr}(| x- m_x | \ge \varepsilon)=\left\{ \begin{array}{*{4}{c}} 1-{\varepsilon}/{\varepsilon_{\rm 0}} & \rm f\ddot{u}r\hspace{0.1cm}{\it \varepsilon<\varepsilon_{\rm 0}=\sqrt{\rm 3}\cdot\sigma_x},\\\rm 0 & \rm sonst. \end{array} \right. $$
+
:$${\rm Pr}(| x- m_x | \ge \varepsilon)=\left\{ \begin{array}{*{4}{c}} 1-{\varepsilon}/{\varepsilon_{\rm 0}} & \rm for\hspace{0.1cm}{\it \varepsilon<\varepsilon_{\rm 0}=\sqrt{\rm 3}\cdot\sigma_x},\\\rm 0 & \rm else. \end{array} \right. $$
  
'''(2)'''&nbsp; Bei der Gau&szlig;verteilung gilt:
+
 
 +
'''(2)'''&nbsp; For the Gaussian distribution holds:
 
:$$p_k={\rm Pr}(| x-m_x| \ge k\cdot\sigma_{x})=\rm 2\cdot \rm Q(\it k).$$
 
:$$p_k={\rm Pr}(| x-m_x| \ge k\cdot\sigma_{x})=\rm 2\cdot \rm Q(\it k).$$
  
*Daraus ergeben sich folgende Zahlenwerte&nbsp; (in Klammern: &nbsp; Schranke nach Tschebyscheff):
+
*This results in the following numerical values&nbsp; $($in brackets: &nbsp; bound according to Chebyshev$)$:
 
:$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x}) = 31.7 \% \hspace{0.3cm}(100 \%),$$
 
:$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x}) = 31.7 \% \hspace{0.3cm}(100 \%),$$
 
:$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x}) = 4.54 \% \hspace{0.3cm}(25 \%),$$
 
:$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x}) = 4.54 \% \hspace{0.3cm}(25 \%),$$
Line 75: Line 76:
 
:$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = 0.0064 \% \hspace{0.3cm}(6.25 \%).$$
 
:$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = 0.0064 \% \hspace{0.3cm}(6.25 \%).$$
  
'''(3)'''&nbsp; Ohne Einschr&auml;nkung der Allgemeing&uuml;ltigkeit setzen wir&nbsp; $\lambda = 1$
 
&nbsp; &#8658; &nbsp; $m_x = \sigma_x = 1$.&nbsp; Dann gilt:
 
:$${\rm Pr}(|x - m_x| \ge  k\cdot\sigma_{x}) = {\rm Pr}(| x-1| \ge  k).$$
 
  
*Da in diesem Sonderfall die Zufallsgröße stets&nbsp; $x >0$&nbsp; ist, gilt weiter:
+
'''(3)'''&nbsp; Without restricting generality,&nbsp; we set&nbsp; $\lambda = 1$
 +
&nbsp; &#8658; &nbsp; $m_x = \sigma_x = 1$.&nbsp; Then holds:
 +
:$${\rm Pr}(|x - m_x| \ge k\cdot\sigma_{x}) = {\rm Pr}(| x-1| \ge k).$$
 +
 
 +
*Since in this special case the random variable is always&nbsp; $x >0$,&nbsp; it further holds:
 
:$$p_k= {\rm Pr}( x \ge k+1)=\int_{k+\rm 1}^{\infty}\hspace{-0.15cm}
 
:$$p_k= {\rm Pr}( x \ge k+1)=\int_{k+\rm 1}^{\infty}\hspace{-0.15cm}
 
{\rm e}^{-x}\, {\rm d} x={\rm e}^{-( k + 1)}.$$
 
{\rm e}^{-x}\, {\rm d} x={\rm e}^{-( k + 1)}.$$
  
*Daraus ergeben sich für die Exponentialverteilung folgende Zahlenwerte:
+
*This yields the following numerical values for the exponential distribution:
:$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x}) \rm e^{-2}= \rm 13.53\%,$$
+
:$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x})= \rm e^{-2}= \rm 13.53\%,$$
 
:$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x})= \rm \rm e^{-3}=\rm 4.97\% ,$$
 
:$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x})= \rm \rm e^{-3}=\rm 4.97\% ,$$
:$$k= 3\text\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})= \rm \rm e^{-4}\hspace{0.15cm}\underline{ =\rm 1.83\% },$$
+
:$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})= \rm \rm e^{-4}\hspace{0.15cm}\underline{ =\rm 1.83\% },$$
 
:$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = \rm e^{-5}= \rm 0.67\%.$$
 
:$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = \rm e^{-5}= \rm 0.67\%.$$
 
{{ML-Fuß}}
 
{{ML-Fuß}}

Latest revision as of 16:39, 13 March 2023

Exemplary Chebyshev bound
Values of the  "complementary Gaussian error function"

If nothing else is known about a random variable  $x$  than only

  • the mean value  $m_x$,  and
  • the standard deviation  $\sigma_x$,


so the  "Chebyshev's Inequality"  gives an upper bound on the probability that $x$  deviates by more than a value  $\varepsilon$  from its mean.  This bound is:

$${\rm Pr}(|x-m_x|\ge \varepsilon) \le {\sigma_x^{\rm 2}}/{\varepsilon^{\rm 2}}.$$

To explain:

  • In the graph,  this upper bound is drawn in red.
  • The green curve shows the actual probability for the uniform distribution.
  • The blue points are for the exponential distribution.


From this plot it can be seen that the  "Chebyshev's Inequality"  is only a very rough bound. 
It should be used only if really only the mean and the standard deviation are known from the random size.



Hints:

  • On the right,  values of the complementary Gaussian error function  ${\rm Q}(x)$  are given.



Questions

1

Which of the following statements are true?

Conceivably,  a random variable with  ${\rm Pr}(|x -m_x | \ge 3\sigma_x) = 1/4$.
"Chebyshev"  yields for  $\varepsilon < \sigma_x$  no information.
${\rm Pr}(|x -m_x | \ge \sigma_x)$  is identically zero for large  $\varepsilon$  if  $x$  is bounded.

2

It holds  $k = 1, \ 2, \ 3, \ 4$.  Give the excess probability  $p_k = {\rm Pr}(|x -m_x | \ge k \cdot \sigma_x)$  for the Gaussian distribution.  How large is  $p_3$?

${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $

$\ \%$

3

What are the excess probabilities  $p_k$  for the  exponential distribution.  Here   $m_x = \sigma_x = 1/\lambda$.  What is  $p_3$?

${\rm Pr}(|x -m_x | \ge 3 \sigma_x) \ = \ $

$\ \%$


Solution

(1)  Correct are  the proposed solutions 2 and 3:

  • The first statement is false.  Here,  Chebyshev's inequality provides the bound  $1/9$.
  • For no distribution the probability considered here can be equal  $1/4$.
  • For  $\varepsilon < \sigma_x$   ⇒   Chebyshev yields a probability greater  $1$.  This information is useless.
  • The last statement is true.  For example,  with the uniform distribution:
$${\rm Pr}(| x- m_x | \ge \varepsilon)=\left\{ \begin{array}{*{4}{c}} 1-{\varepsilon}/{\varepsilon_{\rm 0}} & \rm for\hspace{0.1cm}{\it \varepsilon<\varepsilon_{\rm 0}=\sqrt{\rm 3}\cdot\sigma_x},\\\rm 0 & \rm else. \end{array} \right. $$


(2)  For the Gaussian distribution holds:

$$p_k={\rm Pr}(| x-m_x| \ge k\cdot\sigma_{x})=\rm 2\cdot \rm Q(\it k).$$
  • This results in the following numerical values  $($in brackets:   bound according to Chebyshev$)$:
$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x}) = 31.7 \% \hspace{0.3cm}(100 \%),$$
$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x}) = 4.54 \% \hspace{0.3cm}(25 \%),$$
$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})\hspace{0.15cm}\underline{ = 0.26 \%} \hspace{0.3cm}(11.1 \%),$$
$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = 0.0064 \% \hspace{0.3cm}(6.25 \%).$$


(3)  Without restricting generality,  we set  $\lambda = 1$   ⇒   $m_x = \sigma_x = 1$.  Then holds:

$${\rm Pr}(|x - m_x| \ge k\cdot\sigma_{x}) = {\rm Pr}(| x-1| \ge k).$$
  • Since in this special case the random variable is always  $x >0$,  it further holds:
$$p_k= {\rm Pr}( x \ge k+1)=\int_{k+\rm 1}^{\infty}\hspace{-0.15cm} {\rm e}^{-x}\, {\rm d} x={\rm e}^{-( k + 1)}.$$
  • This yields the following numerical values for the exponential distribution:
$$k= 1\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge \sigma_{x})= \rm e^{-2}= \rm 13.53\%,$$
$$k= 2\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 2 \cdot \sigma_{x})= \rm \rm e^{-3}=\rm 4.97\% ,$$
$$k= 3\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 3 \cdot\sigma_{x})= \rm \rm e^{-4}\hspace{0.15cm}\underline{ =\rm 1.83\% },$$
$$k= 4\text{:}\hspace{0.5cm} {\rm Pr}(|x-m_x| \ge 4 \cdot \sigma_{x}) = \rm e^{-5}= \rm 0.67\%.$$