Stetige Gleichverteilung

Dichtefunktion der Gleichverteilung für a = 4 , b = 8 {\displaystyle a=4,b=8} (blau), a = 1 , b = 18 {\displaystyle a=1,b=18} (grün) und a = 1 , b = 11 {\displaystyle a=1,b=11} (rot)

Die stetige Gleichverteilung, auch Rechteckverteilung, kontinuierliche Gleichverteilung oder Uniformverteilung genannt, ist eine stetige Wahrscheinlichkeitsverteilung. Sie hat auf einem Intervall [ a , b ] {\displaystyle [a,b]} eine konstante Wahrscheinlichkeitsdichte. Dies ist gleichbedeutend damit, dass alle Teilintervalle gleicher Länge dieselbe Wahrscheinlichkeit besitzen.

Die Möglichkeit, die stetige Gleichverteilung auf dem Intervall von 0 bis 1 zu simulieren, bildet die Basis zur Erzeugung zahlreicher beliebig verteilter Zufallszahlen mittels der Inversionsmethode oder der Verwerfungsmethode.

Definition

Eine stetige Zufallsvariable X {\displaystyle X} bezeichnet man als gleichverteilt auf dem Intervall [ a , b ] {\displaystyle [a,b]} , wenn Dichtefunktion f ( x ) {\displaystyle f(x)} und Verteilungsfunktion F ( x ) {\displaystyle F(x)} gegeben sind als

f ( x ) = { 1 b a a x b 0 sonst. = 1 12 σ 2 rect ( x μ 12 σ 2 ) {\displaystyle f(x)={\begin{cases}{\frac {1}{b-a}}&a\leq x\leq b\\0&{\text{sonst.}}\end{cases}}={\frac {1}{\sqrt {12\sigma ^{2}}}}\cdot {\text{rect}}\left({\frac {x-\mu }{\sqrt {12\sigma ^{2}}}}\right)}
F ( x ) = { 0 x a x a b a a < x < b 1 x b {\displaystyle F(x)={\begin{cases}0&x\leq a\\{\frac {x-a}{b-a}}&a<x<b\\1&x\geq b\end{cases}}}

Als abkürzende Schreibweise für die stetige Gleichverteilung wird häufig U ( a , b ) {\displaystyle {\mathcal {U}}(a,b)} oder S G ( a , b ) {\displaystyle {\mathcal {SG}}(a,b)} verwendet. In einigen Formeln sieht man auch Gleich ( a , b ) {\displaystyle {\text{Gleich}}(a,b)} oder uniform ( a , b ) {\displaystyle {\text{uniform}}(a,b)} als Bezeichnung für die Verteilung. Die stetige Gleichverteilung ist durch ihre ersten beiden zentralen Momente komplett beschrieben, d. h. alle höheren Momente sind aus Erwartungswert und Varianz berechenbar.

Eigenschaften

Wahrscheinlichkeiten

Die Wahrscheinlichkeit, dass eine auf [ a , b ] {\displaystyle [a,b]} gleichverteilte Zufallsvariable X {\displaystyle X} in einem Teilintervall [ c , d ] [ a , b ] {\displaystyle [c,d]\subseteq [a,b]} liegt, ist gleich dem Verhältnis der Intervalllängen:

P ( c X d ) = F ( d ) F ( c ) = d c b a {\displaystyle P(c\leq X\leq d)=F(d)-F(c)={\frac {d-c}{b-a}}} .

Erwartungswert und Median

Der Erwartungswert und der Median der stetigen Gleichverteilung sind gleich der Mitte des Intervalls [ a , b ] {\displaystyle [a,b]} :

E ( X ) = x f ( x ) d x = 1 b a a b x 1 d x = 1 2 b 2 a 2 b a = a + b 2 {\displaystyle \operatorname {E} (X)=\int \limits _{-\infty }^{\infty }xf(x)\,dx={\frac {1}{b-a}}\int \limits _{a}^{b}x\cdot 1\,dx={\frac {1}{2}}{\frac {b^{2}-a^{2}}{b-a}}={\frac {a+b}{2}}}
Median ( X ) = F 1 ( 1 2 ) = a + b 2 {\displaystyle \operatorname {Median} (X)=F^{-1}({\tfrac {1}{2}})={\frac {a+b}{2}}} .

Varianz

Die Varianz der stetigen Gleichverteilung ist

Var ( X ) = E ( X 2 ) ( E ( X ) ) 2 = 1 b a a b x 2 1 d x ( a + b 2 ) 2 = 1 3 b 3 a 3 b a ( a + b 2 ) 2 = 1 12 ( 4 b 2 + 4 a b + 4 a 2 3 a 2 6 a b 3 b 2 ) = 1 12 ( b a ) 2 . {\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} (X^{2})-\left({\operatorname {E} (X)}\right)^{2}={\frac {1}{b-a}}\int \limits _{a}^{b}{x^{2}\cdot 1\,dx}-\left({\frac {a+b}{2}}\right)^{2}={\frac {1}{3}}{\frac {b^{3}-a^{3}}{b-a}}-\left({\frac {a+b}{2}}\right)^{2}\\&={\frac {1}{12}}\left({4b^{2}+4ab+4a^{2}-3a^{2}-6ab-3b^{2}}\right)={\frac {1}{12}}(b-a)^{2}.\end{aligned}}}

Standardabweichung und weitere Streumaße

Aus der Varianz erhält man die Standardabweichung

σ ( X ) = ( b a ) 2 12 = b a 2 3 0,289 ( b a ) {\displaystyle \sigma (X)={\sqrt {\frac {(b-a)^{2}}{12}}}={\frac {b-a}{2{\sqrt {3}}}}\approx 0{,}289(b-a)} .

Die mittlere absolute Abweichung beträgt ( b a ) / 4 {\displaystyle (b-a)/4} , und der Interquartilsabstand ( b a ) / 2 {\displaystyle (b-a)/2} ist genau doppelt so groß. Die Gleichverteilung ist die einzige symmetrische Verteilung mit monotoner Dichte mit dieser Eigenschaft.

Variationskoeffizient

Für den Variationskoeffizienten ergibt sich:

VarK ( X ) = 1 3 b a a + b {\displaystyle \operatorname {VarK} (X)={\frac {1}{\sqrt {3}}}{\frac {b-a}{a+b}}} .

Symmetrie

Die stetige Gleichverteilung ist symmetrisch um a + b 2 {\displaystyle {\frac {a+b}{2}}} .

Schiefe

Die Schiefe lässt sich darstellen als

v ( X ) = 0 {\displaystyle \operatorname {v} (X)=0} .

Wölbung und Exzess

Die Wölbung β 2 {\displaystyle \beta _{2}} und der Exzess γ 2 = β 2 3 {\displaystyle \gamma _{2}=\beta _{2}-3} lassen sich ebenfalls geschlossen darstellen als

β 2 = 9 5 = 1 , 8 {\displaystyle \beta _{2}={\tfrac {9}{5}}=1{,}8} bzw.
γ 2 = 6 5 = 1 , 2 {\displaystyle \gamma _{2}=-{\tfrac {6}{5}}=-1{,}2} .

Momente

k {\displaystyle k} -tes Moment m k = 1 k + 1 i = 0 k a i b k i = 1 k + 1 i = 0 k ( μ 3 σ 2 ) i ( μ + 3 σ 2 ) k i {\displaystyle m_{k}={\frac {1}{k+1}}\sum _{i=0}^{k}a^{i}b^{k-i}={\frac {1}{k+1}}\sum _{i=0}^{k}\left(\mu -{\sqrt {3\sigma ^{2}}}\right)^{i}\left(\mu +{\sqrt {3\sigma ^{2}}}\right)^{k-i}}
k {\displaystyle k} -tes zentrales Moment μ k = { ( b a ) k 2 k ( k + 1 )  k gerade 0  k ungerade = { 3 k σ k ( k + 1 )  k gerade 0  k ungerade {\displaystyle \mu _{k}={\begin{cases}{\frac {(b-a)^{k}}{2^{k}(k+1)}}&{\text{ k gerade}}\\0&{\text{ k ungerade}}\end{cases}}={\begin{cases}{\frac {{\sqrt {3}}^{k}\sigma ^{k}}{(k+1)}}&{\text{ k gerade}}\\0&{\text{ k ungerade}}\end{cases}}}

Summe gleichverteilter Zufallsvariablen

Verteilungsdichten der Summe von bis zu 6 Gleichverteilungen U(0,1)

Die Summe zweier unabhängiger und stetig gleichverteilter Zufallsvariablen ist dreiecksverteilt, falls die Breite der beiden Träger identisch ist. Unterscheiden sich die Trägerbreiten, so ergibt sich eine trapezförmige Verteilung. Genauer:

Zwei Zufallsvariablen seien unabhängig und stetig gleichverteilt, die eine auf dem Intervall [ a , b ] {\displaystyle [a,b]} , die andere auf dem Intervall [ c , d ] {\displaystyle [c,d]} . Sei α = min { d c , b a } {\displaystyle \alpha =\min\{d-c,b-a\}} und β = max { d c , b a } {\displaystyle \beta =\max\{d-c,b-a\}} . Dann hat ihre Summe die folgende Trapezverteilung:

f : R R , x { 0 x [ a + c , b + d ] x α β a + c α β x [ a + c , a + c + α ] 1 β x [ a + c + α , a + c + β ] b + d α β x α β x [ a + c + β , b + d ] {\displaystyle f\colon \mathbb {R} \to \mathbb {R} ,x\longmapsto {\begin{cases}0&x\not \in [a+c,b+d]\\{\frac {x}{\alpha \beta }}-{\frac {a+c}{\alpha \beta }}&x\in [a+c,a+c+\alpha ]\\{\frac {1}{\beta }}&x\in [a+c+\alpha ,a+c+\beta ]\\{\frac {b+d}{\alpha \beta }}-{\frac {x}{\alpha \beta }}&x\in [a+c+\beta ,b+d]\end{cases}}}

Die Summe von unabhängigen gleichverteilten Zufallsvariablen auf dem Intervall [0;1] ist eine Irwin-Hall-Verteilung, sie nähert sich der Normalverteilung an (Zentraler Grenzwertsatz).

Eine zuweilen verwendete Methode (Zwölferregel) zur approximativen Erzeugung (standard-)normalverteilter Zufallszahlen funktioniert so: man summiert 12 (unabhängige) auf dem Intervall [0,1] gleichverteilte Zufallszahlen und subtrahiert 6 (das liefert die richtigen Momente, da die Varianz einer U(0,1)-verteilten Zufallsvariablen 1/12 ist und sie den Erwartungswert 1/2 besitzt).

Charakteristische Funktion

Die charakteristische Funktion hat die Form

ϕ X ( t ) = 1 ( b a ) i t ( e i t b e i t a ) = exp ( i b + a 2 t ) sin ( b a 2 t ) b a 2 t {\displaystyle \phi _{X}(t)={\frac {1}{(b-a)it}}\left(e^{itb}-e^{ita}\right)=\exp \left(i{\frac {b+a}{2}}t\right){\frac {\sin \left({\frac {b-a}{2}}t\right)}{{\frac {b-a}{2}}t}}} ,

wobei i {\displaystyle i} die imaginäre Einheit darstellt.

Momenterzeugende Funktion

Die momenterzeugende Funktion der stetigen Gleichverteilung ist

m X ( s ) = { e b s e a s ( b a ) s s 0 1 s = 0 {\displaystyle m_{X}(s)={\begin{cases}{\frac {\displaystyle e^{bs}-e^{as}}{\displaystyle (b-a)s}}&s\neq 0\\1&s=0\end{cases}}}

und speziell für a = 0 {\displaystyle a=0} und b = 1 {\displaystyle b=1}

m X ( s ) = 1 s ( e s 1 ) . {\displaystyle m_{X}(s)={\frac {1}{s}}(e^{s}-1).}

Beziehung zu anderen Verteilungen

Beziehung zur Dreiecksverteilung

Die Summe von zwei unabhängigen und stetig gleichverteilten Zufallsvariablen hat eine Dreiecksverteilung.

Beziehung zur Betaverteilung

Sind X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\dotsc ,X_{n}} unabhängige auf [ 0 , 1 ] {\displaystyle [0,1]} stetig gleichverteilte Zufallsvariable, dann haben die Ordnungsstatistiken X ( 1 ) , X ( 2 ) , , X ( n ) {\displaystyle X_{(1)},X_{(2)},\dotsc ,X_{(n)}} eine Betaverteilung. Genauer gilt

X ( k ) B ( k , n k + 1 ) {\displaystyle X_{(k)}\sim B(k,n-k+1)}

für k = 1 , , n {\displaystyle k=1,\dotsc ,n} .

Simulation von Verteilungen aus der stetigen Gleichverteilung

Mit der Inversionsmethode lassen sich gleichverteilte Zufallszahlen in andere Verteilungen überführen. Wenn X {\displaystyle X} eine gleichverteilte Zufallsvariable ist, dann genügt beispielsweise Y = 1 λ ln ( X ) {\displaystyle Y=-{\tfrac {1}{\lambda }}\ln(X)} der Exponentialverteilung mit dem Parameter λ {\displaystyle \lambda } .

Verallgemeinerung auf höhere Dimensionen

Die stetige Gleichverteilung lässt sich vom Intervall [ a , b ] {\displaystyle [a,b]} auf beliebige messbare Teilmengen Ω {\displaystyle \Omega } des R n {\displaystyle \mathbb {R} ^{n}} mit Lebesgue-Maß 0 < λ n ( Ω ) < {\displaystyle 0<\lambda ^{n}(\Omega )<\infty } verallgemeinern. Man setzt dann

U Ω ( A ) = A 1 λ n ( Ω ) d x = λ n ( A ) λ n ( Ω ) {\displaystyle {\mathcal {U}}_{\Omega }(A)=\int _{A}{\frac {1}{\lambda ^{n}(\Omega )}}\,dx={\frac {\lambda ^{n}(A)}{\lambda ^{n}(\Omega )}}}

für messbare A Ω {\displaystyle A\subseteq \Omega } .

Diskreter Fall

Die Gleichverteilung ist auch auf endlichen Mengen definiert, dann heißt sie diskrete Gleichverteilung.

Beispiel für das Intervall [0, 1]

Häufig wird a = 0 {\displaystyle a=0} und b = 1 {\displaystyle b=1} angenommen, also X U ( 0 , 1 ) {\displaystyle X\sim {\mathcal {U}}(0,1)} betrachtet. Dann ist die Dichtefunktion f {\displaystyle f} auf dem Intervall [ 0 , 1 ] {\displaystyle [0,1]} konstant gleich 1 und für die Verteilungsfunktion gilt dort F ( x ) = x {\displaystyle F(x)=x} . Der Erwartungswert beträgt dementsprechend E ( X ) = 1 2 {\displaystyle E(X)={\tfrac {1}{2}}} , die Varianz Var ( X ) = 1 12 {\displaystyle \operatorname {Var} (X)={\tfrac {1}{12}}} und die Standardabweichung σ ( X ) = 1 12 = 1 6 3 0 , 29 {\displaystyle \sigma (X)={\sqrt {\tfrac {1}{12}}}={\tfrac {1}{6}}{\sqrt {3}}\approx 0{,}29} , wobei die letztgenannten beiden Werte auch für beliebige Intervalle [ a , a + 1 ] {\displaystyle [a,a+1]} der Länge 1 gelten. Siehe hierzu auch den obigen Abschnitt Summe gleichverteilter Zufallsvariablen.

Ist X {\displaystyle X} eine U ( 0 , 1 ) {\displaystyle {\mathcal {U}}(0,1)} -verteilte Zufallsvariable, dann ist

Y = ( b a ) X + a {\displaystyle Y=(b-a)X+a}

U ( a , b ) {\displaystyle {\mathcal {U}}(a,b)} -verteilt.

Siehe auch

Literatur

  • Christian Hesse: Angewandte Wahrscheinlichkeitstheorie. 1. Auflage. Vieweg, Wiesbaden 2003, ISBN 3-528-03183-2, S. 155–156, doi:10.1007/978-3-663-01244-3. 
Diskrete univariate Verteilungen

Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | Dirac | diskret uniform | empirisch | hypergeometrisch | kategorial | negativ hypergeometrisch | Rademacher | verallgemeinert binomial | Zipf | Zipf-Mandelbrot | Zweipunkt

Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | discrete-Phase-Type | erweitert negativ binomial | Gauss-Kuzmin | gemischt Poisson | geometrisch | logarithmisch | negativ binomial | parabolisch-fraktal | Poisson | Skellam | verallgemeinert Poisson | Yule-Simon | Zeta

Kontinuierliche univariate Verteilungen

Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | Trapez | U-quadratisch | stetig uniform | Wigner-Halbkreis

Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi | Chi-Quadrat | Coxian | Erlang | Exponential | Extremwert | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hartman-Watson | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Kolmogorow-Verteilung | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda

Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt

Multivariate Verteilungen

Diskrete multivariate Verteilungen:
Dirichlet compound multinomial | Ewens | gemischt Multinomial | multinomial | multivariat hypergeometrisch | multivariat Poisson | negativmultinomial | Pólya/Eggenberger | polyhypergeometrisch

Kontinuierliche multivariate Verteilungen:
Dirichlet | GEM | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma | Poisson-Dirichlet

Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit | Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Matrix-Von-Mises-Fisher-Verteilung | Normal-invers-Wishart | Normal-Wishart | Wishart