Multinomialverteilung

Die Multinomialverteilung oder Polynomialverteilung ist eine Wahrscheinlichkeitsverteilung in der Stochastik. Sie ist eine diskrete Wahrscheinlichkeitsverteilung und kann als multivariate Verallgemeinerung der Binomialverteilung aufgefasst werden. Sie hat in der Bayesschen Statistik als konjugierte A-priori-Verteilung die Dirichlet-Verteilung.

Definition und Modell

Seien n , k N 0 {\displaystyle n,k\in \mathbb {N} _{0}} und p 1 , , p k [ 0 , 1 ] {\displaystyle p_{1},\dotsc ,p_{k}\in [0,1]} mit p 1 + + p k = 1 {\displaystyle p_{1}+\dotsb +p_{k}=1} . Dann ist die Zähldichte der Multinomialverteilung M ( n , ( p 1 , , p k ) ) {\displaystyle M(n,(p_{1},\dotsc ,p_{k}))} gegeben durch

f ( n 1 , , n k ) = { ( n n 1 , , n k ) p 1 n 1 p k n k , wenn  n 1 , , n k N 0  und  n 1 + + n k = n , 0 sonst. {\displaystyle f(n_{1},\dotsc ,n_{k})\;=\;{\begin{cases}{n \choose n_{1},\dotsc ,n_{k}}\;p_{1}^{n_{1}}\dotsm p_{k}^{n_{k}}{\text{,}}&{\text{wenn }}n_{1},\dotsc ,n_{k}\in \mathbb {N} _{0}{\text{ und }}n_{1}+\dotsb +n_{k}=n,\\0&{\text{sonst.}}\end{cases}}} .

Hierbei ist ( n n 1 , , n k ) = n ! n 1 ! n k ! {\displaystyle {n \choose n_{1},\dotsc ,n_{k}}={\frac {n!}{n_{1}!\dotsm n_{k}!}}} der Multinomialkoeffizient.

Anwendung und Motivation

Die Multinomialverteilung kann ausgehend von einem Urnenmodell mit Zurücklegen motiviert werden. In einer Urne sind k {\displaystyle k} Sorten Kugeln. Der Anteil der Sorten Kugeln in der Urne ist p i , ( i { 1 , , k } ) {\displaystyle p_{i},(i\in \{1,\dotsc ,k\})} . Der Urne wird n {\displaystyle n} -mal jeweils eine Kugel entnommen, ihre Eigenschaft (Sorte) notiert und die Kugel danach wieder in die Urne zurückgelegt.

Man interessiert sich nun für die Anzahl x i {\displaystyle x_{i}} der Kugeln einer jeden Sorte i {\displaystyle i} in dieser Stichprobe. Da ( X 1 , , X k ) {\displaystyle (X_{1},\dotsc ,X_{k})} der Multinomialverteilung folgt, besitzt die Stichprobe x 1 , , x k {\displaystyle x_{1},\dotsc ,x_{k}} die Wahrscheinlichkeit:

P ( X 1 = x 1 , X 2 = x 2 , , X k = x k ) = n ! x 1 ! x 2 ! x k ! p 1 x 1 p 2 x 2 p k x k {\displaystyle P(X_{1}=x_{1},X_{2}=x_{2},\dotsc ,X_{k}=x_{k})={\frac {n!}{x_{1}!\cdot x_{2}!\dotsm x_{k}!}}p_{1}^{x_{1}}\cdot p_{2}^{x_{2}}\dotsm p_{k}^{x_{k}}} .

Nimmt man eine Urne mit k = 6 {\displaystyle k=6} Sorten Kugeln mit jeweils einer Kugel pro Sorte, so erhält man den klassischen Würfel: Man wirft diesen n {\displaystyle n} -mal, hat dabei k = 6 {\displaystyle k=6} mögliche Ausgänge und interessiert sich dafür, wie groß die Wahrscheinlichkeit dafür ist, dass X 1 {\displaystyle X_{1}} gerade x 1 {\displaystyle x_{1}} -mal auftritt, X 2 {\displaystyle X_{2}} gerade x 2 {\displaystyle x_{2}} -mal und so weiter. Weiter beschreiben die jeweiligen p {\displaystyle p} die Wahrscheinlichkeiten der Würfelflächen und somit, ob es sich um einen fairen oder unfairen Würfel handelt.

Eigenschaften

Erwartungswert

Für jedes i {\displaystyle i} ist die Zufallsvariable X i {\displaystyle X_{i}} binomialverteilt mit den Parametern n {\displaystyle n} und p i {\displaystyle p_{i}} , hat also den Erwartungswert

E ( X i ) = n p i {\displaystyle \operatorname {E} (X_{i})=np_{i}}

Varianz

Für die Varianz gilt

Var ( X i ) = n p i ( 1 p i ) {\displaystyle \operatorname {Var} (X_{i})=np_{i}(1-p_{i})} .

Kovarianz und Korrelationskoeffizient

Die Kovarianz zweier Zufallsvariablen X i {\displaystyle X_{i}} und X j {\displaystyle X_{j}} mit i j {\displaystyle i\neq j} berechnet sich als

Cov ( X i , X j ) = n p i p j {\displaystyle \operatorname {Cov} (X_{i},X_{j})=-np_{i}p_{j}} ,

und für den Korrelationskoeffizienten (nach Pearson) folgt:

ϱ ( X i , X j ) = p i 1 p i p j 1 p j {\displaystyle \varrho (X_{i},X_{j})=-{\sqrt {{\frac {p_{i}}{1-p_{i}}}{\frac {p_{j}}{1-p_{j}}}}}} .

Wahrscheinlichkeitserzeugende Funktion

Die multivariate wahrscheinlichkeitserzeugende Funktion ist

m X ( t ) = ( i = 1 k p i t i ) n {\displaystyle m_{X}(t)=\left(\sum _{i=1}^{k}p_{i}t_{i}\right)^{n}}

Beispiel

In einer Schulklasse sind 31 Schüler, 12 aus Dorf A, 11 aus Dorf B und 8 aus Dorf C. Jeden Tag wird ein Schüler ausgelost, der die Tafel wischen muss. Wie groß ist die Wahrscheinlichkeit, dass in einer Woche kein Schüler aus Dorf A, zwei Schüler aus Dorf B und 3 Schüler aus Dorf C die Tafel wischen müssen? Es ist n A = 0 , n B = 2 , n C = 3 {\displaystyle n_{\mathrm {A} }=0,n_{\mathrm {B} }=2,n_{\mathrm {C} }=3} und p A = 12 31 , p B = 11 31 , p C = 8 31 {\displaystyle p_{\mathrm {A} }={\frac {12}{31}},p_{\mathrm {B} }={\frac {11}{31}},p_{\mathrm {C} }={\frac {8}{31}}} , da jeder Schüler gleich wahrscheinlich gezogen werden soll. Dann ist M ( ( 0 , 2 , 3 ) , p A , p B , p C ) = 5 ! 0 ! 2 ! 3 ! ( 11 31 ) 2 ( 8 31 ) 3 = 10 11 2 8 3 31 5 0,022 {\displaystyle M((0,2,3),p_{\mathrm {A} },p_{\mathrm {B} },p_{\mathrm {C} })={\frac {5!}{0!2!3!}}\left({\frac {11}{31}}\right)^{2}\left({\frac {8}{31}}\right)^{3}={\frac {10\cdot 11^{2}\cdot 8^{3}}{31^{5}}}\approx 0{,}022}

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Im Spezialfall k = 2 {\displaystyle k=2} ergibt sich die Binomialverteilung, genauer ist M ( n , ( p , 1 p ) ) {\displaystyle M(n,(p,1-p))} die gemeinsame Verteilung von X {\displaystyle X} und n X {\displaystyle n-X} für eine B ( n , p ) {\displaystyle B(n,p)} -verteilte Zufallsvariable X {\displaystyle X} .

Beziehung zur multivariaten hypergeometrischen Verteilung

Die Multinomialverteilung und die multivariate hypergeometrische Verteilung sind miteinander verwandt, da sie aus demselben Urnenmodell hervorgehen. Einziger Unterschied ist, dass bei der multivariaten hypergeometrischen Verteilung ohne Zurücklegen gezogen wird. Die multivariate hypergeometrische Verteilung lässt sich unter gewissen Umständen durch die Multinomialverteilung approximieren, siehe hierfür den Artikel über die multivariate hypergeometrische Verteilung.

Siehe auch

Literatur

  • Norbert Henze: Stochastik für Einsteiger, Wiesbaden: Vieweg 1997, 11. Auflage Springer Spektrum 2016, ISBN 978-3-658-14738-9, doi:10.1007/978-3-658-03077-3, S. 144-147
  • Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage, Vieweg, 2005. ISBN 978-3-834-80063-3
  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik, 4. Auflage, de Gruyter, 2009. ISBN 978-3-110-21526-7
  • Christian Hesse: Angewandte Wahrscheinlichkeitstheorie: eine fundierte Einführung mit über 500 realitätsnahen Beispielen und Aufgaben, Vieweg, Braunschweig/Wiesbaden 2003, ISBN 978-3-528-03183-1.

Weblinks

Diskrete univariate Verteilungen

Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | Dirac | diskret uniform | empirisch | hypergeometrisch | kategorial | negativ hypergeometrisch | Rademacher | verallgemeinert binomial | Zipf | Zipf-Mandelbrot | Zweipunkt

Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | discrete-Phase-Type | erweitert negativ binomial | Gauss-Kuzmin | gemischt Poisson | geometrisch | logarithmisch | negativ binomial | parabolisch-fraktal | Poisson | Skellam | verallgemeinert Poisson | Yule-Simon | Zeta

Kontinuierliche univariate Verteilungen

Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | Trapez | U-quadratisch | stetig uniform | Wigner-Halbkreis

Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi | Chi-Quadrat | Coxian | Erlang | Exponential | Extremwert | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hartman-Watson | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Kolmogorow-Verteilung | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda

Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt

Multivariate Verteilungen

Diskrete multivariate Verteilungen:
Dirichlet compound multinomial | Ewens | gemischt Multinomial | multinomial | multivariat hypergeometrisch | multivariat Poisson | negativmultinomial | Pólya/Eggenberger | polyhypergeometrisch

Kontinuierliche multivariate Verteilungen:
Dirichlet | GEM | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma | Poisson-Dirichlet

Multivariate Matrixverteilungen:
Gleichverteilung auf der Stiefel-Mannigfaltigkeit | Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Matrix-Von-Mises-Fisher-Verteilung | Normal-invers-Wishart | Normal-Wishart | Wishart