Distribució hipergeomètrica

Infotaula distribució de probabilitatDistribució hipergeomètrica
Tipusdistribució univariant i distribució de probabilitat discreta Modifica el valor a Wikidata
Paràmetres N 1 , 2 , m 0 , 1 , 2 , , N n 1 , 2 , , N {\displaystyle {\begin{aligned}N&\in 1,2,\dots \\m&\in 0,1,2,\dots ,N\\n&\in 1,2,\dots ,N\end{aligned}}\,}
Suport k max ( 0 , n + m N ) , , min ( m , n ) {\displaystyle \scriptstyle {k\,\in \,\max {(0,\,n+m-N)},\,\dots ,\,\min {(m,\,n)}}\,}
Esperança matemàtica n m N {\displaystyle nm \over N}
Moda ( n + 1 ) ( m + 1 ) N + 2 {\displaystyle \left\lfloor {\frac {(n+1)(m+1)}{N+2}}\right\rfloor }
Variància n m ( N n ) ( N m ) N 2 ( N 1 ) {\displaystyle nm(N-n)(N-m) \over N^{2}(N-1)}
Coeficient de simetria ( N 2 m ) ( N 1 ) 1 2 ( N 2 n ) [ n m ( N m ) ( N n ) ] 1 2 ( N 2 ) {\displaystyle {\frac {(N-2m)(N-1)^{\frac {1}{2}}(N-2n)}{[nm(N-m)(N-n)]^{\frac {1}{2}}(N-2)}}}
Curtosi [ N 2 ( N 1 ) n ( N 2 ) ( N 3 ) ( N n ) ] {\displaystyle \left[{\frac {N^{2}(N-1)}{n(N-2)(N-3)(N-n)}}\right]}

[ N ( N + 1 ) 6 N ( N n ) m ( N m ) {\displaystyle \cdot \left[{\frac {N(N+1)-6N(N-n)}{m(N-m)}}\right.}

+ 3 n ( N n ) ( N + 6 ) N 2 6 ] {\displaystyle +\left.{\frac {3n(N-n)(N+6)}{N^{2}}}-6\right]}
FC ( N m n ) 2 F 1 ( n , m ; N m n + 1 ; e i t ) ( N n ) {\displaystyle {\frac {{N-m \choose n}\scriptstyle {\,_{2}F_{1}(-n,-m;N-m-n+1;e^{it})}}{N \choose n}}}
MathworldHypergeometricDistribution Modifica el valor a Wikidata

La distribució hipergeomètrica, en estadística i teoria de probabilitat, és una distribució de probabilitat que descriu el nombre d'èxits en una seqüència de n extraccions d'una població finita sense reposició, això és el contrari de la distribució binomial, que descriu el nombre d'èxits d'extraccions amb reposició.[1]

Per tant, aquesta distribució ens permet calcular la probabilitat que tinguem k èxits extraient n boles.

Il·lustrem la notació en aquesta taula:

èxit fracàs total
blanca k mk m
negra nk N + k − n − m N − m
total n N − n N


Segurament, la forma més fàcil d'entendre aquesta distribució és en termes d'un models d'urnes. Suposeu que heu d'extreure "n" boles sense reposició d'una urna que conté "N" boles en total, "m" de les quals són blanques. La distribució hipergeomètrica descriu la distribució del nombre de boles blanques de l'urna.

Una variable aleatòria X segueix la distribució hipergeomètrica amb paràmetres N, m i n si la probabilitat s'expressa per

P ( X = k ) = ( m k ) ( N m n k ) ( N n ) , {\displaystyle P(X=k)={{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}},}

on el coeficient binomial ( a b ) {\displaystyle {\tbinom {a}{b}}} es defineix per ser el coeficient de xb a l'expansió del polinomi (1 + x)a.

La probabilitat és positiva quan max(0, n + mN) ≤ k ≤ min(m, n).

La fórmula es pot entendre així: Hi ha ( N n ) {\displaystyle {\tbinom {N}{n}}} extraccions possibles (sense reposició). Hi ha ( m k ) {\displaystyle {\tbinom {m}{k}}} formes d'obtenir k boles blanques i ( N m n k ) {\displaystyle {\tbinom {N-m}{n-k}}} formes d'emplenar la resta de la mostra amb boles negres.

La suma de probabilitats per a tots els valors possibles de k és igual a 1. Aquesta propietat és, en essència, la identitat de Vandermonde en combinatòria. Noteu també que la següent identitat es compleix:

( m k ) ( N m n k ) ( N n ) = ( n k ) ( N n m k ) ( N m ) {\displaystyle {{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}={{{n \choose k}{{N-n} \choose {m-k}}} \over {N \choose m}}}

Distribució hipergeomètrica multivariable

Infotaula distribució de probabilitatDistribució hipergeomètrica multivariable, o multigeomètrica
Tipusdistribució univariant i distribució de probabilitat discreta Modifica el valor a Wikidata
Paràmetres c N {\displaystyle c\in \mathbb {N} }

( m 1 , , m c ) N c {\displaystyle (m_{1},\ldots ,m_{c})\in \mathbb {N} ^{c}}

N = i = 1 c m i {\displaystyle N=\sum _{i=1}^{c}m_{i}} n [ 0 , N ] {\displaystyle n\in [0,N]}
Suport { k Z 0 + c : i = 1 c k i = n } {\displaystyle \left\{\mathbf {k} \in \mathbb {Z} _{0+}^{c}\,:\,\sum _{i=1}^{c}k_{i}=n\right\}}
fdp i = 1 c ( m i k i ) ( N n ) {\displaystyle {\frac {\prod _{i=1}^{c}{\binom {m_{i}}{k_{i}}}}{\binom {N}{n}}}}
Esperança matemàtica E ( X i ) = n m i N {\displaystyle E(X_{i})={\frac {nm_{i}}{N}}}
Variància v a r ( X i ) = m i N ( 1 m i N ) n N n N 1 {\displaystyle var(X_{i})={\frac {m_{i}}{N}}\left(1-{\frac {m_{i}}{N}}\right)n{\frac {N-n}{N-1}}} c o v ( X i , X j ) = n m i m j N 2 N n N 1 {\displaystyle cov(X_{i},X_{j})=-{\frac {nm_{i}m_{j}}{N^{2}}}{\frac {N-n}{N-1}}}
MathworldHypergeometricDistribution Modifica el valor a Wikidata

El model d'una urna amb boles blanques i negres es pot generalitzar al cas on hi ha més de dos colors de boles. Si hi ha mi boles de color i a l'urna i s'extreuen n boles aleatòriament sense reposició, aleshores el nombre de boles de cada color de la mostra (k1,k₂,...,kc) segueix la distribució hipergeomètrica multivariable, també anomenada multigeomètrica. Aquesta té la mateixa relació amb la distribució multinomial que la distribució hipergeomètrica té amb la distribució binomial. La distribució multinomial és la distribució "amb reposició" i la hipergeomètrica multivariable és la distribució "sense reposició".

Les propietats d'aquesta distribució es mostren a la taula següent, on c és el nombre de colors diferents i N = i = 1 c m i {\displaystyle N=\sum _{i=1}^{c}m_{i}} és el nombre total de boles.

Exemple

Suposeu que hi ha 5 boles negres, 10 blanques i 15 vermelles en una urna. Les remeneu i agafeu aleatòriament sis boles sense reposició. Quina és la probabilitat que agafeu exactament dues de cada color?

Pr ( 2  black , 2  white , 2  red ) = ( 5 2 ) ( 10 2 ) ( 15 2 ) ( 30 6 ) = .079575596816976 {\displaystyle \Pr(2{\text{ black}},2{\text{ white}},2{\text{ red}})={{{5 \choose 2}{10 \choose 2}{15 \choose 2}} \over {30 \choose 6}}=.079575596816976}

Nota: Quan agafeu sis boles sense reposició, el nombre esperat de boles negres és 6*(5/30) = 1, el nombre esperat de boles blanques és 6*(10/30) = 2, i el nombre esperat de boles vermelles és 6*(15/30) = 3.

Vegeu també

Referències

  1. Alberto Luceño Vázquez, Francisco Javier González, Francisco Javier González Ortiz [et al.].. Métodos estadísticos para medir, describir y controlar la variabilidad. Universidad de Cantabria, gener 2005, p. 144–. ISBN 9788481023756 [Consulta: 18 juny 2011]. 
  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies