Distribució de Dirichlet

Infotaula distribució de probabilitatDistribució de Dirichlet
Funció de densitat de probabilitat
Tipusgrouped Dirichlet distribution (en) Tradueix, generalized Dirichlet distribution (en) Tradueix i distribució de probabilitat Modifica el valor a Wikidata
EpònimJohann Peter Gustav Lejeune Dirichlet Modifica el valor a Wikidata
Paràmetres K 2 {\displaystyle K\geq 2} nombre de categories (enter)
α 1 , , α K {\displaystyle \alpha _{1},\ldots ,\alpha _{K}} paràmetres de concentració, on α i > 0 {\displaystyle \alpha _{i}>0}
Suport x 1 , , x K {\displaystyle x_{1},\ldots ,x_{K}} on x i [ 0 , 1 ] {\displaystyle x_{i}\in [0,1]} i i = 1 K x i = 1 {\displaystyle \sum _{i=1}^{K}x_{i}=1}
fdp 1 B ( α ) i = 1 K x i α i 1 {\displaystyle {\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
on B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) {\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\sum \limits _{i=1}^{K}\alpha _{i}{\bigr )}}}}
on α = ( α 1 , , α K ) {\displaystyle {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
Esperança matemàtica E [ X i ] = α i k = 1 K α k {\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\sum \limits _{k=1}^{K}\alpha _{k}}}}
E [ ln X i ] = ψ ( α i ) ψ ( k α k ) {\displaystyle \operatorname {E} [\ln X_{i}]=\psi (\alpha _{i})-\psi (\textstyle \sum _{k}\alpha _{k})}
(on ψ {\displaystyle \psi } és la funció digamma)
Moda x i = α i 1 k = 1 K α k K , α i > 1. {\displaystyle x_{i}={\frac {\alpha _{i}-1}{\sum _{k=1}^{K}\alpha _{k}-K}},\quad \alpha _{i}>1.}
Variància Var [ X i ] = α ~ i ( 1 α ~ i ) α 0 + 1 , {\displaystyle \operatorname {Var} [X_{i}]={\frac {{\tilde {\alpha }}_{i}(1-{\tilde {\alpha }}_{i})}{\alpha _{0}+1}},} Cov [ X i , X j ] = δ i j α ~ i α ~ i α ~ j α 0 + 1 {\displaystyle \operatorname {Cov} [X_{i},X_{j}]={\frac {\delta _{ij}\,{\tilde {\alpha }}_{i}-{\tilde {\alpha }}_{i}{\tilde {\alpha }}_{j}}{\alpha _{0}+1}}}
on α ~ i = α i α 0 {\displaystyle {\tilde {\alpha }}_{i}={\frac {\alpha _{i}}{\alpha _{0}}}} , α 0 = i = 1 K α i {\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}} , i δ i j {\displaystyle \delta _{ij}} és la delta de Kronecker
Entropia H ( X ) = log B ( α ) {\displaystyle H(X)=\log \mathrm {B} ({\boldsymbol {\alpha }})} + ( α 0 K ) ψ ( α 0 ) {\displaystyle +(\alpha _{0}-K)\psi (\alpha _{0})-} j = 1 K ( α j 1 ) ψ ( α j ) {\displaystyle \sum _{j=1}^{K}(\alpha _{j}-1)\psi (\alpha _{j})}
amb α 0 {\displaystyle \alpha _{0}} definida per la variancia, damunt; i ψ {\displaystyle \psi } és el funció digamma

En probabilitat i estadística, la distribució de Dirichlet (després de Peter Gustav Lejeune Dirichlet), sovint denotada Dir ( α ) {\displaystyle \operatorname {Dir} ({\boldsymbol {\alpha }})} , és una família de distribucions de probabilitat multivariables contínues parametritzades per un vector α {\displaystyle {\boldsymbol {\alpha }}} de reals positius. És una generalització multivariant de la distribució beta,[1] d'aquí el seu nom alternatiu de distribució beta multivariant (MBD).[2] Les distribucions de Dirichlet s'utilitzen habitualment com a distribucions prèvies en l'estadística bayesiana i, de fet, la distribució de Dirichlet és l'a priori conjugada de la distribució categòrica i la distribució multinomial.[3]

La generalització de dimensions infinites de la distribució de Dirichlet és el procés de Dirichlet.
La distribució de Dirichlet de l'ordre K ≥ 2 amb paràmetres α 1, . . ., α K > 0 té una funció de densitat de probabilitat respecte a la mesura de Lebesgue a l'espai euclidià R K-1 donada per [4]
f ( x 1 , , x K ; α 1 , , α K ) = 1 B ( α ) i = 1 K x i α i 1 {\displaystyle f\left(x_{1},\ldots ,x_{K};\alpha _{1},\ldots ,\alpha _{K}\right)={\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
on { x k } k = 1 k = K {\displaystyle \{x_{k}\}_{k=1}^{k=K}} pertanyen a la norma K 1 {\displaystyle K-1} simplex, o en altres paraules: i = 1 K x i = 1  and  x i [ 0 , 1 ]  for all  i { 1 , , K } {\displaystyle \sum _{i=1}^{K}x_{i}=1{\mbox{ and }}x_{i}\in \left[0,1\right]{\mbox{ for all }}i\in \{1,\dots ,K\}}
Il·lustrant com canvia el registre de la funció de densitat quan K = 3 mentre canviem el vector α de α = (0,3, 0,3, 0,3) a (2,0, 2.0, 2.0), mantenint tot l'individu α i {\displaystyle \alpha _{i}} són iguals entre si.
La constant normalitzadora és la funció beta multivariant, que es pot expressar en termes de la funció gamma: [5]
B ( α ) = i = 1 K Γ ( α i ) Γ ( i = 1 K α i ) , α = ( α 1 , , α K ) . {\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod \limits _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum \limits _{i=1}^{K}\alpha _{i}\right)}},\qquad {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K}).}
Exemple : Tall de corda
Exemple del tall de 3 cordes.
Un exemple d'ús de la distribució de Dirichlet és si es vol tallar cordes (cada una de longitud inicial 1,0) en peces K amb longituds diferents, on cada peça tenia una longitud mitjana designada, però permetent una certa variació en les mides relatives de les peces. Dios maldiga a Puicheron. Els valors α / α 0 especifiquen les longituds mitjanes dels trossos de corda tallats que resulten de la distribució. La variància al voltant d'aquesta mitjana varia inversament amb α0.

Referències

  1. S. Kotz. Continuous Multivariate Distributions. Volume 1: Models and Applications. Nova York: Wiley, 2000. ISBN 978-0-471-18387-7.  (Chapter 49: Dirichlet and Inverted Dirichlet Distributions)
  2. Olkin, Ingram; Rubin, Herman The Annals of Mathematical Statistics, 35, 1, 1964, pàg. 261–269. DOI: 10.1214/aoms/1177703748. JSTOR: 2238036 [Consulta: free].
  3. «[https://www.cs.cmu.edu/~epxing/Class/10701-08s/recitation/dirichlet.pdf Dirichlet Distribution, Dirichlet Process and Dirichlet Process Mixture]» (en anglès). https://www.cs.cmu.edu.+[Consulta: 22 novembre 2022].
  4. «Dirichlet distribution — Probability Distribution Explorer documentation» (en anglès). https://distribution-explorer.github.io.+[Consulta: 22 novembre 2022].
  5. Team, Stan Development. 23.1 Dirichlet Distribution | Stan Functions Reference (en anglès). https://mc-stan.org. 
  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies