Llei de Zipf-Mandelbrot

Infotaula distribució de probabilitatLlei de Zipf-Mandelbrot
Tipusllei potencial Modifica el valor a Wikidata
EpònimGeorge Kingsley Zipf, Benoît Mandelbrot i Vilfredo Pareto Modifica el valor a Wikidata
Paràmetres N { 1 , 2 , 3 } {\displaystyle N\in \{1,2,3\ldots \}} (enter)
q [ 0 ; ) {\displaystyle q\in [0;\infty )} (real)
s > 0 {\displaystyle s>0\,} (real)
Suport k { 1 , 2 , , N } {\displaystyle k\in \{1,2,\ldots ,N\}}
fpm 1 / ( k + q ) s H N , q , s {\displaystyle {\frac {1/(k+q)^{s}}{H_{N,q,s}}}}
FD H k , q , s H N , q , s {\displaystyle {\frac {H_{k,q,s}}{H_{N,q,s}}}}
Esperança matemàtica H N , q , s 1 H N , q , s q {\displaystyle {\frac {H_{N,q,s-1}}{H_{N,q,s}}}-q}
Moda 1 {\displaystyle 1\,}
Entropia s H N , q , s k = 1 N ln ( k + q ) ( k + q ) s + ln ( H N , q , s ) {\displaystyle {\frac {s}{H_{N,q,s}}}\sum _{k=1}^{N}{\frac {\ln(k+q)}{(k+q)^{s}}}+\ln(H_{N,q,s})}

En teoria de probabilitat i estadística, la llei de Zipf-Mandelbrot és una distribució de probabilitat discreta. També coneguda com la llei de Pareto-Zipf, és una distribució de llei potencial a les dades classificades, anomenada així pel lingüista George Kingsley Zipf qui va suggerir una distribució més senzilla anomenada llei de Zipf i el matemàtic Benoit Mandelbrot, que posteriorment la va generalitzar.

La funció de massa de probabilitat ve donada per:

f ( k ; N , q , s ) = 1 / ( k + q ) s H N , q , s {\displaystyle f(k;N,q,s)={\frac {1/(k+q)^{s}}{H_{N,q,s}}}}

on H N , q , s {\displaystyle H_{N,q,s}} és donat per:

H N , q , s = i = 1 N 1 ( i + q ) s {\displaystyle H_{N,q,s}=\sum _{i=1}^{N}{\frac {1}{(i+q)^{s}}}}

que es pot considerar com una generalització d'un nombre harmònic. A la fórmula, k {\displaystyle k} és el rang de les dades q {\displaystyle q} i s {\displaystyle s} són paràmetres de la distribució. En el límit de N {\displaystyle N} quan s'acosta a l'infinit, es converteix en la funció zeta de Hurwitz ζ ( s , q ) {\displaystyle \zeta (s,q)} . Per a N {\displaystyle N} finit i q = 0 {\displaystyle q=0} la llei de Zipf-Mandelbrot es converteix en la llei de Zipf. Per a N {\displaystyle N} infinit i q = 0 {\displaystyle q=0} es converteix en la distribució Zeta.

Aplicacions

La distribució de paraules classificades per la seva freqüència en un corpus lingüístic aleatori s'aproxima per una distribució de llei potencial, coneguda com a llei de Zipf.

Si es dibuixa el rang de freqüència de les paraules contingudes en un corpus de dades de text de mida moderada vers el nombre d'ocurrències o freqüències reals, s'obté una distribució de llei potencial, amb exponent proper a 1 (però vegeu Powers, 1998 i Gelbukh i Sidorov, 2001). La llei de Zipf assumeix implícitament una mida de vocabulari fixa, però la sèrie harmònica amb s=1 no convergeix, mentre que la generalització de la llei Zipf-Mandelbrot amb s>1 ho fa. A més, hi ha proves que la classe tancada de paraules funcionals que defineixen un idioma obeeix a una distribució Zipf-Mandelbrot amb diferents paràmetres de les classes obertes de paraules amb contingut que varien per tema, camp i registre.[1]

En estudis del camp ecològic, la distribució d'abundància relativa (és a dir, el gràfic del nombre d'espècies observades en funció de la seva abundància) es troba sovint conforme a la llei de Zipf-Mandelbrot.[2]

Dins de la música, moltes mètriques de la música «agradable» s'ajusten a les distribucions Zipf-Mandelbrot.

Referències

  1. Powers, David M W «Applications and explanations of Zipf's law» (en anglès). Association for Computational Linguistics, 1998, pàg. 151–160.
  2. Mouillot, D; Lepretre, A «Introduction of relative abundance distribution (RAD) indices, estimated from the rank-frequency diagrams (RFD), to assess changes in community diversity» (en anglès). Environmental Monitoring and Assessment. Springer, 63(2), 2000, pàg. 279–295. DOI: 10.1023/A:1006297211561.

Bibliografia

  • Mandelbrot, Benoît. «Information Theory and Psycholinguistics». A: Language (en anglès). R.C. Oldfield and J.C. Marchall, 1968. 
  • Powers, David M W «Applications and explanations of Zipf's law» (en anglès). Association for Computational Linguistics, 1998, pàg. 151–160.
  • Zipf, George Kingsley. Selected Studies of the Principle of Relative Frequency in Language (en anglès). Cambridge, MA: Harvard University Press, 1932. 
  • Van Droogenbroeck, F.J. «An essential rephrasing of the Zipf-Mandelbrot law to solve authorship attribution applications by Gaussian statistics» (en anglès). Academia, 2019.

Enllaços externs

  • Z. K. Silagadze: Citations and the Zipf-Mandelbrot's law (anglès)
  • NIST: Zipf's law (anglès)
  • W. Li's References on Zipf's law (anglès)
  • Gelbukh & Sidorov, 2001: Zipf and Heaps Laws' Coefficients Depend on Language (anglès)
  • C++ Library for generating random Zipf-Mandelbrot deviates. (anglès)
  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies