Loi de probabilité à queue lourde

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Page d’aide sur l’homonymie

Pour un article sur les autres queues de loi de probabilité, consultez l'article Queue d'une loi de probabilité

Long tail.

Dans la théorie des probabilités, une loi de probabilité à queue lourde est une loi de probabilité dont les queues ne sont pas exponentiellement bornées[1], ce qui signifie qu'elles ont des queues plus « lourdes » que la loi exponentielle. Dans de nombreuses applications, c'est la queue droite de la distribution qui est intéressante, mais une distribution peut avoir une queue lourde à gauche, ou les deux queues peuvent être lourdes.

Il y a trois sous-classes importantes de lois à queue lourde, les lois à queue épaisse, les lois à longue queue et les lois sous-exponentielles. Dans la pratique, toutes les lois à queue lourde couramment utilisées appartiennent à la classe sous-exponentielle.

Définitions

Loi à queue lourde

La loi d'une variable aléatoire X de fonction de répartition F est dite à queue lourde (à droite) si sa fonction génératrice des moments MX(t), est infinie pour tout t > 0., soit[2],[3]:

t > 0 , e t x d F ( x ) = . {\displaystyle \forall t>0,\int _{-\infty }^{\infty }\mathrm {e} ^{tx}\,\mathrm {d} F(x)=\infty .}

On peut traduire cette propriété en termes de densité de distribution de queue

F ¯ ( x ) P [ X > x ] {\displaystyle {\overline {F}}(x)\equiv \mathbb {P} [X>x]\,}

comme

t > 0 , lim x e t x F ¯ ( x ) = . {\displaystyle \forall t>0,\lim _{x\to \infty }\mathrm {e} ^{tx}{\overline {F}}(x)=\infty .\,}

Loi à queue longue

La loi d'une variable aléatoire X de fonction de répartition F est dite à queue longue (à droite) si [1]

t > 0 , lim x P [ X > x + t X > x ] = 1 , {\displaystyle \forall t>0,\lim _{x\to \infty }\mathbb {P} [X>x+t\mid X>x]=1,\,}

ou

t > 0 , F ¯ ( x + t ) x F ¯ ( x ) . {\displaystyle \forall t>0,{\overline {F}}(x+t){\underset {x\to \infty }{\sim }}{\overline {F}}(x).}

On peut le comprendre ainsi : à partir d'un certain niveau, la probabilité qu'une variable aléatoire à queue longue dépasse un niveau supérieur tend vers 1.

Une loi à queue longue est nécessairement à queue lourde, mais la réciproque est fausse : il est possible de construire des lois à queue lourde mais pas longue

Lois sous-exponentielles

La sous-exponentialité est définie en termes de convolution de densités de probabilités. Pour deux variables aléatoires iid X 1 , X 2 {\displaystyle X_{1},X_{2}} de même fonction de répartition F {\displaystyle F} , la convolution de F {\displaystyle F} avec elle-même, notée F 2 {\displaystyle F^{*2}} , est définie par l'intégrale de Lebesgue-Stieltjes :

P [ X 1 + X 2 x ] = F 2 ( x ) = 0 x F ( x y ) d F ( y ) , {\displaystyle \mathbb {P} [X_{1}+X_{2}\leq x]=F^{*2}(x)=\int _{0}^{x}F(x-y)\,\mathrm {d} F(y),}

et la convolution d'ordre n F n {\displaystyle F^{*n}} est définie par récurrence :

F n ( x ) = 0 x F ( x y ) d F n 1 ( y ) . {\displaystyle F^{*n}(x)=\int _{0}^{x}F(x-y)\,\mathrm {d} F^{*n-1}(y).}

La fonction de répartition de queue F ¯ {\displaystyle {\overline {F}}} est telle que F ¯ ( x ) = 1 F ( x ) {\displaystyle {\overline {F}}(x)=1-F(x)} .

Une loi de fonction de répartition F {\displaystyle F} est dite sous-exponentielle (à droite)[1],[4],[5] si :

F 2 ¯ ( x ) x 2 F ¯ ( x ) . {\displaystyle {\overline {F^{*2}}}(x){\underset {x\to \infty }{\sim }}2{\overline {F}}(x).}

On en déduit[6]:

n 1 ,   F n ¯ ( x ) x n F ¯ ( x ) . {\displaystyle \forall n\geqslant 1,\ {\overline {F^{*n}}}(x){\underset {x\to \infty }{\sim }}n{\overline {F}}(x).}

On peut y voir l'interprétation probabiliste suivante[6]: pour une somme de n {\displaystyle n} variables aléatoires iid X 1 , , X n {\displaystyle X_{1},\ldots ,X_{n}} de loi commune F {\displaystyle F} ,

P [ X 1 + + X n > x ] x P [ max ( X 1 , , X n ) > x ] . {\displaystyle \mathbb {P} [X_{1}+\cdots +X_{n}>x]{\underset {x\to \infty }{\sim }}\mathbb {P} [\max(X_{1},\ldots ,X_{n})>x].}

On désigne cette propriété comme le principe du grand saut simple[7] ou principe de la catastrophe[8]

Une loi F {\displaystyle F} sur la droite réelle complète est sous-exponentielle si la loi F 1 1 [ 0 , [ {\displaystyle F1\!\!1_{[0,\infty [}} l'est[9]; la fonction 1 1 [ 0 , [ {\displaystyle 1\!\!1_{[0,\infty [}} est la fonction indicatrice de la demi-droite positive. De façon alternative, une variable aléatoire X {\displaystyle X} réelle est sous-exponentielle ssi X + = max ( 0 , X ) {\displaystyle X^{+}=\max(0,X)} est sous-exponentielle.

Toutes les lois sous-exponentielles sont à queue longue, mais on peut construire des lois à queue longue mais non sous-exponentielles.

Exemples de lois à queue lourde

Parmi les lois classiques à queue lourde, toutes sont sous-exponentielles[6].

Dans les lois à queue lourde à droite, on trouve :

  • la loi de Pareto ;
  • la loi log-normale ;
  • la loi de Lévy ;
  • la loi de Weibull avec un paramètre de forme compris entre 0 et 1 ;
  • la loi de Burr ;
  • la loi log-logistique ;
  • la loi log-gamma ;
  • la loi de Fréchet ;
  • la loi q-normale
  • la loi log-Cauchy, parfois décrite comme ayant une "queue super-lourde" car elle montre une croissance logarithmique produisant une queue plus lourde que celle de la loi de Pareto[10],[11].

Parmi les lois à deux queues lourdes :

  • la loi de Cauchy, elle-même cas particulier de la loi stable et de la loi de Student ;
  • la famille des lois stables[12], à l'exception de la loi normale, qui est un cas particulier de cette famille. Certaines lois stables sont à une queue, comme la loi de Lévy.
  • la loi de Student.
  • la loi cascade log-normale asymétrique[13].

Relation aux lois à queue épaisse

Une loi à queue épaisse (en) est une loi pour laquelle la densité de probabilités, pour de grandes valeurs de x, décroit en x a {\displaystyle x^{-a}} . Puisqu'une fonction puissance est toujours bornée par une fonction exponentielle, les lois à queue épaisse sont toujours à queue lourde. Certaines lois, cependant, ont une queue qui décroit vers 0 plus lentement que la fonction exponentielle (dont sont à queue lourde), mais plus lentement qu'une fonction puissance (donc pas à queue épaisse).

Références

  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Heavy-tailed distribution » (voir la liste des auteurs).
  1. a b et c (en) Søren Asmussen, Applied probability and queues : Stochastic Modelling and Applied Probability, Berlin, Springer, , 438 p. (ISBN 978-0-387-00211-8 et 1441918094, lire en ligne)
  2. (en) Tomasz Rolski, Hanspeter Schmidli, Volker Schmidt et Jozef Teugels, Stochastic Processes for Insurance & Finance, (ISBN 9780471959250, DOI 10.1002/9780470317044)
  3. (en) Sergey Foss, Dmitry Korshunov et Stan Zachary, An Introduction to Heavy-Tailed and Subexponential Distributions, Springer Science & Business Media,
  4. (en) V. P. Chistyakov, « A Theorem on Sums of Independent Positive Random Variables and Its Applications to Branching Random Processes », ResearchGate,‎ (lire en ligne, consulté le )
  5. (en) Jozef L. Teugels, « The Class of Subexponential Distributions », Annals of Probability, Université de Louvain, vol. 3, no 6,‎ (DOI 10.1214/aop/1176996225 Accès libre, lire en ligne, consulté le )
  6. a b et c (en) Embrechts P., Klueppelberg C. et Mikosch T., Modelling extremal events for insurance and finance, vol. 33, Berlin, Springer, coll. « Stochastic Modelling and Applied Probability », (ISBN 978-3-642-08242-9, DOI 10.1007/978-3-642-33483-2)
  7. (en) S. Foss, T. Konstantopoulos et S. Zachary, « Discrete and Continuous Time Modulated Random Walks with Heavy-Tailed Increments », Journal of Theoretical Probability, vol. 20, no 3,‎ , p. 581 (DOI 10.1007/s10959-007-0081-2, arXiv math/0509605, S2CID 3047753, CiteSeerx 10.1.1.210.1699, lire en ligne)
  8. (en) Adam Wierman, « Catastrophes, Conspiracies, and Subexponential Distributions (Part III) », sur Rigor + Relevance blog, RSRG, Caltech, (consulté le )
  9. (en) E. Willekens, « Subexponentiality on the real line », Technical Report, K.U. Leuven,‎
  10. (en) M. Falk, J. Hüsler et R. Reiss, Laws of Small Numbers: Extremes and Rare Events, Springer, (ISBN 978-3-0348-0008-2), p. 80
  11. (en) M.I.F. Alves, L. de Haan et C. Neves, « Statistical inference for heavy and super-heavy tailed distributions » [archive du ] [PDF], (consulté le )
  12. (en) John P. Nolan, « Stable Distributions: Models for Heavy Tailed Data » [archive du ] [PDF], (consulté le )
  13. (en) Stephen Lihn, « Skew Lognormal Cascade Distribution » [archive du ] [PDF], (consulté le )
  • icône décorative Portail des probabilités et de la statistique