Distribució t de Student

Infotaula distribució de probabilitatDistribució t de Student
Funció de densidad de probabilitat
Funció de distribució de probabilitat
Funció de distribució de probabilitat
TipusDistribució t multivariant, Distribució t no central, família escala de localització, distribució de probabilitat simètrica, distribució univariant i distribució de probabilitat contínua Modifica el valor a Wikidata
EpònimWilliam Gosset Modifica el valor a Wikidata
Paràmetres ν ( 0 , ) {\displaystyle \nu \in (0,\infty )} graus de llibertat
Suport x ( , ) {\displaystyle x\in (-\infty ,\infty )}
FD 1 2 + x Γ ( ν + 1 2 ) × 2 F 1 ( 1 2 , ν + 1 2 ; 3 2 ; x 2 ν ) π ν Γ ( ν 2 ) {\displaystyle {\begin{matrix}{\frac {1}{2}}+x\Gamma \left({\frac {\nu +1}{2}}\right)\times \\[0.5em]{\frac {\,_{2}F_{1}\left({\frac {1}{2}},{\frac {\nu +1}{2}};{\frac {3}{2}};-{\frac {x^{2}}{\nu }}\right)}{{\sqrt {\pi \nu }}\,\Gamma \left({\frac {\nu }{2}}\right)}}\end{matrix}}}
on ₂F1 és la funció hipergeomètrica
Esperança matemàtica0 per a ν > 1 {\displaystyle \nu >1}
Mediana0
Moda0
Variància ν ν 2 {\displaystyle \textstyle {\frac {\nu }{\nu -2}}} per a ν > 2 {\displaystyle \nu >2}
Coeficient de simetria0 per a ν > 3 {\displaystyle \nu >3}
Curtosi 6 ν 4 {\displaystyle \textstyle {\frac {6}{\nu -4}}} per a ν > 4 {\displaystyle \nu >4}
Entropia ν + 1 2 [ ψ ( 1 + ν 2 ) ψ ( ν 2 ) ] + ln [ ν B ( ν 2 , 1 2 ) ] (nats) {\displaystyle {\begin{matrix}{\frac {\nu +1}{2}}\left[\psi \left({\frac {1+\nu }{2}}\right)-\psi \left({\frac {\nu }{2}}\right)\right]\\[0.5em]+\ln {\left[{\sqrt {\nu }}B\left({\frac {\nu }{2}},{\frac {1}{2}}\right)\right]}\,{\scriptstyle {\text{(nats)}}}\end{matrix}}}
on ψ és la funció digamma i B és la funció beta
FGMcap valor Modifica el valor a Wikidata
FC K ν / 2 ( ν | t | ) ( ν | t | ) ν / 2 Γ ( ν / 2 ) 2 ν / 2 1 {\displaystyle \textstyle {\frac {K_{\nu /2}\left({\sqrt {\nu }}|t|\right)\cdot \left({\sqrt {\nu }}|t|\right)^{\nu /2}}{\Gamma (\nu /2)2^{\nu /2-1}}}} on K ν ( x ) {\displaystyle K_{\nu }(x)} és Funció de Bessel modificada de segon tipus
MathworldStudentst-Distribution Modifica el valor a Wikidata

En probabilitat i estadística, la distribució t de Student és una distribució de probabilitat que sorgeix del problema d'estimar la mitjana d'una població normalment distribuïda amb variància desconeguda quan la mida de la mostra és petita. Aquesta és la base de la popular prova t de Student per a la determinació de les diferències entre dues mitjanes mostrals i per a la construcció de l'interval de confiança per a la diferència entre les mitjanes de dues poblacions.

El seu nom, Student, es deu al pseudònim que utilitzava l'estadístic britànic William Sealey Gosset quan publicava els seus articles científics. Per a la història d'aquesta distribució vegeu la pàgina Prova t de student. La referència bàsica d'aquest article és Johnson et al.[1].

Definició

Sigui Z N ( 0 , 1 ) {\displaystyle Z\sim {\mathcal {N}}(0,1)} una variable aleatòria normal estàndard i Q χ 2 ( ν ) {\displaystyle Q\sim \chi ^{2}(\nu )} una variable aleatòria amb distribució χ 2 {\displaystyle {\ce {\chi^2}}} amb ν {\displaystyle \nu } graus de llibertat, Z {\displaystyle Z} i Q {\displaystyle Q} independents. La variable

T = Z Q / ν {\displaystyle T={\frac {Z}{\sqrt {Q/\nu }}}}
es diu que té una distribució t {\displaystyle t} de Student amb ν {\displaystyle \nu } graus de llibertat i s'escriu T t ( ν ) {\displaystyle T\sim t(\nu )} o bé T t ν {\displaystyle T\sim t_{\nu }} .

Comentari sobre els graus de llibertat. El cas més habitual d'una distribució χ 2 {\displaystyle {\ce {\chi^2}}} és quan el nombre ν {\displaystyle \nu } de graus de llibertat és un nombre natural i llavors es pot interpretar com la suma dels quadrats de ν {\displaystyle \nu } variables aleatòries normals estàndard independents. Però mitjançant la funció de densitat es pot definir una distribució χ 2 {\displaystyle {\ce {\chi^2}}} que tingui com a graus de llibertat qualsevol nombre real estrictament positiu ν ( 0 , ) {\displaystyle {\ce {\nu \in (0,\infty )}}} , nombre que continua anomenat-se els graus de llibertat de la distribució.[2] En conseqüència, pot definir-se la distribució t {\displaystyle t} de Student amb graus de llibertat qualsevol nombre ν ( 0 , ) {\displaystyle {\ce {\nu \in (0,\infty )}}} . Cal dir que el programari estadístic estàndard, per exemple, el llenguatge R, utilitza graus de llibertat fraccionaris en certs tests estadístics.



Funció de densitat

La funció de densitat de la distribució t {\displaystyle t} de Student amb ν ( 0 , ) {\displaystyle \nu \in (0,\infty )} graus de llibertat és

f ( x ) = Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ( 1 + x 2 ν ) ν + 1 2 , x R , {\displaystyle f(x)={\frac {\Gamma {\big (}{\frac {\nu +1}{2}}{\big )}}{{\sqrt {\pi \nu }}\,\,\Gamma {\big (}{\frac {\nu }{2}}{\big )}}}{\bigg (}1+{\frac {x^{2}}{\nu }}{\bigg )}^{-{\frac {\nu +1}{2}}},\quad x\in \mathbb {R} ,}

on Γ ( x ) {\displaystyle \Gamma (x)} és la funció gamma.

Utilitzant la funció Beta B ( x , y ) {\displaystyle {\text{B}}(x,y)} i que Γ ( 1 2 ) = π {\displaystyle \Gamma {\big (}{\tfrac {1}{2}}{\big )}={\sqrt {\pi }}} també es pot escriure

f ( x ) = 1 ν B ( 1 2 , ν 2 ) ( 1 + x 2 ν ) ν + 1 2 . {\displaystyle f(x)={\frac {1}{{\sqrt {\nu }}\,{\text{B}}{\big (}{\frac {1}{2}},{\frac {\nu }{2}}{\big )}}}{\bigg (}1+{\frac {x^{2}}{\nu }}{\bigg )}^{-{\frac {\nu +1}{2}}}.}
Funció parella. Cal remarcar que aquesta funció és parella : f ( x ) = f ( x ) {\displaystyle f(-x)=f(x)} ; gràficament, és simètrica respecte l'eix d'ordenades. Aquesta propietat és important en els càlculs de probabilitats.

Prova
El càlcul de la funció de densitat de T {\displaystyle T} es fa mitjançant la fórmula de canvi de variables per a vectors aleatoris. Concretament, amb les notacions que hem introduït a la definició de T {\displaystyle T} , considerem la funció h {\displaystyle h} que transforma el vector ( Z , Q ) {\displaystyle (Z,Q)} en el vector ( T , Q ) {\displaystyle (T,Q)} :
h ( z , y ) = ( t , y ) , amb t = z y / ν . {\displaystyle h(z,y)=(t,y),\quad {\text{amb}}\quad t={\frac {z}{\sqrt {y/\nu }}}.}
La transformació inversa és
g ( t , y ) = ( t y / ν , y ) . {\displaystyle g(t,y)={\big (}t{\sqrt {y/\nu }},y{\big )}.}

El determinant jacobià d'aquesta transformació és

J g ( t , y ) = y / ν . {\displaystyle J_{g}(t,y)={\sqrt {y/\nu }}.}
D'altra banda, degut a que Z {\displaystyle Z} i Q {\displaystyle Q} són independents, la densitat conjunta del vector ( Z , Q ) {\displaystyle (Z,Q)} és el producte de les funcions de densitat:
f ( Z , Q ) ( z , y ) = 1 2 π 2 ν / 2 Γ ( ν / 2 ) e ( z 2 + y ) / 2 y ν / 2 1 . {\displaystyle f_{(Z,Q)}(z,y)={\frac {1}{{\sqrt {2\pi }}\,2^{\nu /2}\,\Gamma (\nu /2)}}\,e^{-(z^{2}+y)/2}\,y^{\nu /2-1}.}

Llavors, la densitat conjunta de ( T , Q ) {\displaystyle (T,Q)} és
f ( T , Q ) ( t , y ) = 1 2 π 2 ν / 2 Γ ( ν / 2 ) e y ( 1 + t 2 / ν ) / 2 y ν / 2 1 y ν = 1 2 π ν 2 ν / 2 Γ ( ν / 2 ) e y ( 1 + t 2 / ν ) / 2 y ( ν 1 ) / 2 . {\displaystyle f_{(T,Q)}(t,y)={\frac {1}{{\sqrt {2\pi }}\,2^{\nu /2}\,\Gamma (\nu /2)}}\,\,e^{-y(1+t^{2}/\nu )/2}\,y^{\nu /2-1}{\sqrt {\frac {y}{\nu }}}={\frac {1}{{\sqrt {2\pi \nu }}\,2^{\nu /2}\,\Gamma (\nu /2)}}\,\,e^{-y(1+t^{2}/\nu )/2}\,y^{(\nu -1)/2}.}
La densitat (marginal) de T {\displaystyle T} és
f T ( t ) = f ( T , Q ) ( t , y ) d y = 1 2 π ν 2 ν / 2 Γ ( ν / 2 ) 0 y ( ν 1 ) / 2 e y ( 1 + t 2 / ν ) / 2 d y = Γ ( ( ν + 1 ) / 2 ) π ν Γ ( ν / 2 ) ( 1 + t 2 ν ) ( ν + 1 ) / 2 , {\displaystyle f_{T}(t)=\int _{-\infty }^{\infty }f_{(T,Q)}(t,y)\,dy={\frac {1}{{\sqrt {2\pi \nu }}\,2^{\nu /2}\,\Gamma (\nu /2)}}\,\int _{0}^{\infty }y^{(\nu -1)/2}\,e^{-y(1+t^{2}/\nu )/2}\,dy={\frac {\Gamma {\big (}(\nu +1)/2{\big )}}{{\sqrt {\pi \nu }}\,\Gamma (\nu /2)}}{\Big (}1+{\frac {t^{2}}{\nu }}{\Big )}^{-(\nu +1)/2},}
on, per calcular la integral, hem fet el canvi de variable y ( 1 + t 2 / ν ) / 2 = u {\displaystyle y(1+t^{2}/\nu )/2=u} i hem utilitzat la funció gamma.

Quan ν {\displaystyle \nu } és un nombre natural, la funció de densitat és simplifica. Concretament,per a ν = 1 {\displaystyle \nu =1} ,

Γ ( ( ν + 1 ) / 2 ) ν π Γ ( ν / 2 ) = Γ ( 1 ) π Γ ( 1 / 2 ) = 1 π . {\displaystyle {\frac {\Gamma {\big (}(\nu +1)/2{\big )}}{{\sqrt {\nu \pi }}\,\Gamma (\nu /2)}}={\frac {\Gamma (1)}{{\sqrt {\pi }}\,\Gamma (1/2)}}={\frac {1}{\pi }}.}
Llavors
f ( x ) = 1 π 1 1 + x 2 , x R , {\displaystyle f(x)={\frac {1}{\pi }}\,{\frac {1}{1+x^{2}}},\quad x\in \mathbb {R} ,}
i per tant es tracta d'una distribució de Cauchy (centrada en l'origen). Per a ν 3 {\displaystyle \nu \geq 3} senar, la constant de la funció de densitat és
Γ ( ( ν + 1 ) / 2 ) ν π Γ ( ν / 2 ) = ( ν 1 ) ( ν 3 ) 4 2 π ν ( ν 2 ) ( ν 4 ) 5 3 = ( ν 1 ) ! ! π ν ( ν 2 ) ! ! , {\displaystyle {\frac {\Gamma {\big (}(\nu +1)/2{\big )}}{{\sqrt {\nu \pi }}\,\Gamma (\nu /2)}}={\frac {(\nu -1)(\nu -3)\cdots 4\cdot 2}{\pi {\sqrt {\nu }}\,(\nu -2)(\nu -4)\cdots 5\cdot 3}}={\frac {(\nu -1)!!}{\pi {\sqrt {\nu }}\,(\nu -2)!!}},}
on k ! ! {\displaystyle k!!} és el doble factorial del nombre k {\displaystyle k} .

Per a ν {\displaystyle \nu } parell,

Γ ( ( ν + 1 ) / 2 ) ν π Γ ( ν / 2 ) = ( ν 1 ) ( ν 3 ) 5 3 2 ν ( ν 2 ) ( ν 4 ) 4 2 = ( ν 1 ) ! ! 2 ν ( ν 2 ) ! ! , {\displaystyle {\frac {\Gamma {\big (}(\nu +1)/2{\big )}}{{\sqrt {\nu \pi }}\,\Gamma (\nu /2)}}={\frac {(\nu -1)(\nu -3)\cdots 5\cdot 3}{2{\sqrt {\nu }}\,(\nu -2)(\nu -4)\cdots 4\cdot 2}}={\frac {(\nu -1)!!}{2{\sqrt {\nu }}\,(\nu -2)!!}}\,,}
(Cal recordar que 0 ! ! {\displaystyle 0!!} =1).

Funció de distribució

Quan el nombre de graus de llibertat és un nombre natural, la funció de distribució es pot donar explícitament en termes de funcions elementals, amb una expressió que es complica a l'augmentar els graus de llibertat.

ν {\displaystyle \nu } Funció de densitat Funció de distribució
1 1 π ( 1 + t 2 ) {\displaystyle {\frac {1}{\pi (1+t^{2})}}} 1 2 + 1 π arctan ( t ) {\displaystyle {\frac {1}{2}}+{\frac {1}{\pi }}\arctan(t)}
2 1 2 2 ( 1 + t 2 2 ) 3 / 2 {\displaystyle {\frac {1}{2{\sqrt {2}}\left(1+{\frac {t^{2}}{2}}\right)^{3/2}}}} 1 2 + t 2 2 1 + t 2 2 {\displaystyle {\frac {1}{2}}+{\frac {t}{2{\sqrt {2}}{\sqrt {1+{\frac {t^{2}}{2}}}}}}}
3 2 π 3 ( 1 + t 2 3 ) 2 {\displaystyle {\frac {2}{\pi {\sqrt {3}}\left(1+{\frac {t^{2}}{3}}\right)^{2}}}} 1 2 + 1 π [ 1 3 t 1 + t 2 3 + arctan ( t 3 ) ] {\displaystyle {\frac {1}{2}}+{\frac {1}{\pi }}{\left[{\frac {1}{\sqrt {3}}}{\frac {t}{1+{\frac {t^{2}}{3}}}}+\arctan \left({\frac {t}{\sqrt {3}}}\right)\right]}}
4 3 8 ( 1 + t 2 4 ) 5 / 2 {\displaystyle {\frac {3}{8\left(1+{\frac {t^{2}}{4}}\right)^{5/2}}}} 1 2 + 3 8 t 1 + t 2 4 [ 1 1 12 t 2 1 + t 2 4 ] {\displaystyle {\frac {1}{2}}+{\frac {3}{8}}{\frac {t}{\sqrt {1+{\frac {t^{2}}{4}}}}}{\left[1-{\frac {1}{12}}{\frac {t^{2}}{1+{\frac {t^{2}}{4}}}}\right]}}
5 8 3 π 5 ( 1 + t 2 5 ) 3 {\displaystyle {\frac {8}{3\pi {\sqrt {5}}\left(1+{\frac {t^{2}}{5}}\right)^{3}}}} 1 2 + 1 π [ t 5 ( 1 + t 2 5 ) ( 1 + 2 3 ( 1 + t 2 5 ) ) + arctan ( t 5 ) ] {\displaystyle {\frac {1}{2}}+{\frac {1}{\pi }}{\left[{\frac {t}{{\sqrt {5}}\left(1+{\frac {t^{2}}{5}}\right)}}\left(1+{\frac {2}{3\left(1+{\frac {t^{2}}{5}}\right)}}\right)+\arctan \left({\frac {t}{\sqrt {5}}}\right)\right]}}
Prova
El càlcul de la funció de distribució es redueix a calcular una integral de la forma 1 ( 1 + x 2 / a ) n d x {\displaystyle \int {\frac {1}{(1+x^{2}/a)^{n}}}\,dx} , amb a > 0 {\displaystyle a>0} i n N {\displaystyle n\in \mathbb {N} } o 1 ( 1 + x 2 / a ) m / 2 d x {\displaystyle \int {\frac {1}{(1+x^{2}/a)^{m/2}}}\,dx} amb a > 0 {\displaystyle a>0} i m 3 {\displaystyle m\geq 3} un nombre senar. En ambdós casos, mitjançant el canvi x = a y {\displaystyle x={\sqrt {a}}\,y} n'hi ha prou amb considerar a = 1 {\displaystyle a=1} .

Tenim que

1 1 + y 2 d y = arctan y + C , {\displaystyle \int {\frac {1}{1+y^{2}}}\,dy=\arctan y+C,}

i per a n 2 {\displaystyle n\geq 2} , la integral 1 ( 1 + y 2 ) n d y {\displaystyle \int {\frac {1}{(1+y^{2})^{n}}}\,dy} és una integral d'una funció racional amb arrels complexes múltiples, que dóna[3]

1 ( 1 + y 2 ) n d y = 1 2 n 2 y ( 1 + y 2 ) n 1 + 2 n 3 2 n 2 1 ( 1 + y 2 ) n 1 d y . {\displaystyle \int {\frac {1}{(1+y^{2})^{n}}}\,dy={\frac {1}{2n-2}}{\frac {y}{(1+y^{2})^{n-1}}}+{\frac {2n-3}{2n-2}}\int {\frac {1}{(1+y^{2})^{n-1}}}\,dy.}
La integral 1 ( 1 + y 2 ) m / 2 d y {\displaystyle \int {\frac {1}{(1+y^{2})^{m/2}}}\,dy} per a m 3 {\displaystyle m\geq 3} senar, mitjançant el canvi y = tan u {\displaystyle y=\tan u} es converteix en una integral de la forma cos k u d u {\textstyle \int \cos ^{k}u\,du} , que es pot calcular iterativament (vegeu la fórmula de la integral d'una potència del cosinus), i acaba donant:[3]
1 ( 1 + y 2 ) m / 2 d y = y ( m 2 ) ( 1 + y 2 ) ( m 2 ) / 2 + m 3 m 2 1 ( 1 + y 2 ) ( m 2 ) / 2 d y . {\displaystyle \int {\frac {1}{(1+y^{2})^{m/2}}}\,dy={\frac {y}{(m-2)(1+y^{2})^{(m-2)/2}}}+{\frac {m-3}{m-2}}\int {\frac {1}{(1+y^{2})^{(m-2)/2}}}\,dy.}

Calculem, per exemple, la funció de distribució per a ν = 2 {\displaystyle \nu =2} : hem de calcular

1 ( 1 + x 2 / 2 ) 3 / 2 d x = 2 1 ( 1 + y 2 ) 3 / 2 d y = 2 y 1 + y 2 + C = x 1 + x 2 / 2 + C . {\displaystyle \int {\frac {1}{(1+x^{2}/2)^{3/2}}}\,dx={\sqrt {2}}\int {\frac {1}{(1+y^{2})^{3/2}}}\,dy={\sqrt {2}}\,{\frac {y}{\sqrt {1+y^{2}}}}+C={\frac {x}{\sqrt {1+x^{2}/2}}}+C.}

Llavors,
F ( t ) = t f ( x ) d x = 1 2 2 t 1 ( 1 + x 2 / 2 ) 3 / 2 d x = 1 2 2 t 1 + t 2 / 2 1 2 2 lim s s 1 + s 2 / 2 = 1 2 2 t 1 + t 2 / 2 + 1 2 . {\displaystyle {\begin{aligned}F(t)&=\int _{-\infty }^{t}f(x)\,dx={\frac {1}{2{\sqrt {2}}}}\int _{-\infty }^{t}{\frac {1}{(1+x^{2}/2)^{3/2}}}\,dx\\&={\frac {1}{2{\sqrt {2}}}}\,{\frac {t}{\sqrt {1+t^{2}/2}}}-{\frac {1}{2{\sqrt {2}}}}\lim _{s\to -\infty }{\frac {s}{\sqrt {1+s^{2}/2}}}={\frac {1}{2{\sqrt {2}}}}\,{\frac {t}{\sqrt {1+t^{2}/2}}}+{\frac {1}{2}}.\end{aligned}}}

Expressions alternatives de la funció de distribució

Per al cas general podem escriure la funció de distribució en termes de la funció beta incompleta[4]:

F ( t ) = t f ( x ) d x = 1 1 2 I y ( t ) ( ν 2 , 1 2 ) , t 0 , {\displaystyle F(t)=\int _{-\infty }^{t}f(x)\,dx=1-{\frac {1}{2}}\,I_{y(t)}\left({\tfrac {\nu }{2}},{\tfrac {1}{2}}\right),\quad t\geq 0,}
on y ( t ) = ν / ( ν + t 2 ) {\displaystyle y(t)=\nu /(\nu +t^{2})} i I x ( a , b ) {\displaystyle I_{x}(a,b)} és la funció beta incompleta regularitzada.

Per a t < 0 {\displaystyle t<0} , atès que la funció de densitat és parella, el càlcul de F ( t ) {\displaystyle F(t)} és fa per arguments de simetria.

Prova
Fixat t 0 {\displaystyle t\geq 0} , tenim que
F ( t ) = t f ( x ) d x = 0 f ( x ) d x + 0 t f ( x ) d x = 1 2 + Γ ( ( ν + 1 ) / 2 ) π ν Γ ( ν / 2 ) 0 t ( 1 + x 2 ν ) ν + 1 2 d x , {\displaystyle F(t)=\int _{-\infty }^{t}f(x)\,dx=\int _{-\infty }^{0}f(x)\,dx+\int _{0}^{t}f(x)\,dx={\frac {1}{2}}+{\frac {\Gamma {\big (}(\nu +1)/2{\big )}}{{\sqrt {\pi \nu }}\,\Gamma {\big (}\nu /2{\big )}}}\int _{0}^{t}{\Big (}1+{\frac {x^{2}}{\nu }}{\Big )}^{-{\frac {\nu +1}{2}}}\,dx,}
on hem utilitzat la simetria respecte l'eix d'ordenades de la funció de densitat f ( t ) {\displaystyle f(t)} . A la darrera integral fem el canvi
1 + x 2 ν = 1 y , {\displaystyle 1+{\frac {x^{2}}{\nu }}={\frac {1}{y}},}
amb la qual cosa aquesta integral queda

0 t ( 1 + t 2 ν ) ( ν + 1 ) / 2 d x = ν 2 1 ν / ( ν + t 2 ) y ( ν + 1 ) / 2 y 3 / 2 ( 1 y ) 1 / 2 d y = ν 2 ν / ( ν + t 2 ) 1 y ν / 2 1 ( 1 y ) 1 / 2 1 d y = ν 2 ( B ( ν 2 , 1 2 ) B ( ν 2 , 1 2 ) I ν / ( ν + t 2 ) ( ν 2 , 1 2 ) ) , {\displaystyle {\begin{aligned}\int _{0}^{t}{\Big (}1+{\frac {t^{2}}{\nu }}{\Big )}^{-(\nu +1)/2}\,dx&=-{\frac {\sqrt {\nu }}{2}}\int _{1}^{\nu /(\nu +t^{2})}y^{(\nu +1)/2}y^{-3/2}(1-y)^{-1/2}\,dy\\&={\frac {\sqrt {\nu }}{2}}\int _{\nu /(\nu +t^{2})}^{1}y^{\nu /2-1}(1-y)^{1/2-1}\,dy\\&={\frac {\sqrt {\nu }}{2}}{\Big (}B{\big (}{\tfrac {\nu }{2}},{\tfrac {1}{2}}{\big )}-B{\big (}{\tfrac {\nu }{2}},{\tfrac {1}{2}}{\big )}\,I_{\nu /(\nu +t^{2})}{\big (}{\tfrac {\nu }{2}},{\tfrac {1}{2}}{\big )}{\Big )},\end{aligned}}}

on B ( a , b ) {\displaystyle B(a,b)} és la funció Beta i és la funció Beta incompleta regularitzada I x ( a , b ) {\displaystyle I_{x}(a,b)} . D'on es dedueix la fórmula per a F ( t ) {\displaystyle F(t)} .

També, per a t 2 < ν {\displaystyle t^{2}<\nu } , es pot escriure la funció de distribució en termes d'una funció hipergeomètrica[5]

F ( t ) = 1 2 + t Γ ( ( ν + 1 ) / 2 ) π ν Γ ( ν / 2 ) 2 F 1 ( 1 2 , 1 2 ( ν + 1 ) ; 3 2 ; t 2 ν ) , {\displaystyle F(t)={\frac {1}{2}}+t\,{\frac {\Gamma {\big (}(\nu +1)/2{\big )}}{{\sqrt {\pi \nu }}\,\Gamma {\big (}\nu /2{\big )}}}\,{}_{2}\!F_{1}\left({\tfrac {1}{2}},{\tfrac {1}{2}}(\nu +1);{\tfrac {3}{2}};-{\tfrac {t^{2}}{\nu }}\right),}
on 2 F 1 {\displaystyle {}_{2}\!F_{1}} és una funció hipergeomètrica.

Moments

Sigui n {\displaystyle n} un nombre natural. Aleshores

  • Si 1 n < ν {\displaystyle 1\leq n<\nu } , tenim que
    E [ T n ] = { 0 , si   n   és senar , ν n / 2 Γ ( n + 1 2 ) Γ ( ν n 2 ) Γ ( 1 2 ) Γ ( ν 2 ) , si   n   és parell . {\displaystyle E[T^{n}]={\begin{cases}0,&{\text{si}}\ n\ {\text{és senar}},\\\\\nu ^{n/2}\,{\dfrac {\Gamma {\big (}{\frac {n+1}{2}}{\big )}\,\Gamma {\big (}{\frac {\nu -n}{2}}{\big )}}{\Gamma {\big (}{\frac {1}{2}}{\big )}\Gamma {\big (}{\frac {\nu }{2}}{\big )}}},&{\text{si}}\ n\ {\text{és parell}}.\end{cases}}}
  • Si n ν {\displaystyle n\geq \nu } , llavors E [ | T n | ] = {\displaystyle E{\big [}\vert T^{n}\vert {\big ]}=\infty } , i en conseqüència el moment d'ordre n {\displaystyle n} no existeix.


En el cas n {\displaystyle n} parell, n < ν {\displaystyle n<\nu } , també tenim [5]

E [ T n ] = ν n / 2 1 3 ( n 1 ) ( ν n ) ( ν n + 2 ) ( ν 2 ) = ν n / 2 i = 1 n / 2 2 i 1 ν 2 i , {\displaystyle E[T^{n}]=\nu ^{n/2}\,{\frac {1\cdot 3\cdots (n-1)}{(\nu -n)(\nu -n+2)\cdots (\nu -2)}}=\nu ^{n/2}\,\prod _{i=1}^{n/2}{\frac {2i-1}{\nu -2i}},}


En particular, si ν > 1 {\displaystyle \nu >1} , llavors E [ T ] = 0 {\displaystyle E[T]=0} . Si ν > 2 {\displaystyle \nu >2} , llavors

Var ( T ) = E [ T 2 ] = ν ν 2 . {\displaystyle {\text{Var}}(T)=E[T^{2}]={\frac {\nu }{\nu -2}}.}

Prova
El càlcul dels moments és senzill a partir de la definició de la variable T {\displaystyle T} . Comencem estudiant quan existeixen els moments de T {\displaystyle T} . D'acord amb la seva definició i les notacions que hem introduït,
E [ | T | n ] = ν n / 2 E [ | Z | n ] E [ Q n / 2 ] , {\displaystyle E{\big [}\vert T\vert ^{n}{\big ]}=\nu ^{n/2}\,E{\big [}\vert Z\vert ^{n}{\big ]}\,E{\big [}Q^{-n/2}{\big ]},}
on hem utilitzat que | Z | {\displaystyle \vert Z\vert } i Q {\displaystyle Q} són independents i positives. Atès que una variable normal té moments de tots els ordres, l'expressió anterior serà finita o no segons ho sigui E [ Q n / 2 ] {\displaystyle E[Q^{-n/2}]} . Tenim que

E [ Q n / 2 ] = 1 2 ν / 2 Γ ( ν / 2 ) 0 x n / 2 x ( ν / 2 ) 1 e x / 2 d x = 1 2 ν / 2 Γ ( ν / 2 ) 0 x ( ν n ) / 2 1 e x / 2 d x . {\displaystyle E{\big [}Q^{-n/2}{\big ]}={\frac {1}{2^{\nu /2}\Gamma (\nu /2)}}\int _{0}^{\infty }x^{-n/2}x^{(\nu /2)-1}e^{-x/2}\,dx={\frac {1}{2^{\nu /2}\Gamma (\nu /2)}}\int _{0}^{\infty }x^{(\nu -n)/2-1}e^{-x/2}\,dx.}
Fen el canvi y = x / 2 {\displaystyle y=x/2} , la integral de la dreta dóna 2 ( ν n ) / 2 Γ ( ( ν n ) / 2 ) {\displaystyle 2^{(\nu -n)/2}\Gamma ((\nu -n)/2)} quan ( ν n ) / 2 > 0 {\displaystyle (\nu -n)/2>0} , i + {\displaystyle +\infty } en cas contrari.

Ara, per calcular els moments quan ( ν n ) / 2 > 0 {\displaystyle (\nu -n)/2>0} , és a dir, si ν > n {\displaystyle \nu >n} , repetim els càlculs anteriors sense el valor absolut tenint en compte que per a una variable normal estàndard tenim

E [ Z n ] = { 0 , si   n   és senar , 2 n / 2 π Γ ( n + 1 2 ) , n   és parell . {\displaystyle E[Z^{n}]={\begin{cases}0,&{\text{si}}\ n\ {\text{és senar}},\\\\{\dfrac {2^{n/2}}{\sqrt {\pi }}}\,\Gamma {\big (}{\frac {n+1}{2}}{\big )},&n\ {\text{és parell}}.\end{cases}}}
D'on

E [ T n ] = ν n / 2 Γ ( n + 1 2 ) Γ ( ν n 2 ) Γ ( 1 2 ) Γ ( ν 2 ) . {\displaystyle E[T^{n}]=\nu ^{n/2}\,{\dfrac {\Gamma {\big (}{\frac {n+1}{2}}{\big )}\,\Gamma {\big (}{\frac {\nu -n}{2}}{\big )}}{\Gamma {\big (}{\frac {1}{2}}{\big )}\Gamma {\big (}{\frac {\nu }{2}}{\big )}}}.}

Aproximació normal

Sigui T ν t ( ν ) {\displaystyle T_{\nu }\sim t(\nu )} , aleshores per a ν {\displaystyle \nu } gran, T ν {\displaystyle T_{\nu }} és aproximadament normal estàndard N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} .[6]

Els següents gràfics mostren la densitat de la distribució t ν {\displaystyle t_{\nu }} per a valors creixents de ν {\displaystyle \nu } . La densitat de la distribució normal estàndard està dibuixada en blau. Noteu que la densitat de la distribució t ν {\displaystyle t_{\nu }} (en vermell) s'aproxima cada com més a la normal quan ν {\displaystyle \nu } creix.

Densitat de la distribució t ν {\displaystyle t_{\nu }} (en vermell) per a 1, 2, 3, 5, 10 i 30 graus de llibertat comparats amb la densitat de la distribució normal estàndard (en blau). Els gràfics anteriors surten en verd.
1 grau de llibertat
2 graus de llibertat
3 graus de llibertat
5 graus de llibertat
10 graus de llibertat
30 graus de llibertat
Prova
Designem per f ν ( x ) {\displaystyle f_{\nu }(x)} la funció de densitat de la distribució t ( ν ) {\displaystyle t(\nu )} ,
f ν ( x ) = Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ( 1 + x 2 ν ) ν + 1 2 , {\displaystyle f_{\nu }(x)={\frac {\Gamma {\big (}{\frac {\nu +1}{2}}{\big )}}{{\sqrt {\pi \nu }}\,\,\Gamma {\big (}{\frac {\nu }{2}}{\big )}}}{\bigg (}1+{\frac {x^{2}}{\nu }}{\bigg )}^{-{\frac {\nu +1}{2}}},}
aplicant les propietats asimptòtiques de la funció gamma i calculant un límit del nombre e {\displaystyle e} , es demostrar que
lim ν f ν ( x ) = 1 2 π e x 2 / 2 , {\displaystyle \lim _{\nu \to \infty }f_{\nu }(x)={\frac {1}{\sqrt {2\pi }}}\,e^{-x^{2}/2},}
d'on, per les propietats de la convergència en distribució, s'obté també l'aproximació normal a la distribució t ( ν ) {\displaystyle t(\nu )} .

Funció característica

Quan el nombre de graus de llibertat és una nombre natural, hi ha fórmules per la funció característica de la distribució de Student, que depenen de si els graus de llibertat son senars o parells, fórmules que cada cop són més complicades a l'augmentar el nombre de graus de llibertat[7]. Una fórmula general utilitzant funcions especials va ser obtinguda el 1995 independentment per S. Hurst [8] i A. H. Jorder (veieu).[9] Concretament, si T t ( ν ) {\displaystyle T\sim t(\nu )} ,

φ ( t ) = E [ e i t T ] = K ν / 2 ( ν | t | ) ( ν | t | ) ν / 2 Γ ( ν / 2 ) 2 ν / 2 1 , {\displaystyle \varphi (t)=E[e^{itT}]={\frac {K_{\nu /2}\left({\sqrt {\nu }}|t|\right)\,\left({\sqrt {\nu }}|t|\right)^{\nu /2}}{\Gamma (\nu /2)\,2^{\nu /2-1}}},}
on K ν ( x ) {\displaystyle K_{\nu }(x)} és la funció de Bessel modificada de segon tipus.

La distribució t de Student amb tres paràmetres

La funció de densitat f {\displaystyle f} d'una distribució t ( ν ) {\displaystyle t(\nu )} permet construir de la manera habitual una família de posició i escala :[10] sigui μ R {\displaystyle \mu \in \mathbb {R} } i σ > 0 {\displaystyle \sigma >0}  ; definim

f μ , σ ( x ) = 1 σ f ( x μ σ ) = Γ ( ν + 1 2 ) σ π ν Γ ( ν 2 ) ( 1 + ( x μ ) 2 ν σ 2 ) ν + 1 2 , x R . {\displaystyle f_{\mu ,\sigma }(x)={\frac {1}{\sigma }}f{\Big (}{\frac {x-\mu }{\sigma }}{\Big )}={\frac {\Gamma {\big (}{\frac {\nu +1}{2}}{\big )}}{\sigma {\sqrt {\pi \nu }}\,\,\Gamma {\big (}{\frac {\nu }{2}}{\big )}}}{\bigg (}1+{\frac {(x-\mu )^{2}}{\nu \sigma ^{2}}}{\bigg )}^{-{\frac {\nu +1}{2}}},\quad x\in \mathbb {R} .}
Aquesta distribució s'anomena distribució t {\displaystyle t} de Student amb tres paràmetres, o distribució t {\displaystyle t} de Student amb posició i escala, i es designa per t ( ν , μ , σ ) {\displaystyle t(\nu ,\mu ,\sigma )} o t ( ν , μ , σ 2 ) {\displaystyle t(\nu ,\mu ,\sigma ^{2})} . Alternativament, si X t ( ν ) {\displaystyle X\sim t(\nu )} , llavors la variable aleatòria
Y = μ + σ X {\displaystyle Y=\mu +\sigma X}

té distribució t ( ν , μ , σ ) {\displaystyle t(\nu ,\mu ,\sigma )} .

La distribució t de Student en Estadística

El paper central que té distribució t {\displaystyle t} de Student en la inferència estadística de poblacions normals és degut al següent teorema:[11]

Teorema. Sigui X 1 , , X n {\displaystyle X_{1},\dots ,X_{n}} una mostra d'una població normal N ( μ , σ 2 ) {\displaystyle {\mathcal {N}}(\mu ,\sigma ^{2})} , és a dir, les variables aleatòries X 1 , , X n {\displaystyle X_{1},\dots ,X_{n}} són independents i totes tenen distribució N ( μ , σ 2 ) {\displaystyle {\mathcal {N}}(\mu ,\sigma ^{2})} . Considerem la mitjana mostral

X ¯ = 1 n i = 1 n X i . {\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}
Aleshores:

  1. 1 σ 2 i = 1 n ( X i X ¯ ) 2 χ 2 ( n 1 ) . {\displaystyle {\frac {1}{\sigma ^{2}}}\sum _{i=1}^{n}{\big (}X_{i}-{\overline {X}}{\big )}^{2}\sim \chi ^{2}(n-1).}
  2. Les variables aleatòries X ¯ {\displaystyle {\overline {X}}} i i = 1 n ( X i X ¯ ) 2 {\displaystyle \sum _{i=1}^{n}{\big (}X_{i}-{\overline {X}}{\big )}^{2}} són independents.
  3. Sigui
    T = X ¯ μ S / n , {\displaystyle T={\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}},}

on

S 2 = 1 n 1 i = 1 n ( X i X ¯ ) 2 , {\displaystyle S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}{\big (}X_{i}-{\overline {X}}{\big )}^{2},}
és la variància mostral. Llavors, T t ( n 1 ) {\displaystyle T\sim t(n-1)} .

Vegeu la pàgina de la distribució χ 2 {\displaystyle \chi ^{2}} per a la demostració dels punts 1 i 2. El punt 3 es dedueix del fet que X ¯ N ( μ , σ 2 / n ) {\displaystyle {\overline {X}}\sim {\mathcal {N}}(\mu ,\sigma ^{2}/n)} i de les parts 1 i 2 i de la definició de la distribució t {\displaystyle t} de Student.

Vegeu la pàgina Interval de confiança per a exemples concrets d'utilització de la distribució de Student.


Relació amb altres distribucions

  • La distribució t ( 1 ) {\displaystyle t(1)} coincideix amb la distribució de Cauchy.
  • Si T t ( ν ) {\displaystyle T\sim t(\nu )} , aleshores T 2 {\displaystyle T^{2}} té una distribució F {\displaystyle F} amb 1 i ν {\displaystyle \nu } graus de llibertat: T 2 F ( 1 , ν ) {\displaystyle T^{2}\sim F(1,\nu )} .

Vegeu també

Notes

  1. Johnson, Kotz i Balakrisnan, 1995, Chapter 28.
  2. Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions, Volume 1. 2a edició. Nova York: Wiley, 1994, p. 417. ISBN 0-471-58495-9. 
  3. 3,0 3,1 Gradshteĭn, I. S.. Table of integrals, series and products. 7th ed. Oxford: Academic, 2007, p. 96, fórmula 2.263.3. ISBN 978-0-12-373637-6. 
  4. Johnson, Kotz i Balakrisnan, 1995, p. 364.
  5. 5,0 5,1 Johnson, Kotz i Balakrisnan, 1995, p. 365.
  6. Johnson, Kotz i Balakrisnan, 1995, p. 363.
  7. Johnson, Kotz i Balakrisnan, 1995, p. 367-368.
  8. Hurst, Simon. [url=https://web.archive.org/web/20100218072259/http://wwwmaths.anu.edu.au/research.reports/srr/95/044/ The Characteristic Function of the Student-t Distribution], Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95
  9. Gaunt, Robert E. «A simple proof of the characteristic function of Student’s t -distribution» (en anglès). Communications in Statistics - Theory and Methods, 50, 14, 18-07-2021, pàg. 3380–3383. DOI: 10.1080/03610926.2019.1702695. ISSN: 0361-0926.
  10. Casella, George; Berger, Roger L. Statistical inference. 2. ed. Pacific Grove, Calif: Duxbury, 2002, p. 119. ISBN 978-0-534-24312-8. 
  11. DeGroot, Morris H. Probabilidad y estadística. 2a. ed. Wilmington, Delawere, E.U.A.: Addison-Wesley Iberoamericaca, 1988, p. 373-374 i 379-380. ISBN 0-201-64405-3. 

Bibliografia

  • Johnson, N. L.; Kotz, S.; Balakrishnan, N. Continuous Univariate Distributions, Volume 2. 2a edició. Nova York: Wiley, 1995. ISBN 0-471-58494-0. 




  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies