Kolmogorovův–Smirnovův test

Kolmogorovův-Smirnovův test je metoda matematické statistiky, která umožňuje testovat, zda dvě jednorozměrné náhodné proměnné pocházejí ze stejného rozdělení pravděpodobnosti, případně zda jedna jednorozměrná náhodná proměnná má předpokládané (teoretické) rozdělení. Autory metody jsou Andrej Nikolajevič Kolmogorov a Vladimir Ivanovič Smirnov. Existují dvě verze tohoto testu: jednovýběrový a dvouvýběrový.

Test pro jeden výběr

Jednovýběrový test ověřuje, zda se rozdělení náhodné veličiny v populaci liší od určitého teoretického rozdělení. Využívá se například pro ověření, zda má proměnná normální rozdělení.

Nulová hypotéza předpokládá, že testovaný výběr odpovídá vybranému teoretickému rozložení. Vstupem této varianty testu je k {\displaystyle k} tříd testovaného výběru a předpokládané teoretické rozdělení, které se rozdělí do stejného počtu tříd. Nad každou třídou testovaného výběru se spočítají četnosti n 1 i {\displaystyle n_{1i}} a nad každou třídou teoretického rozdělení se spočítají četnosti n 2 i {\displaystyle n_{2i}} . Dále se hodnotí rozdíl kumulativních četností pro výběr N 1 i = j = 1 i n 1 j {\displaystyle N_{1i}=\sum _{j=1}^{i}n_{1j}} a pro testované rozdělení N 2 i = j = 1 i n 2 j {\displaystyle N_{2i}=\sum _{j=1}^{i}n_{2j}} . Hodnoceným kritériem je pak

D 1 = 1 n max i | N 1 i N 2 i | {\displaystyle D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\,} , kde n {\displaystyle n} je celkový počet prvků výběru.

Hodnota kritéria D 1 {\displaystyle D_{1}} se porovná s kritickou hodnotou D 1 m a x {\displaystyle D_{1max}} pro danou hladinu významnosti α. Tato kritická hodnota bývá pro n 40 {\displaystyle n\leq 40} tabelována (např. zde), pro n > 40 {\displaystyle n>40} se spočítá podle následující tabulky.

Hladina významnosti α D1max
20 % 1.07 n {\displaystyle {\frac {1.07}{\sqrt {n}}}}
10 % 1.22 n {\displaystyle {\frac {1.22}{\sqrt {n}}}}
5 % 1.36 n {\displaystyle {\frac {1.36}{\sqrt {n}}}}
2 % 1.52 n {\displaystyle {\frac {1.52}{\sqrt {n}}}}
1 % 1.63 n {\displaystyle {\frac {1.63}{\sqrt {n}}}}

Jestliže je hodnota kritéria D 1 {\displaystyle D_{1}} větší než kritická, nulová hypotéza se zamítá.

Test pro dva výběry

Dvouvýběrový test srovnává rozdělení dvou náhodných veličin. Je to jedna z nejpoužívanějších a nejvšeobecnějších neparametrických metod porovnávání dvou výběrů.

Nulová hypotéza říká, že dva výběry odpovídají stejnému rozdělení. V této variantě testu se srovnává rozdíl kumulativních četností ( n 40 {\displaystyle n\leq 40} ) nebo relativních kumulativních četností ( n > 40 {\displaystyle n>40} ) dvou výběrů (kde n 1 , n 2 {\displaystyle n_{1},n_{2}} jsou celkové počty prvků výběru). Relativní kumulativní četnosti se spočítají jako F 1 i = 1 n N 1 i {\displaystyle F_{1i}={\frac {1}{n}}N_{1i}} resp. F 2 i = 1 n N 2 i {\displaystyle F_{2i}={\frac {1}{n}}N_{2i}} . Hodnoceným kritériem je

D 2 = max i | N 1 i N 2 i | {\displaystyle D_{2}=\max _{i}|N_{1i}-N_{2i}|\,} resp. D 2 = max i | F 1 i F 2 i | {\displaystyle D_{2}=\max _{i}|F_{1i}-F_{2i}|\,} .

Kritické hodnoty se pro danou hladinu významnosti α určí z následující tabulky.

Hladina významnosti α D2max
20 % 1.07 n 1 + n 2 n 1 n 2 {\displaystyle 1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}}
10 % 1.22 n 1 + n 2 n 1 n 2 {\displaystyle 1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}}
5 % 1.36 n 1 + n 2 n 1 n 2 {\displaystyle 1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}}
2 % 1.52 n 1 + n 2 n 1 n 2 {\displaystyle 1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}}
1 % 1.63 n 1 + n 2 n 1 n 2 {\displaystyle 1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}}

Jako v předchozí variantě platí, že nulová hypotéza se zamítá, jestliže je hodnota kritéria D 2 {\displaystyle D_{2}} větší než kritická D 2 m a x {\displaystyle D_{2max}} . V opačném případě se nezamítá.

Literatura

  • Jaromír Baštinec: Statistika, operační výzkum, stochastické procesy. Skripta FEKT VUT v Brně, Brno 2009.
Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.