Korelace

ikona
Tento článek není dostatečně ozdrojován, a může tedy obsahovat informace, které je třeba ověřit.
Jste-li s popisovaným předmětem seznámeni, pomozte doložit uvedená tvrzení doplněním referencí na věrohodné zdroje.

Korelace (z lat. souvztažnost) znamená vzájemný vztah mezi dvěma náhodnými procesy nebo náhodnými veličinami. Pokud se jedna z náhodných veličin mění, mění se i druhá a naopak. Pokud se mezi dvěma náhodnými procesy identifikuje korelace, je pravděpodobné, že na sobě závisejí. Z korelovanosti náhodných procesů nebo náhodných veličin však nelze usuzovat na příčinný vztah. Tedy jeden z nich nemusí být příčinou a druhý následkem. Toto samotná korelace nedovoluje rozhodnout, jelikož korelace neimplikuje kauzalitu a ani směr kauzality.[1][2]

Ve statistice se pojem korelace užívá pro vyjádření lineárního vztahu mezi náhodnými veličinami X a Y. Sílu korelace pak vyjadřuje korelační koeficient, který nabývá hodnoty −1 až +1.[2][3]

Korelace ve statistice

Na obrázku je několik příkladů grafického zobrazení dat a koeficienty jejich korelace s funkcí y = x

Vztah mezi znaky či náhodnými veličinami X a Y může být kladný, pokud (přibližně) platí Y = kX, nebo záporný (Y = -kX). Hodnota korelačního koeficientu −1 značí zcela nepřímou závislost (antikorelaci), tedy čím více se zvětší hodnoty v první skupině znaků, tím více se zmenší hodnoty v druhé skupině znaků, např. vztah mezi uplynulým a zbývajícím časem. Hodnota korelačního koeficientu +1 značí zcela přímou závislost, např. vztah mezi rychlostí bicyklu a frekvencí otáček kola bicyklu. Pokud je korelační koeficient roven 0 (nekorelovanost), pak mezi znaky není žádná statisticky zjistitelná lineární závislost. Je dobré si uvědomit, že i při nulovém korelačním koeficientu na sobě veličiny mohou záviset, pouze tento vztah nelze vyjádřit lineární funkcí (např. Y = X 2 {\displaystyle Y=X^{2}} ), a to ani přibližně.[2][3]

Pearsonův korelační koeficient

Pearsonův korelační koeficient je definován, pokud jsou druhé mocniny náhodných veličin X a Y E ( X 2 ) , E ( Y 2 ) {\displaystyle E(X^{2}),E(Y^{2})} konečné a jejich rozptyly nenulové. Vypočte se normováním kovariance tak, že ji podělíme směrodatnými odchylkami obou proměnných na bezrozměrné číslo nabývající hodnoty -1 až 1:

ρ X , Y = c o v ( X , Y ) σ X σ Y = E ( ( X μ X ) ( Y μ Y ) ) σ X σ Y {\displaystyle \rho _{X,Y}={\mathrm {cov} (X,Y) \over \sigma _{X}\sigma _{Y}}={E((X-\mu _{X})(Y-\mu _{Y})) \over \sigma _{X}\sigma _{Y}}}

Jelikož μ X = E ( X ) {\displaystyle \mu _{X}=E(X)} , σ X 2 = E ( X 2 ) E 2 ( X ) {\displaystyle \sigma _{X}^{2}=E(X^{2})-E^{2}(X)} a obdobně pro Y, lze výše uvedený vzorec upravit do přehlednějšího výpočetního tvaru:

ρ X , Y = E ( X Y ) E ( X ) E ( Y ) E ( X 2 ) E 2 ( X )   E ( Y 2 ) E 2 ( Y ) {\displaystyle \rho _{X,Y}={\frac {E(XY)-E(X)E(Y)}{{\sqrt {E(X^{2})-E^{2}(X)}}~{\sqrt {E(Y^{2})-E^{2}(Y)}}}}}

Korelační koeficient nabývá hodnot z intervalu 1 , 1 {\displaystyle \langle -1,1\rangle } . Při nezávislosti náhodných veličin X {\displaystyle X} a Y {\displaystyle Y} je korelační koeficient roven 0. Nulový korelační koeficient však neznamená, že jsou náhodné veličiny X {\displaystyle X} a Y {\displaystyle Y} nezávislé. Nulový korelační koeficient má například dvojice náhodných veličin X {\displaystyle X} a Y = X 2 {\displaystyle Y=X^{2}} .

Tuto míru asociace jako první odvodil anglický psycholog a antropolog sir Francis Galton.

Existují nicméně i jiné koeficienty asociace, například Spearmanovo rhó či Kendallovo tau pro ordinální (pořadová) data.

Korelace v teorii signálů

Související informace naleznete také v článku korelace (zpracování signálu).

Zkrácený výraz pro korelační funkci.

Pro spojité signály f ( t ) {\displaystyle f(t)} a g ( t ) {\displaystyle g(t)} :

( f g ) ( t )   = d e f f ( τ ) g ( t + τ ) d τ {\displaystyle (f\star g)(t)\ {\stackrel {\mathrm {def} }{=}}\int _{-\infty }^{\infty }f^{*}(\tau )\cdot g(t+\tau )\,{\rm {d}}\tau }

Pro diskrétní signály f k {\displaystyle f_{k}} a g k {\displaystyle g_{k}} :

( f g ) k   = d e f i = f i   g k + i {\displaystyle (f\star g)_{k}\ {\stackrel {\mathrm {def} }{=}}\sum _{i=-\infty }^{\infty }f_{i}^{*}\ g_{k+i}}

U komplexních signálů f {\displaystyle f^{*}} představuje komplexně sdružené číslo k f {\displaystyle f} .

Velmi se podobá konvoluci. Rozdíl je hlavně v časovém překlopení druhé funkce g {\displaystyle g} .

Autokorelací se rozumí korelace ( f f ) {\displaystyle (f\star f)} . Lze tak určit tzv. soběpodobnost signálu, tedy zda se např. signál v určitých periodách opakuje.

Související články

Externí odkazy

  • Logo Wikimedia Commons Obrázky, zvuky či videa k tématu korelace na Wikimedia Commons
Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.

Reference

  1. 13 - Korelace (MAT - Statistika). [s.l.]: [s.n.] Dostupné online. 
  2. a b c Co je to korelace a kauzalita? - Vědecké kladivo AK 14. [s.l.]: [s.n.] Dostupné online. 
  3. a b Korelace – co to je korelace a co znamená korelační koeficient [online]. 2021-01-03 [cit. 2023-06-09]. Dostupné online. 
Autoritní data Editovat na Wikidatech
  • BNF: cb11978503n (data)
  • GND: 4165343-9
  • LCCN: sh85033032
  • NLI: 987007567883105171