Analiza czynnikowa

Analiza czynnikowa – metoda statystyczna, której celem jest opisanie zależności między zaobserwowanymi, skorelowanymi zmiennymi przy pomocy możliwie mniejszej liczby zmiennych nieobserwowanych nazywanych czynnikami bądź faktorami, które są wzajemnie nieskorelowane. Prekursorem analizy czynnikowej był Charles Spearman. Jedną z kluczowych postaci, które przyczyniły się do powstania tej procedury, był Henry Felix Kaiser.

Zmienne obserwowane są następnie modelowane jako suma odpowiednich kombinacji liniowych nowych zmiennych nieobserwowanych oraz błędu pomiaru (zob. biały szum).

Analiza czynnikowa jest powszechnie używana w biologii, psychologii (przy analizie struktury zjawisk badanych przez narzędzia kwestionariuszowe), marketingu, teorii decyzji oraz innych dziedzinach wiedzy.

Model statystyczny

Niech dany będzie zbiór p {\displaystyle p} zaobserwowanych zmiennych losowych x 1 , , x p {\displaystyle x_{1},\dots ,x_{p}} o średnich μ 1 , , μ p , {\displaystyle \mu _{1},\dots ,\mu _{p},} odpowiednio. Załóżmy, że dla pewnych (nieznanych) stałych l i j {\displaystyle l_{ij}} oraz k {\displaystyle k} zmiennych F j {\displaystyle F_{j}} (tzw. czynników czy faktorów), gdzie i { 1 , , p } {\displaystyle i\in \{1,\dots ,p\}} i j { 1 , , k } , {\displaystyle j\in \{1,\dots ,k\},} mamy związek

x i μ i = l i 1 F 1 + + l i k F k + ε i . {\displaystyle x_{i}-\mu _{i}=l_{i1}F_{1}+\ldots +l_{ik}F_{k}+\varepsilon _{i}.}

przy czym zmienne ε i {\displaystyle \varepsilon _{i}} są interpretowane jako błędy będące zmiennymi o zerowej wartości oczekiwanej i skończonej wariancji. Powyższy związek można zapisać macierzowo jako

x μ = L F + ε . {\displaystyle x-\mu =LF+\varepsilon .}

Mając n {\displaystyle n} obserwacji, powyżej x {\displaystyle x} jest macierzą p × n , {\displaystyle p\times n,} L {\displaystyle L} jest macierzą p × k {\displaystyle p\times k} natomiast F {\displaystyle F} jest macierzą k × n . {\displaystyle k\times n.} Każda kolumna macierzy x {\displaystyle x} i F {\displaystyle F} oznacza wartości odpowiadające obserwacjom natomiast macierz L {\displaystyle L} nie zależy od obserwacji.

Ponadto, o macierzy losowej F {\displaystyle F} zakłada się, że:

  1. jest ona niezależna od ε , {\displaystyle \varepsilon ,}
  2. E ( F ) = 0 , {\displaystyle \mathrm {E} (F)=0,}
  3. c o v ( F ) = I {\displaystyle \mathrm {cov} (F)=I} jest macierzą identyczności, co oznacza, że faktory są parami nieskorelowane.

Celem analizy czynnikowej jest wyznaczanie par macierzy F {\displaystyle F} i L , {\displaystyle L,} które spełniają powyższe równania i warunki.

Oznaczając

c o v ( x μ ) = Σ , {\displaystyle \mathrm {cov} (x-\mu )=\Sigma ,}

można zapisać:

c o v ( x μ ) = c o v ( L F + ε ) , {\displaystyle \mathrm {cov} (x-\mu )=\mathrm {cov} (LF+\varepsilon ),}

bądź równoważnie

Σ = L c o v ( F ) L T + c o v ( ε ) . {\displaystyle \Sigma =L\cdot \mathrm {cov} (F)\cdot L^{T}+\mathrm {cov} (\varepsilon ).}

Niejednoznaczność rozwiązań

Dla każdej macierzy ortogonalnej Q {\displaystyle Q} stopnia p , {\displaystyle p,} kładąc L = L Q {\displaystyle L'=LQ} oraz F = Q T F , {\displaystyle F'=Q^{T}F,} tak zdefiniowane macierze spełniają powyższe warunki, o ile tylko F {\displaystyle F} i L {\displaystyle L} je spełniają, tzn. zbiór rozwiązań problemu jest niejednoznaczny oraz niezmienniczy ze względu na przekształcenia ortogonalne.

Podejścia

W analizie czynnikowej istnieją dwa podejścia:

  • eksploracyjna analiza czynnikowa (EFA, od ang. exploratory factor analysis) – czynniki są początkowo nieznane i zostają wyodrębnione dzięki analizie wartości zmiennych losowych,
  • konfirmacyjna analiza czynnikowa (CFA, od ang. confirmatory factor analysis) – zakładamy istnienie pewnego określonego zbioru czynników i dzięki analizie wartości zmiennych losowych badamy zasadność naszego przypuszczenia i estymujemy parametry naszego modelu (modelowanie równań strukturalnych).

Jest wiele metod analizy czynnikowej, jednak najbardziej popularne są dwie:

Niezależnie od metody, rozpoczynamy od budowy macierzy korelacji i sprawdzenia, czy możliwe jest zastosowanie analizy czynnikowej.

Bibliografia

  • Harry H. Harman, Modern Factor Analysis. 3rd Edition, The University of Chicago Press, Chicago 1976.
Kontrola autorytatywna (metoda statystyczna):
  • LCCN: sh85046817
  • GND: 4016338-6
  • BnF: 11934806q
  • BNCF: 25778
  • NKC: ph120126
  • J9U: 987007565339305171
Encyklopedia internetowa:
  • Britannica: topic/factor-analysis-psychology
  • Universalis: analyse-factorielle
  • SNL: faktoranalyse
  • DSDE: faktoranalyse