Partieller Korrelationskoeffizient

Zwischen X {\displaystyle X} und Y {\displaystyle Y} besteht eine merkliche Korrelation. Betrachtet man die beiden rechten Punktwolken, so erkennt man, dass X {\displaystyle X} und Y {\displaystyle Y} jeweils stark mit U {\displaystyle U} korrelieren. Die beobachtete Korrelation zwischen X {\displaystyle X} und Y {\displaystyle Y} basiert nun fast ausschließlich auf diesem Effekt.

Der partielle Korrelationskoeffizient kontrolliert den Einfluss einer oder mehrerer Störfaktoren.

Definition

Eine Korrelation zwischen zwei statistischen Variablen (oder Merkmalen) X {\displaystyle X} und Y {\displaystyle Y} kann unter Umständen auf den Einfluss, die eine dritte Variable U {\displaystyle U} (ein Störfaktor) auf beide Variablen hat, zurückgehen. Um die Korrelation zwischen X {\displaystyle X} und Y {\displaystyle Y} zu messen, die verbleibt, wenn der Einfluss von U {\displaystyle U} eliminiert ist, gibt es das Konzept der partiellen Korrelation[1][2][3] (auch Partialkorrelation genannt).

Theoretischer partieller Korrelationskoeffizient

Für drei Zufallsvariablen X , Y {\displaystyle X,Y} und U {\displaystyle U} mit gemeinsamer Wahrscheinlichkeitsverteilung seien ϱ X Y {\displaystyle \varrho _{XY}} , ϱ X U {\displaystyle \varrho _{XU}} und ϱ Y U {\displaystyle \varrho _{YU}} die paarweisen theoretischen Korrelationskoeffizienten. Dann ist

ϱ ( X , Y ) / U := ϱ X Y ϱ X U ϱ Y U ( 1 ϱ X U 2 ) ( 1 ϱ Y U 2 ) {\displaystyle \varrho _{(X,Y)/U}:={\frac {\varrho _{XY}-\varrho _{XU}\cdot \varrho _{YU}}{\sqrt {(1-\varrho _{XU}^{2})(1-\varrho _{YU}^{2})}}}}

die theoretische partielle Korrelation der Zufallsvariablen X {\displaystyle X} und Y {\displaystyle Y} bzgl. der Zufallsvariablen U {\displaystyle U} (oder mit Elimination des Effekts der Zufallsvariablen U {\displaystyle U} ). Der Koeffizient ϱ ( X , Y ) / U {\displaystyle \varrho _{(X,Y)/U}} heißt auch (theoretischer) partieller Korrelationskoeffizient. Eine häufige Notation ist ϱ X , Y . U {\displaystyle \varrho _{X,Y.U}} .

Empirischer partieller Korrelationskoeffizient

Für beobachtete Werte ( x i , y i , u i ) {\displaystyle (x_{i},y_{i},u_{i})} für i = 1 , , n {\displaystyle i=1,\dots ,n} von drei Variablen X , Y {\displaystyle X,Y} und U {\displaystyle U} seien r X Y {\displaystyle r_{XY}} , r X U {\displaystyle r_{XU}} und r Y U {\displaystyle r_{YU}} die paarweisen empirischen Korrelationskoeffizienten. Dann ist

r ( X , Y ) / U := r X Y r X U r Y U ( 1 r X U 2 ) ( 1 r Y U 2 ) {\displaystyle r_{(X,Y)/U}:={\frac {r_{XY}-r_{XU}\cdot r_{YU}}{\sqrt {(1-r_{XU}^{2})(1-r_{YU}^{2})}}}}

die empirische partielle Korrelation der Variablen X {\displaystyle X} und Y {\displaystyle Y} bzgl. der Variablen U {\displaystyle U} (oder mit Elimination des Effekts der Variablen U {\displaystyle U} ). Der Koeffizient ϱ ( X , Y ) / U {\displaystyle \varrho _{(X,Y)/U}} heißt auch (empirischer) partieller Korrelationskoeffizient. Eine häufige Notation ist r X , Y . U {\displaystyle r_{X,Y.U}} .

In Zusammenhängen, bei denen klar ist, ob ein theoretischer oder ein empirischer Koeffizient gemeint ist, wird einfach von dem partiellen Korrelationskoeffizienten gesprochen.

Partieller Korrelationskoeffizient höherer Ordnung

Beim partielle Korrelationskoeffizient wird der Einfluss von mehr als einer Störvariable herausgerechnet.

Eigenschaften

  • Ein partieller Korrelationskoeffizient hat Werte im Intervall [ 1 , 1 ] {\displaystyle [-1,1]} .
  • Im Fall ϱ X U = ϱ Y U = 0 {\displaystyle \varrho _{XU}=\varrho _{YU}=0} gilt ϱ ( X , Y ) / U = ϱ X Y {\displaystyle \varrho _{(X,Y)/U}=\varrho _{XY}} .
  • Im Fall r X U = r Y U = 0 {\displaystyle r_{XU}=r_{YU}=0} gilt r ( X , Y ) / U = r X Y {\displaystyle r_{(X,Y)/U}=r_{XY}} .
  • Der partielle Korrelationskoeffizient stimmt unter bestimmten Bedingungen (jedoch nicht im Allgemeinen) mit der bedingten Korrelation überein[4].

Theoretischer Hintergrund

  • Für die Zufallsvariablen X {\displaystyle X} , Y {\displaystyle Y} und U {\displaystyle U} können die linearen Regressionen von X {\displaystyle X} auf U {\displaystyle U} ,
X ^ = α X + β X U , {\displaystyle {\hat {X}}=\alpha _{X}+\beta _{X}U\;,}
und von Y {\displaystyle Y} auf U {\displaystyle U} ,
Y ^ = α Y + β Y U , {\displaystyle {\hat {Y}}=\alpha _{Y}+\beta _{Y}U\;,}
gebildet werden. Die zugehörigen Residualvariablen (Regressionsreste)
V := X X ^ {\displaystyle V:=X-{\hat {X}}}
W := Y Y ^ {\displaystyle W:=Y-{\hat {Y}}}
enthalten diejenigen Anteile der Variablen X {\displaystyle X} und Y {\displaystyle Y} , die nicht durch einen linearen Zusammenhang mit U {\displaystyle U} erklärt werden können. Es gilt dann
ϱ V W = ϱ ( X , Y ) / U . {\displaystyle \varrho _{VW}=\varrho _{(X,Y)/U}\;.}
Diese Darstellung zeigt:
  1. Der partielle Korrelationskoeffizient ist ein gewöhnlicher Korrelationskoeffizient der Residualvariablen V {\displaystyle V} und W {\displaystyle W} und hat damit die Eigenschaften eines gewöhnlichen Korrelationskoeffizienten.
  2. Die Ausschaltung des Einflusses der Variablen U {\displaystyle U} erfolgt durch lineare Regressionen, so dass nichtlineare Einflüsse von U {\displaystyle U} nur teilweise erfasst werden oder unentdeckt bleiben.
  3. Eine Verallgemeinerung des Konzeptes auf mehrere Einflussfaktoren U 1 , , U m {\displaystyle U_{1},\dots ,U_{m}} ist möglich, indem die linearen Einfachregressionen auf die Variable U {\displaystyle U} durch multiple lineare Regressionen auf mehrere Variablen U 1 , , U m {\displaystyle U_{1},\dots ,U_{m}} ersetzt werden und dann die Korrelationen der resultierenden Residualvariablen betrachtet werden.
  • Für beobachtete Werte ( x i , y i , u i ) {\displaystyle (x_{i},y_{i},u_{i})} , i = 1 , , n {\displaystyle i=1,\dots ,n} , seien
x ^ i = a X + b X u i , {\displaystyle {\hat {x}}_{i}=a_{X}+b_{X}u_{i}\;,}
y ^ i = a X + b Y u i {\displaystyle {\hat {y}}_{i}=a_{X}+b_{Y}u_{i}}
die geschätzten Werte aus linearen Regressionen von X {\displaystyle X} auf U {\displaystyle U} bzw. von Y {\displaystyle Y} auf U {\displaystyle U} nach der Methode der kleinsten Quadrate. Für die empirische Korrelation der Regressionsreste
v i := x i x ^ i , i = 1 , , n {\displaystyle v_{i}:=x_{i}-{\hat {x}}_{i},\quad i=1,\dots ,n}
w i := y i y ^ i , i = 1 , , n {\displaystyle w_{i}:=y_{i}-{\hat {y}}_{i},\quad i=1,\dots ,n}
gilt dann
r V W = r ( X , Y ) / U . {\displaystyle r_{VW}=r_{(X,Y)/U}\;.}

Inferenzstatistischer Zusammenhang

Im inferenzstatistischen Kontext repräsentiert die gemeinsame Wahrscheinlichkeitsverteilung von ( X , Y , U ) {\displaystyle (X,Y,U)} die Verteilung der drei Merkmale in der Grundgesamtheit und ϱ ( X , Y ) / U {\displaystyle \varrho _{(X,Y)/U}} beschreibt die (unbekannte) partielle Korrelation in der Grundgesamtheit.

Die beobachteten Werte ( x i , y i , u i ) {\displaystyle (x_{i},y_{i},u_{i})} für i = 1 , , n {\displaystyle i=1,\dots ,n} werden als realisierte Werte von stochastisch unabhängigen und identisch verteilten Zufallsvektoren ( X i , Y i , U i ) {\displaystyle (X_{i},Y_{i},U_{i})} für i = 1 , , n {\displaystyle i=1,\dots ,n} aufgefasst, die jeweils die Wahrscheinlichkeitsverteilung von ( X , Y , U ) {\displaystyle (X,Y,U)} besitzen.

In diesem Zusammenhang sind die aus den beobachteten Werten berechneten empirischen Korrelationskoeffizienten r X Y {\displaystyle r_{XY}} , r X U {\displaystyle r_{XU}} und r Y U {\displaystyle r_{YU}} Schätzwerte für die Korrelationskoeffizienten ϱ X Y {\displaystyle \varrho _{XY}} , ϱ X U {\displaystyle \varrho _{XU}} und ϱ Y U {\displaystyle \varrho _{YU}} und der empirische partielle Korrelationskoeffizient r ( X , Y ) / U {\displaystyle r_{(X,Y)/U}} ist ein Schätzwert für den unbekannten Grundgesamtheitsparamter ϱ ( X , Y ) / U {\displaystyle \varrho _{(X,Y)/U}} .

Beispiel

In einer Firma werden zufällig Mitarbeiter ausgewählt und die Körpergröße bestimmt. Zudem muss jeder Befragte sein Einkommen angeben. Das Ergebnis der Untersuchung ist, dass Körpergröße und Einkommen positiv korrelieren, also größere Personen auch mehr verdienen. Bei einer genaueren Untersuchung stellt sich jedoch heraus, dass der Zusammenhang auf die Drittvariable Geschlecht zurückgeführt werden kann. Frauen sind im Durchschnitt kleiner als Männer, verdienen aber auch oftmals weniger. Berechnet man nun die Partialkorrelation zwischen Einkommen und Körpergröße unter Kontrolle des Geschlechts, so verschwindet der Zusammenhang. Größere Männer verdienen demnach beispielsweise nicht mehr als kleinere Männer. Dieses Beispiel ist fiktiv und der Zusammenhang in der Realität komplizierter,[5] es kann jedoch die Idee der Partialkorrelation veranschaulichen.

Zeitreihen

Bei Zeitreihen wird die partielle Autokorrelationsfunktion φ {\displaystyle \varphi } bei Verzögerung h {\displaystyle h} definiert als

φ ( h ) = r X 0 X h { X 1 , , X h 1 } {\displaystyle \varphi (h)=r_{X_{0}X_{h}\cdot \{X_{1},\,\dots \,,X_{h-1}\}}}

Erweiterung

Der partielle Korrelationskoeffizient kann auch für Rangkorrelationskoeffizienten berechnet werden[6].

Einzelnachweise

  1. P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, 2. Abhängigkeitsmaße für mehrere Zufallsgrößen, S. 3–4. 
  2. Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 91–92. 
  3. T. W. Anderson: Introduction to Multivariate Statistical Analysis. 3. Auflage. Wiley, Hoboken 2003, ISBN 978-0-471-36091-9, S. 41. 
  4. Kunihiro Baba, Ritei Shibata, Masaaki Sibuya: Partial correlation and conditional correlation as measures of conditional independence. In: Australian & New Zealand Journal of Statistics. Band 46, Nr. 4, S. 657–664, doi:10.1111/j.1467-842X.2004.00360.x. 
  5. Der Einfluss der Körpergröße auf Lohnhöhe und Berufswahl: Aktueller Forschungsstand und neue Ergebnisse auf Basis des Mikrozensus. (PDF; 213 kB). In: destatis.de. 2010, abgerufen am 26. November 2021.
  6. Hipel, K., McLeod, A. (1994). Time Series Modelling of Water Resources and Environmental Systems. Niederlande: Elsevier Science. https://books.google.de/books?id=t1zG8OUbgdgC&pg=PA883 Seite 883