Csebisev-egyenlőtlenség

A Csebisev-egyenlőtlenség a valószínűségszámítás egyik egyenlőtlensége. Nevét Pafnutyij Lvovics Csebisev orosz matematikusról kapta. Lényege, hogy jelentőséget ad a szórásnak, azaz arra ad becslést a szórás felhasználásával, hogy egy valószínűségi változó mekkora eséllyel tér el egy előre adott mértéknél jobban a várható értéktől.

Állítás

Formálisan, legyen X {\displaystyle X} véges szórású valószínűségi változó, várható értéke

μ := E ( X ) {\displaystyle \mu :=\operatorname {E} (X)}

és szórásnégyzete

σ 2 := Var ( X ) {\displaystyle \sigma ^{2}:=\operatorname {Var} (X)} .

Ekkor a k > 0 {\displaystyle k>0} valós számokra

P [ | X μ | k ] σ 2 k 2 {\displaystyle \operatorname {P} \left[\left|X-\mu \right|\geq k\right]\leq {\frac {\sigma ^{2}}{k^{2}}}} .

A komplementer eseményre

P [ | X μ | < k ] 1 σ 2 k 2 {\displaystyle \operatorname {P} \left[\left|X-\mu \right|<k\right]\geq 1-{\frac {\sigma ^{2}}{k^{2}}}} .

A becslés jósága

A Csebisev-egyenlőtlenség éles abban az értelemben, hogy vannak valószínűségi változók, amelyekre a becslés egyenlőséggel teljesül.

Legyen például X {\displaystyle X} diszkrét valószínűségi változó, és

P [ X = 0 ] = 1 p {\displaystyle \operatorname {P} \left[X=0\right]=1-p}

továbbá

P [ X = a ] = P [ X = a ] = p / 2 {\displaystyle \operatorname {P} \left[X=-a\right]=\operatorname {P} \left[X=a\right]=p/2} ,

ahol a {\displaystyle a} egy pozitív szám, és p ( 0 , 1 ) {\displaystyle p\in (0,1)} . Ekkor μ = E ( X ) = 0 {\displaystyle \mu =\operatorname {E} (X)=0} és σ 2 = Var ( X ) = a 2 p {\displaystyle \sigma ^{2}=\operatorname {Var} (X)=a^{2}p} , így a becslés

P ( | X 0 | k ) a 2 p k 2 {\displaystyle P(|X-0|\geq k)\leq {\frac {a^{2}p}{k^{2}}}}

ami k = a {\displaystyle k=a} esetén egyenlőséggel teljesül, mivel ekkor P ( | X | k ) = P ( | X | a ) = p {\displaystyle P(|X|\geq k)=P(|X|\geq a)=p} .

Általában a becslés nem sokat mond. Például, ha k σ {\displaystyle k\leq \sigma } , akkor a becslés triviális. A tétel mégis gyakran hasznos, mivel ehhez nem kell ismerni az eloszlást, és minden véges szórású valószínűségi változóra alkalmazható, még a normális eloszlástól távol állókra is. A korlátok is egyszerűen meghatározhatók.

Változatok

Standard eltéréssel

Ha a σ {\displaystyle \sigma } standard eltérés nem nulla, és λ {\displaystyle \lambda } pozitív, akkor a k = λ σ {\displaystyle k=\lambda \sigma } helyettesítéssel az egyenlőtlenség gyakran idézett alakját kapjuk:

P [ | X μ | λ σ ] 1 λ 2 {\displaystyle \operatorname {P} \left[\left|X-\mu \right|\geq \lambda \sigma \right]\leq {\frac {1}{\lambda ^{2}}}} .

Ez csak λ > 1 {\displaystyle \lambda >1} esetén ad érdemi becslést, mivel a 0 < λ 1 {\displaystyle 0<\lambda \leq 1} esetben triviális, hiszen a valószínűségek sosem nagyobbak 1-nél.

Magasabb momentumokra

Az egyenlőtlenség magasabb momentumokra is általánosítható. Ezt nem ritkán szintén Csebisev-egyenlőtlenségnek nevezik,[1] A valószínűségszámításban ez inkább Markov-egyenlőtlenségként ismert.[2][3] Néhány szerző a Csebisev-Markov elnevezést használja.[4]

Az egyenlőtlenség azt mondja, hogy ha ( Ω , Σ , ν ) {\displaystyle (\Omega ,\Sigma ,\nu )} mértéktér, f : Ω R 0 + {\displaystyle f\colon \Omega \to \mathbb {R} _{0}^{+}} mérhető függvény, és ε , p R + {\displaystyle \varepsilon ,p\in \mathbb {R} ^{+}} , akkor teljesül, hogy:

ν ( { x f ( x ) ε } ) 1 ε p Ω f p d ν {\displaystyle \nu (\{x\mid f(x)\geq \varepsilon \})\leq {\frac {1}{\varepsilon ^{p}}}\int _{\Omega }f^{p}{\rm {d}}\nu } .

Ez következik abból, hogy:

Ω f p d ν { x f ( x ) ε } f p d ν { x f ( x ) ε } ε p d ν = ε p ν ( { x f ( x ) ε } ) {\displaystyle \int _{\Omega }f^{p}\;{\rm {d}}\nu \geq \int _{\{x\mid f(x)\geq \varepsilon \}}f^{p}\;{\rm {d}}\nu \geq \int _{\{x\mid f(x)\geq \varepsilon \}}\varepsilon ^{p}\;{\rm {d}}\nu =\varepsilon ^{p}\nu (\{x\mid f(x)\geq \varepsilon \})}

Ebből speciális esetben adódik az eredeti egyenlőtlenség, ha ν = P {\displaystyle \nu =P} , f = | X μ | {\displaystyle f=|X-\mu |} és p = 2 {\displaystyle p=2} , akkor : P ( | X μ | k ) = P ( | X μ | 2 k 2 ) 1 k 2 Ω | X μ | 2 d P = σ 2 k 2 {\displaystyle P(|X-\mu |\geq k)=P(|X-\mu |^{2}\geq k^{2})\leq {\frac {1}{k^{2}}}\int _{\Omega }|X-\mu |^{2}\;{\rm {d}}P={\frac {\sigma ^{2}}{k^{2}}}} .

Példák

1. példa

A példa kedvéért tegyük fel, hogy egy Wikipédián a cikkek hosszának várható értéke 1000 bájt, a szórás 200 bájt! Ekkor a Csebisev-egyenlőtlenség szerint a cikkek legalább 75%-ának hossza 600 és 1400 közé esik ( k = 400 ,   μ = 1000 ,   σ = 200 {\displaystyle k=400,~\mu =1000,~\sigma =200} ).

A számítás:

P [ | X 1000 | < 400 ] 1 200 2 400 2 = 0 , 75 = 75   % {\displaystyle \operatorname {P} \left[\left|X-1000\right|<400\right]\geq 1-{\frac {200^{2}}{400^{2}}}=0{,}75=75\ \%}

2. példa

Az egyenlőtlenség egy másik alkalmazása az, hogy ha egy véges szórású valószínűségi változó várható értéke μ {\displaystyle \mu } és szórása σ {\displaystyle \sigma } , akkor az értékek fele az ( μ 2 σ , μ + 2 σ ) {\displaystyle (\mu -{\sqrt {2}}\sigma ,\mu +{\sqrt {2}}\sigma )} intervallumba esik.

3. példa

Egy véletlen esemény p {\displaystyle p} valószínűséggel következik be. A kísérletet n {\displaystyle n} -szer végzik el, az esemény k {\displaystyle k} -szor következik be. Ekkor k {\displaystyle k} binomiális eloszlású, várható értéke n p {\displaystyle np} , szórásnégyzete n p ( 1 p ) {\displaystyle np(1-p)} ; a bekövetkezés relatív gyakorisága k n {\displaystyle {\tfrac {k}{n}}} , ennek várható értéke p {\displaystyle p} és szórásnégyzete p ( 1 p ) n {\displaystyle {\tfrac {p(1-p)}{n}}} . A Csebisev-egyenlőtlenség szerint a relatív gyakoriság eltérése a várható értéktől

P [ | k n p | ϵ ] p ( 1 p ) ϵ 2 n 1 4 ϵ 2 n {\displaystyle \operatorname {P} \left[\left|{\frac {k}{n}}-p\right|\geq \epsilon \right]\leq {\frac {p(1-p)}{\epsilon ^{2}n}}\leq {\frac {1}{4\epsilon ^{2}n}}} ,

ahol a második becslést a számtani és mértani közepek egyenlőtlenségéből következő p ( 1 p ) 1 2 {\displaystyle {\sqrt {p(1-p)}}\leq {\tfrac {1}{2}}} adja.

Ez a forma már a nagy számok gyenge törvényének speciális esete, ami a relatív gyakoriságok sztochasztikus konvergenciáját mutatja a várható értékhez.

Ennél a példánál a Csebisev-egyenlőtlenség csak durva közelítést ad, pontosabb becslést a Chernoff-egyenlőtlenség szolgáltat.

Alkalmazások

  • Felhasználják a Borel-Cantelli-lemma és a nagy számok gyenge törvényének bizonyításában.[5]
  • Az általánosítással megmutatható, hogy a függvénysorozatok L p {\displaystyle L^{p}\;} értelemben vett konvergenciájából következik a mérték szerinti konvergencia.
  • Az m {\displaystyle m} mediánra igaz, hogy | μ m | σ {\displaystyle \left|\mu -m\right|\leq \sigma } .

Bizonyítása

A legtöbb szerző a Markov-egyenlőtlenségből vezeti le. A Markov-egyenlőtlenség

P [ Y k ] E [ h ( Y ) ] h ( k ) . {\displaystyle P\left[Y\geq k\right]\leq {\frac {\operatorname {E} \left[h(Y)\right]}{h(k)}}.}

ahol Y = | X μ | {\displaystyle Y=|X-\mu |} és h ( x ) = x 2 {\displaystyle h(x)=x^{2}} .[6][7][8]

Önálló bizonyítás található például Wirthsnél.[9] Legyen

A k = { ω Ω | X μ | k } {\displaystyle A_{k}=\{\omega \in \Omega \mid |X-\mu |\geq k\}} .

és jelölje 1 A {\displaystyle \mathbf {1} _{A}} az A {\displaystyle A} halmaz indikátorfüggvényét. Ekkor minden ω {\displaystyle \omega } esetén teljesül az

| X ( ω ) μ | 2 k 2 1 A k ( ω ) {\displaystyle |X(\omega )-\mu |^{2}\geq k^{2}\mathbf {1} _{A_{k}}(\omega )}

egyenlőtlenség.

Ha ω A k {\displaystyle \omega \notin A_{k}} , akkor a jobb oldal nulla, és az egyenlőtlenség teljesül. Ha ω A k {\displaystyle \omega \in A_{k}} , akkor definíció szerint a bal oldalon az A k {\displaystyle A_{k}} halmaz definíciója szerint tartalmaz legalább egy k 2 {\displaystyle k^{2}} értéket, így az egyenlőtlenség megint teljesül. A várható érték monotonitása miatt és a vele való számolás szabályai miatt a szórásnégyzet írható, mint

σ 2 = Var ( X ) = E ( | X μ | 2 ) E ( k 2 1 A k ) = k 2 P ( A k ) = k 2 P ( | X μ | k ) {\displaystyle \sigma ^{2}=\operatorname {Var} (X)=\operatorname {E} (|X-\mu |^{2})\geq \operatorname {E} (k^{2}\mathbf {1} _{A_{k}})=k^{2}P(A_{k})=k^{2}P(|X-\mu |\geq k)} .

k 2 {\displaystyle k^{2}} -tel osztva az egyenlőtlenség az állításban megadott alakot ölti.[10]

Története

Csebisev a diszkrét valószínűségi változókra bizonyította a tételt, és ezt 1867-ben jelentette meg Szentpéterváron és Párizsban, ott Joseph Liouville újságjában, aminek címe Journal de Mathématiques Pures et Appliquées. Azonban egy általánosabb bizonyítás már 1853-ban megjelent Irénée-Jules Bienaymé tollából, a Considérations a l’appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés. című lapban. Ez nem sokkal Csebisev cikkének megjelenése előtt újra közölte a cikket, és Csebisev elismerte Bienaymé elsőbbségét.[11][12]

Jegyzetek

  1. Robert B. Ash: Real Analysis and Probability. 1972, S. 84–85 & S. 227
  2. A. N. Širjaev: Wahrscheinlichkeit. 1988, S. 572
  3. R. G. Laha, V. K. Rohatgi: Probability Theory. 1979, S. 33
  4. Heinz Bauer: Maß- und Integrationstheorie. 1992, S. 128
  5. Heinz Bauer: Wahrscheinlichkeitstheorie. 2002, S. 69 ff
  6. Achim Klenke. Wahrscheinlichkeitstheorie, 3., Berlin Heidelberg: Springer-Verlag (2013). ISBN 978-3-642-36017-6 
  7. Hans-Otto Georgii. Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik, 4., Berlin: Walter de Gruyter (2009). ISBN 978-3-11-021526-7 
  8. Klaus D. Schmidt. Maß und Wahrscheinlichkeit, 2., átnézett, Heidelberg Dordrecht London New York: Springer-Verlag (2011). ISBN 978-3-642-21025-9 
  9. H. Wirths: Der Erwartungswert – Skizzen zur Begriffsentwicklung von Klasse 8 bis 13. In: Mathematik in der Schule 1995/Heft 6, S. 330–343
  10. Ehrhard Behrends. Elementare Stochastik. Ein Lernbuch – von Studierenden mitentwickelt. Wiesbaden: Springer Spektrum (2013). ISBN 978-3-8348-1939-0 
  11. Chebyshev, Pafnutii Lvovich
  12. V.V. Sazonov: Bienaymé, Irenée-Jules

Fordítás

Ez a szócikk részben vagy egészben a Tschebyscheffsche Ungleichung című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.