ポアソン二項分布

曖昧さ回避 ポアソン分布」あるいは「二項分布」とは異なります。
ポアソン二項分布
確率質量関数
累積分布関数
母数 p [ 0 , 1 ] n {\displaystyle \mathbf {p} \in [0,1]^{n}} n 回試行のそれぞれに対する成功確率
{ 0 , , n } {\displaystyle \{0,\cdots ,n\}}
確率質量関数 A F k i A p i j A c ( 1 p j ) {\displaystyle \sum _{A\in F_{k}}\prod _{i\in A}p_{i}\prod _{j\in A^{c}}(1-p_{j})}
累積分布関数 l = 0 k A F l i A p i j A c ( 1 p j ) {\displaystyle \sum _{l=0}^{k}\sum _{A\in F_{l}}\prod _{i\in A}p_{i}\prod _{j\in A^{c}}{(1-p_{j})}}
期待値 i = 1 n p i {\displaystyle \sum _{i=1}^{n}p_{i}}
分散 σ 2 = i = 1 n ( 1 p i ) p i {\displaystyle \sigma ^{2}=\sum _{i=1}^{n}(1-p_{i}){p_{i}}}
歪度 1 σ 3 i = 1 n ( 1 2 p i ) ( 1 p i ) p i {\displaystyle {\frac {1}{\sigma ^{3}}}\sum _{i=1}^{n}\left(1-2p_{i}\right)\left(1-p_{i}\right)p_{i}}
尖度 1 σ 4 i = 1 n ( 1 6 ( 1 p i ) p i ) ( 1 p i ) p i {\displaystyle {\frac {1}{\sigma ^{4}}}\sum _{i=1}^{n}\left(1-6(1-p_{i}){p_{i}}\right)\left(1-p_{i}\right)p_{i}}
モーメント母関数 i = 1 n ( 1 p i + p i e t ) {\displaystyle \prod _{i=1}^{n}(1-p_{i}+p_{i}e^{t})}
特性関数 i = 1 n ( 1 p i + p i e i t ) {\displaystyle \prod _{i=1}^{n}(1-p_{i}+p_{i}e^{it})}
テンプレートを表示

ポアソン二項分布(ポアソンにこうぶんぷ、: Poisson binomial distribution)とは、統計学および確率論における独立ベルヌーイ試行の和として定義される離散確率分布である。

別の言い方をすれば、これは成功確率がそれぞれ p1, p2 , …, pn でありそれぞれ独立な n 回の試行を行ったときの成功回数の離散確率分布である。

特に、成功確率が全て等しい (p1 = p2 = … = pn) ときは、ポアソン二項分布は普通の二項分布になる。すなわち二項分布はポアソン二項分布の特別な場合である。

確率質量関数

n 個の確率変数 Xi (i ∈ {1, 2, …, n}) は、それぞれ独立で成功確率がそれぞれ p1, p2, …, pn であるベルヌーイ試行とする。すなわち、

X i { 1 , 0 } , P ( X i = 1 ) = p i , Pr ( X i = 0 ) = 1 p i {\displaystyle X_{i}\in \{1,0\},\qquad P(X_{i}=1)=p_{i},\qquad \Pr(X_{i}=0)=1-p_{i}}

とする。確率変数 X = i = 1 n X i {\displaystyle X=\sum _{i=1}^{n}X_{i}} は、このような n 回の試行のうちで成功した回数を表す確率変数である。k 回成功する確率は次のような和で表現される[1]

Pr ( X = k ) = A F k i A p i j A c ( 1 p j ) {\displaystyle \Pr(X=k)=\sum _{A\in F_{k}}\prod _{i\in A}p_{i}\prod _{j\in A^{c}}(1-p_{j})}

ただし、Fk{1, 2, …, n} から選べる全ての k要素部分集合の族である。例えば n = 3 なら、F2 = {{1, 2}, {1, 3}, {2, 3}} である。また AcA の補集合。すなわち A c = { 1 , 2 , 3 , , n } A {\displaystyle A^{c}=\{1,2,3,\dots ,n\}\backslash A} である。

これが、定義から直接導かれるポアソン二項分布の確率質量関数である。Fk n ! ( n k ) ! k ! {\displaystyle {\frac {n!}{(n-k)!k!}}} 要素を含み、この数は n とともに急速に増大するため、試行回数 n が小さい場合以外は実際にこの和を計算することは困難である。(例えば n = 30 のとき F151020 もの要素を含む)。 幸いにも、 Pr ( X = k ) {\displaystyle \Pr(X=k)} を計算する非常に効果的な方法がある。1回も成功しない確率が分かれば、n 回成功の確率は次のようにして再帰的に計算できる[2]

Pr ( X = k ) = { i = 1 n ( 1 p i ) , k = 0 1 k i = 1 k ( 1 ) i 1 Pr ( X = k i ) T ( i ) , k > 0 {\displaystyle \Pr(X=k)=\left\{{\begin{aligned}&\prod _{i=1}^{n}(1-p_{i}),\qquad k=0\\&{\frac {1}{k}}\sum _{i=1}^{k}(-1)^{i-1}\Pr(X=k-i)T(i),\qquad k>0\\\end{aligned}}\right.}

ただし、 T ( i ) = j = 1 n ( p j 1 p j ) i {\displaystyle T(i)=\sum _{j=1}^{n}\left({\frac {p_{j}}{1-p_{j}}}\right)^{i}}

他にも離散フーリエ変換を使う次のような計算も可能である[3]

Pr ( X = k ) = 1 n + 1 l = 0 n C l k m = 1 n ( 1 + ( C l 1 ) p m ) {\displaystyle \Pr(X=k)={\frac {1}{n+1}}\sum _{l=0}^{n}C^{lk}\prod _{m=1}^{n}\left(1+(C^{l}-1){p_{m}}\right)}

ただし、 C = exp ( 2 i π n + 1 ) {\displaystyle C=\exp \left(-{\frac {2i\pi }{n+1}}\right)} である。

さらに他の方法も提案されている[4]


平均と分散

ポアソン二項分布は独立なベルヌーイ分布に従う n個の確率変数の和だから、その平均と分散は各ベルヌーイ分布における平均および分散の和となる。

μ = i = 1 n p i {\displaystyle \mu =\sum _{i=1}^{n}p_{i}}
σ 2 = i = 1 n ( 1 p i ) p i {\displaystyle \sigma ^{2}=\sum _{i=1}^{n}(1-p_{i})p_{i}}

レ・カムの定理

次の定理がルーシェン・レ・カム (Lucien le Cam) によって示された[5][6]

次のように仮定する。

  • X1, …, Xn はそれぞれベルヌーイ分布に従う独立な確率変数とする。(すなわち 01 の値をとる)ただしそれぞれが同一の分布である必要はない。(発生確率がそれぞれ異なっていてもよい) 各 i = 1, 2, 3, … に対して、 Pr ( X i = 1 ) = p i {\displaystyle \Pr(X_{i}=1)=p_{i}} とする。
  • λ n = p 1 + + p n . {\displaystyle \lambda _{n}=p_{1}+\cdots +p_{n}.}
  • S n = X 1 + + X n . {\displaystyle S_{n}=X_{1}+\cdots +X_{n}.} (すなわち Sn はポアソン二項分布に従う。)

このとき、

k = 0 | Pr ( S n = k ) λ n k e λ n k ! | < 2 i = 1 n p i 2 . {\displaystyle \sum _{k=0}^{\infty }\left|\Pr(S_{n}=k)-{\lambda _{n}^{k}e^{-\lambda _{n}} \over k!}\right|<2\sum _{i=1}^{n}{p_{i}}^{2}.}

換言すれば、この和はポアソン分布で近似できる。

各分布がすべて同じ値 p i = λ n n {\displaystyle p_{i}={\frac {\lambda _{n}}{n}}} とすれば、右辺は 2 λ n 2 n {\displaystyle 2{\frac {{\lambda _{n}}^{2}}{n}}} となる。すなわち、この定理は、二項分布の極限がポアソン分布になるというポアソンの極限定理の一般化である。

関連項目

出典

  1. ^ Wang, Y. H. (1993), “On the number of successes in independent trials” (PDF), Statistica Sinica 3 (2): 295-312, http://www3.stat.sinica.edu.tw/statistica/oldpdf/A3n23.pdf 2010年2月20日閲覧。 
  2. ^ Chen, X. H; A. P Dempster, J. S Liu (1994), “Weighted finite population sampling to maximize entropy” (PDF), Biometrika 81 (3): 457-469, http://www.people.fas.harvard.edu/~junliu/TechRept/94folder/cdl94.pdf 2010年2月20日閲覧。 
  3. ^ Fernandez, M.; S. Williams (2010), “Closed-Form Expression for the Poisson-Binomial Probability Density Function”, IEEE Transactions on Aerospace Electronic Systems 46: 803-817, doi:10.1109/TAES.2010.5461658 
  4. ^ Chen, S. X; J. S Liu (1997), “Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions”, Statistica Sinica 7: 875-892, http://www3.stat.sinica.edu.tw/statistica/password.asp?vol=7&num=4&art=4 2010年2月20日閲覧。 
  5. ^ Le Cam, L. (1960), “An Approximation Theorem for the Poisson Binomial Distribution” (PDF), Pacific Journal of Mathematics 10 (4): 1181-1197, MR0142174. Zbl 0118.33601, http://projecteuclid.org/euclid.pjm/1103038058 2010年2月20日閲覧。 
  6. ^ Le Cam, L. (1963), Jerzy Neyman; Lucien le Cam, eds., On the Distribution of Sums of Independent Random Variables, New York: Springer-Verlag, pp. 179-202, MR0199871 

参考文献

  • Steele, J. Michael (1994), “Le Cam's Inequality and Poisson Approximations” (PDF), The American Mathematical Monthly 101 (1): 48-54, doi:10.2307/2325124, http://www-stat.wharton.upenn.edu/~steele/Papers/PDF/LIaPA.pdf 2010年2月20日閲覧。 
離散単変量で
有限台
離散単変量で
無限台
  • ベータ負二項(英語版)
  • ボレル(英語版)
  • コンウェイ–マクスウェル–ポワソン(英語版)
  • 離散位相型(英語版)
  • ドラポルト(英語版)
  • 拡張負二項(英語版)
  • ガウス–クズミン
  • 幾何
  • 対数(英語版)
  • 負の二項
  • 放物フラクタル(英語版)
  • ポワソン
  • スケラム(英語版)
  • ユール–サイモン(英語版)
  • ゼータ(英語版)
連続単変量で
有界区間に台を持つ
  • 逆正弦(英語版)
  • ARGUS(英語版)
  • バルディング–ニコルス(英語版)
  • ベイツ(英語版)
  • ベータ
  • beta rectangular(英語版)
  • アーウィン–ホール(英語版)
  • クマラスワミー(英語版)
  • ロジット-正規(英語版)
  • 非中心ベータ(英語版)
  • raised cosine(英語版)
  • reciprocal(英語版)
  • 三角
  • U-quadratic(英語版)
  • 一様
  • ウィグナー半円
連続単変量で
半無限区間に台を持つ
  • ベニーニ(英語版)
  • ベンクタンダー第一種(英語版)
  • ベンクタンダー第二種(英語版)
  • 第2種ベータ
  • Burr(英語版)
  • カイ二乗
  • カイ(英語版)
  • Dagum(英語版)
  • デービス(英語版)
  • 指数-対数(英語版)
  • アーラン
  • 指数
  • F
  • folded normal(英語版)
  • Flory–Schulz(英語版)
  • フレシェ
  • ガンマ
  • gamma/Gompertz(英語版)
  • 一般逆ガウス(英語版)
  • Gompertz(英語版)
  • half-logistic(英語版)
  • half-normal(英語版)
  • Hotelling's T-squared(英語版)
  • 超アーラン(英語版)
  • 超指数(英語版)
  • hypoexponential(英語版)
  • 逆カイ二乗(英語版)
    • scaled inverse chi-squared(英語版)
  • 逆ガウス
  • 逆ガンマ
  • コルモゴロフ
  • レヴィ
  • 対数コーシー
  • 対数ラプラス(英語版)
  • 対数ロジスティック(英語版)
  • 対数正規
  • ロマックス(英語版)
  • 行列指数(英語版)
  • マクスウェル–ボルツマン
  • マクスウェル–ユットナー(英語版)
  • ミッタク-レフラー(英語版)
  • 仲上(英語版)
  • 非心カイ二乗
  • パレート
  • 位相型(英語版)
  • poly-Weibull(英語版)
  • レイリー
  • relativistic Breit–Wigner(英語版)
  • ライス(英語版)
  • shifted Gompertz(英語版)
  • 切断正規
  • タイプ2ガンベル(英語版)
  • ワイブル
    • 離散ワイブル(英語版)
  • ウィルクスのラムダ(英語版)
連続単変量で
実数直線全体に台を持つ
連続単変量で
タイプの変わる台を持つ
  • 一般極値
  • 一般パレート(英語版)
  • マルチェンコ–パストゥール(英語版)
  • q-指数(英語版)
  • q-ガウス
  • q-ワイブル(英語版)
  • shifted log-logistic(英語版)
  • トゥーキーのラムダ(英語版)
混連続-離散単変量
  • rectified Gaussian(英語版)
多変量 (結合)
【離散】
エウェンズ(英語版)
多項
ディリクレ多項(英語版)
負多項(英語版)
【連続】
ディリクレ
一般ディリクレ(英語版)
多変量正規
多変量安定(英語版)
多変量 t(英語版)
正規逆ガンマ(英語版)
正規ガンマ(英語版)
行列値
逆行列ガンマ(英語版)
逆ウィッシャート(英語版)
行列正規(英語版)
行列 t(英語版)
行列ガンマ(英語版)
正規逆ウィッシャート(英語版)
正規ウィッシャート(英語版)
ウィッシャート
方向
【単変量 (円周) 方向
円周一様(英語版)
単変数フォン・ミーゼス
wrapped 正規(英語版)
wrapped コーシー(英語版)
wrapped 指数(英語版)
wrapped 非対称ラプラス(英語版)
wrapped レヴィ(英語版)
【二変量 (球面)】
ケント(英語版)
【二変量 (トロイダル)】
二変数フォン・ミーゼス(英語版)
【多変量】
フォン・ミーゼス–フィッシャー(英語版)
ビンガム(英語版)
退化特異
  • 円周(英語版)
  • 混合ポワソン(英語版)
  • 楕円(英語版)
  • 指数
  • 自然指数(英語版)
  • 位置尺度(英語版)
  • 最大エントロピー(英語版)
  • 混合(英語版)
  • ピアソン(英語版)
  • トウィーディ(英語版)
  • wrapped(英語版)
サンプリング法(英語版)
  • 一覧記事 一覧(英語版)
  • カテゴリ カテゴリ