中心極限定理の証明

標本平均は正規分布に従う

中心極限定理という有名な定理があります。

中心極限定理(wikipedia)

母集団の分布がある条件を満たす分布であれば、標本平均(いくつかサンプルをとって平均を取ったもの)を標準化したものは、正規分布に従う。

この定理自体は有名ですが、成り立つ理由は自明ではありません。

前提条件を外すと、中心極限定理が成り立たない分布が現れます。今回参考にした本は以下の本(p103)です。

特性関数

特性関数とは、確率密度関数をフーリエ変換したものです。フーリエ変換を考えると言うことは、必然的に複素平面上へ解析接続した関数を考えることです。(複素関数入門p17-p48:解析接続)

\phi:R \to C; \phi(t) = \displaystyle\int e^{itx} P(x) dx

e^{itx}のべき級数としての収束半径は∞なので、フーリエ変換してフーリエ逆変換すればもとの確率密度関数が得られます。つまり、確率密度関数と特性関数はフーリエ変換で1対1対応です。しかもフーリエ変換はヒルベルト空間上の線型作用素です。

中心極限定理の証明

標本平均は、確率変数の線型結合です。確率変数の線型結合は、必ず畳み込み積分になります。

P(Z=X+Y) = \displaystyle\int_{-\infty}^{\infty}P(Z-Y)P(Y)dY

しかし、実は特性関数で考えると、もっと単純になります。

\phi(Z) = \displaystyle\int e^{itZ} \displaystyle\int_{-\infty}^{\infty}P(Z-Y)P(Y)dY dZ

= \displaystyle\int e^{itX} P(X) dX \displaystyle \int e^{itY} P(Y) dY = \phi(X)\phi(Y)

なんと積に。
標本平均を足し算だと考えると、特性関数を次々とかけていくことに相当します。

\bar{X} = \displaystyle\frac{1}{n}\sum x_i \to \phi(\bar{X})=\frac{1}{n}\prod \phi(x_i)

フーリエ変換が線型作用素なので1/nはそのまま持っていけます。
標本平均を標準化して、平均0かつ分散1にします。標準化してから標本平均をとっても良いです。
このとき、標本平均はn->∞で2次式になります。

\vert \phi(t) - 1 + \displaystyle\frac{t^2}{2} \vert \le C \displaystyle\frac {{\vert t \vert}^3}{3!}

\phi(\frac{t}{\sqrt{n}}) \to 1-\displaystyle\frac{t^2}{2n}(1+O(\frac{1}{\sqrt{n}}))

よって、上の積の式は

\displaystyle\lim_{n \to \infty} \phi(\bar{X}) = \lim_{n \to \infty} (1-\frac{t^2}{2n})^n = e^{-\frac{t^2}{2}}

これを逆フーリエ変換すると正規分布。つまり、標本平均の標準化は正規分布に従います。特性関数を使うと、こんなに簡単になります。

ただ、そのためには、複素関数論とフーリエ変換を勉強するという下準備をする必要があります。

フーリエ変換による関数の1:1対応

また、最後の正規分布がフーリエ変換・逆フーリエ変換で不変であるという事実は、量子力学で「波束の安定性」として知られているものなのです。この本は非常に面白いです。

「中心極限定理の証明」への3件のフィードバック

  1. ピンバック: まとめ:確率論のマインドマップ2 | teqニカルブログ

  2. ピンバック: 統計検定チートシート(1級・2級) – The Big Computing

  3. ピンバック: データサイエンス人気記事 - The Big Computing

コメントは受け付けていません。