信頼区間と確率の違いについて、以下の本のp155-157で読みました。
[amazonjs asin=”4785314117″ locale=”JP” title=”数理統計学 (数学シリーズ)”]
最初は当たり前に思えてピンとこなかったのですが、いろいろな資料で何度も読むうちに腑に落ちたので、リソースを残しておきます。
信頼係数と確率の違いについては、英語版のwikipediaに良い解説が載っています。
https://en.wikipedia.org/wiki/Confidence_interval#Misunderstandings
ネイマンの原論文が引用されています。噛み砕くと、「信頼区間とは1か0かをとる確率変数である」ということで、
サンプルが決まれば95%信頼区間は自動的に決まります。
その95%信頼区間に真の母数が含まれているかどうかは100%か0%かのどちらかです。
つまり、「95%信頼区間に真の母数が含まれているか」は、1か0かをとる確率変数であり、サンプルが決まれば自動的に決まります。
サンプルを多数取ったとき、この確率変数が1をとる確率が、95%なのです。この95%という値はサンプルによりません。
ということになります。
よって、「95%信頼区間に入っているから母数はこれこれである」とはいえないはずです。どんな95%信頼区間も、対応するサンプルを作れば作れるからです。
次のようなSlideshare(株式会社Mynd)を見つけました。
「95%信頼区間に入っているから母数はこれこれである」ということを論文に書くとはじかれるそうです。
とはいえ、母数の値を調べる道具としては有用であるため、道具として使うのは個人の自由であり、あくまで母数の論拠として使ってはならないという意味のようです。
ピンバック: 統計検定チートシート(1級・2級) – The Big Computing