Neyman-Pearsonの補題の証明周りについて
第一回勉強会の補足。約束したものの中から一番簡単なものを。
本の紹介
- 作者: 竹村彰通
- 出版社/メーカー: 創文社
- 発売日: 1991/12
- メディア: 単行本
- 購入: 2人 クリック: 26回
- この商品を含むブログ (21件) を見る
のp.168あたりに書かれている内容を読みながら補足する*1。
問題設定
集合が与えられているとする。また、上の分布(仮説)も与えられているとし、 それぞれが主仮説の分布、が対立する仮説の分布とする。
ここで、関数 を検定(Test)と呼び*2、意味はデータが得られたときに確率で、の仮説を棄却するというもの。
この検定には良いものと良くないものがあって、例えば、次の尺度で評価する。
第一種誤り確率
これは、真の仮説がのときに、それを支持しない確率。
第二種誤り確率
これは、真の仮説がのときに、それを支持しない確率。
良い検定
検定論における伝統的な考え方は第1種の過誤を与えられた有意水準以下におさえたうえで、対立仮説のもとでの検出力を最大にするものである。
なので、のもとで、 を最大化する検定が良い検定で、この最大化する検定は最強力検定と呼ばれる。
Neyman-Pearsonの補題
次のNeyman-Pearsonの補題は、(単純)仮説検定の枠組みで、最強力検定の存在を述べている。
非負の数と 上の実数が与えられているとする。このとき、 と言う検定を考える。この検定のもとでの第一種誤り確率をとすると、 有意水準の検定の中でが最強力検定である。
証明
証明に次の補題を用いる。
実数への関数と への関数に対して、 が成り立つ。ここで、は指示関数と呼ばれ、 括弧中の命題が真のとき1を返し、それ以外のとき0を返す上の関数である。
言ってしまえば、
「関数の重みつき足し合わせは、負の部分だけを足し合わせたものが最も小さい」
というものである。このことを数式で表すと上の補題になる。この補題から、次が言える。
2つ目の式が等式で結ばれるのは、によっている。 また、3つ目の式は、
による。さて、得られた式を移項して整理すると、次が言える。
右辺第一項は定義より、第二項は最適化の設定から以下なのだから、
右辺は0以上なのが分かる。
ここから、が言え、
有意水準の検定の中でが最強力検定なのがいえた。