情報理論関連をぐだぐだと

情報理論関係を勉強中の筆者がそれっぽいことを書くブログ

Neyman-Pearsonの補題の証明周りについて

第一回勉強会の補足。約束したものの中から一番簡単なものを。

本の紹介

現代数理統計学 (創文社現代経済学選書)

現代数理統計学 (創文社現代経済学選書)

のp.168あたりに書かれている内容を読みながら補足する*1

問題設定

集合 \mathcal{X}が与えられているとする。また、 \mathcal{X}上の分布(仮説)p,q \in  \mathcal{P(X)}も与えられているとし、 それぞれpが主仮説の分布、qが対立する仮説の分布とする。

ここで、関数g :  \mathcal{X} \to [0, 1] 検定(Test)と呼び*2、意味はデータ xが得られたときに確率 g(x)で、pの仮説を棄却するというもの。

この検定には良いものと良くないものがあって、例えば、次の尺度で評価する。

第一種誤り確率
{ \displaystyle
 {\rm Pe}_1(g)= \sum_{x \in \mathcal{X}} p(x) g(x)
}

これは、真の仮説がpのときに、それを支持しない確率。

第二種誤り確率
{ \displaystyle
 {\rm Pe}_2(g)= \sum_{x \in \mathcal{X}} q(x) (1 - g(x))
}

これは、真の仮説がqのときに、それを支持しない確率。

良い検定

検定論における伝統的な考え方は第1種の過誤を与えられた有意水準 \alpha以下におさえたうえで、対立仮説のもとでの検出力を最大にするものである。

なので、{\rm Pe}_1(g)\leq\alphaのもとで、 1 - {\rm Pe}_2(g) = \sum_{x \in \mathcal{X}} q(x) g(x)を最大化する検定gが良い検定で、この最大化する検定は最強力検定と呼ばれる。

Neyman-Pearsonの補題

次のNeyman-Pearsonの補題は、(単純)仮説検定の枠組みで、最強力検定の存在を述べている。

非負の数c \geq 0 [0,1]上の実数 rが与えられているとする。このとき、
{ \displaystyle
 g^*_{c,r}(x) = 
    \left\{ \begin{array}{ll}
    1 \\& ( p(x) - c q(x) \lt 0) \\
r \\& ( p(x) - c q(x) = 0) \\
0 \\& ( p(x) - c q(x) \gt 0) \\
  \end{array} \right.
}
と言う検定を考える。この検定のもとでの第一種誤り確率{\rm Pe}_1(g^*_{c,r})\alphaとすると、

有意水準 \alphaの検定の中でg^*_{c,r}が最強力検定である。
証明

証明に次の補題を用いる。

実数への関数f: \mathcal{X} \to \mathbb{R} [0,1]への関数g :  \mathcal{X} \to [0, 1] に対して、
{ \displaystyle
\sum_{x\in\mathcal{X}} f(x)g(x) \geq \sum_{x\in\mathcal{X}} f(x) 1\{f(x) \lt 0\}
}
が成り立つ。ここで、1\{\ \}は指示関数と呼ばれ、

括弧中の命題が真のとき1を返し、それ以外のとき0を返す \mathcal{X}上の関数である。

言ってしまえば、

「関数f(x)の重みつき足し合わせは、負の部分だけを足し合わせたものが最も小さい」

というものである。このことを数式で表すと上の補題になる。この補題から、次が言える。

{ \displaystyle
\begin{align}
\sum_{x\in\mathcal{X}} (p(x) - c q(x))g(x) &\geq \sum_{x\in\mathcal{X}} (p(x) - c q(x)) 1\{(p(x) - c q(x)) \lt 0\}\\
& =  \sum_{x\in\mathcal{X}} (p(x) - c q(x)) 1\{(p(x) - c q(x)) \lt 0\} \\
&\ \ \ \ \ + r \sum_{x\in\mathcal{X}} (p(x) - c q(x)) 1\{(p(x) - c q(x)) = 0\}\\
& = \sum_{x\in\mathcal{X}} (p(x) - c q(x))g^*_{c,r}(x)
\end{align}
}

2つ目の式が等式で結ばれるのは、(p(x) - c q(x)) 1\{(p(x) - c q(x)) = 0\} = 0 によっている。 また、3つ目の式は、

{ \displaystyle
g^*_{c,r}(x) =  1\{(p(x) - c q(x)) \lt 0\} + r 1\{(p(x) - c q(x)) = 0\}
}

による。さて、得られた式を移項して整理すると、次が言える。

{ \displaystyle
c \sum_{x\in\mathcal{X}} q(x)(g^*_{c,r}(x) - g(x)) \geq \sum_{x\in\mathcal{X}} p(x) g^*_{c,r}(x) - \sum_{x\in\mathcal{X}} p(x)g(x)
}

右辺第一項は定義より\alpha、第二項は最適化の設定から\alpha以下なのだから、

右辺は0以上なのが分かる。

ここから、\sum_{x\in\mathcal{X}} q(x)g^*_{c,r}(x) \geq \sum_{x\in\mathcal{X}} q(x)g(x)が言え、

有意水準 \alphaの検定の中でg^*_{c,r}が最強力検定なのがいえた。

*1:扱っている内容が単純仮説なので、かなり簡略化して説明する。

*2:正確には確率化検定と呼ばれる。0と1にしか値をとらない決定論的検定もある。