2章の補足で言いたかったこと(確率変数、分布での変数変換について)
本の紹介
- 作者: 井手剛,杉山将
- 出版社/メーカー: 講談社
- 発売日: 2015/08/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
の2章の補足のときに言いたかったことをつらつらと。
設定
を適当な集合として、与えられているものとする。 また、をそれぞれ上の確率分布全体の集合とする。確率分布の定義は
bocchi-talks-information.hatenablog.com
に書いたとおり。
条件付確率または、通信路
写像(のでの値)をで条件付けられた上の条件付分布と呼ぶ。 あるいは、写像をからへの通信路*1と呼ぶ。
同時分布と周辺分布
通信路を用いて、以下の同時分布や周辺分布が定義できる。
上の確率分布と通信路が与えられているとき、上の同時分布 は で定義される。
また、同時分布が与えられたとき、 や を同時分布 から得られた周辺分布と呼び、この同時分布から周辺分布を得る操作を周辺化と呼ぶ。
Markov morphism
通信路が一つ与えられると、写像が次のように定義できる。
この写像はMarkov morphismと呼ばれ、を上の数として、としたときに、
と凸結合に対して閉じているという性質を持っている*2。
また、Markov morphismはからへの確率変数、分布の意味での変数変換となっている。
写像と通信路
ここでは、写像は通信路の特殊例だと言うことを説明する。
まず、一点分布と言う特殊な分布を考える。一点分布とは、ある一点に確率が集中していて、他のところの確率が0になるような確率分布のこと。 イメージとしては、1しかでないサイコロや表しかでないコイントスの持つ確率分布と思ってもらうといい。
さて、集合上の一点分布全体のなす集合を考える。 まず、明らかに。 次に、一点分布はある一点を選んでそこに確率を集中させるので、集合と集合には自明な全単射(1対1対応)がある。 具体的には、
というもの*3。
ここで、写像を考える。集合と集合には自明な全単射(1対1対応)があったから、写像と写像にも自明な全単射(1対1対応)がある。 また、なのだから、写像は通信路なのが分かる。
2章の補足は何だったのか?
一言で言ってしまえば、
「写像に対応する通信路に関するMarkov morphismを用いた変数変換。」
当然、今まで説明してきたように通信路があれば、その通信路が写像に対応していなくても、通信路に関するMarkov morphismを用いた変数変換ができるので、 あの話はもう少し広いクラスに拡張することができる。
Neyman-Pearsonの補題の証明周りについて
第一回勉強会の補足。約束したものの中から一番簡単なものを。
本の紹介
- 作者: 竹村彰通
- 出版社/メーカー: 創文社
- 発売日: 1991/12
- メディア: 単行本
- 購入: 2人 クリック: 26回
- この商品を含むブログ (21件) を見る
のp.168あたりに書かれている内容を読みながら補足する*1。
問題設定
集合が与えられているとする。また、上の分布(仮説)も与えられているとし、 それぞれが主仮説の分布、が対立する仮説の分布とする。
ここで、関数 を検定(Test)と呼び*2、意味はデータが得られたときに確率で、の仮説を棄却するというもの。
この検定には良いものと良くないものがあって、例えば、次の尺度で評価する。
第一種誤り確率
これは、真の仮説がのときに、それを支持しない確率。
第二種誤り確率
これは、真の仮説がのときに、それを支持しない確率。
良い検定
検定論における伝統的な考え方は第1種の過誤を与えられた有意水準以下におさえたうえで、対立仮説のもとでの検出力を最大にするものである。
なので、のもとで、 を最大化する検定が良い検定で、この最大化する検定は最強力検定と呼ばれる。
Neyman-Pearsonの補題
次のNeyman-Pearsonの補題は、(単純)仮説検定の枠組みで、最強力検定の存在を述べている。
非負の数と 上の実数が与えられているとする。このとき、 と言う検定を考える。この検定のもとでの第一種誤り確率をとすると、 有意水準の検定の中でが最強力検定である。
証明
証明に次の補題を用いる。
実数への関数と への関数に対して、 が成り立つ。ここで、は指示関数と呼ばれ、 括弧中の命題が真のとき1を返し、それ以外のとき0を返す上の関数である。
言ってしまえば、
「関数の重みつき足し合わせは、負の部分だけを足し合わせたものが最も小さい」
というものである。このことを数式で表すと上の補題になる。この補題から、次が言える。
2つ目の式が等式で結ばれるのは、によっている。 また、3つ目の式は、
による。さて、得られた式を移項して整理すると、次が言える。
右辺第一項は定義より、第二項は最適化の設定から以下なのだから、
右辺は0以上なのが分かる。
ここから、が言え、
有意水準の検定の中でが最強力検定なのがいえた。
異常検知、あるいは二値仮説検定について
本の紹介
今日、夕方から
- 作者: 井手剛,杉山将
- 出版社/メーカー: 講談社
- 発売日: 2015/08/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
の勉強会があるので、予習もかねて。
異常検知とは?
タイトルにもあるとおり、言ってしまえば二値の仮説検定そのもの。
「異常」か、「正常」かということをデータから判断する。
仮説検定とは?
通常、帰無仮説がどうとか、対立仮説がどうとかいう話が出てくるけれど、ここではそう言った構成はせず、次のように考える。
を適当な集合として、与えられているものとする。感覚的にはデータの取り得る値の集合なので、データ集合と呼ぶことにする。
をデータ集合上の確率分布全体のなす集合とする。の要素が上の確率分布。
確率分布とはから非負の実数(0以上の実数)への関数で、
あるいは、
を満たすものをさす。*1
ここで、の要素を仮説と呼ぶことにする。
二値仮説検定とは、得られたデータが与えられた2つの仮説のどちらから得られたか(実現したか)を推定する問題。
異常検知の観点から言えば、対象が正常なときにデータが従う分布と、対象が異常なときにデータが従う分布が与えられたときに、 得られたデータが正常か異常かを判断する問題。
決定的な解決策*2
基本的な考え方は、データ集合を与えられた2つの仮説を用いて2つに分けてしまうことにある。
具体的には、集合と集合に分けたり(ベイズ決定則)、 ある非負の数を用いて、集合と集合に分けたり(ネイマン-ピアソン決定則)する。
ここで、得られたデータがに入っていれば、を支持(正常であると判断)し、逆にに入っていれば、を支持(異常であると判断)する。
大きな問題、それは…
実際に異常検知を行おうとするときには、このフレームワークでは大きな問題がある。 それは、通常2つの仮説は与えられないということ。
ではどうするかと言うと、これまで得られているデータ列から、2つの仮説、または、正常な方の仮説を推定することになる*3。
推定問題は検定問題とは似ているけれども全く別の問題。勉強会までの時間もないので後日書くことにする。
Texが使えるらしいのでテスト
texが使える?使えない?
Hatena blogならtexが使えると聞いて練習中。
たとえば、
が書けるのに
[tex:{ \displaystyle {\rm det}(A) = \sum{\sigma \in \mathscr{S}(N)}{\rm sgn}(\sigma) \prod_i a{i} }]
が書けないのはなぜ?*1
と気になるところもありますが、 記事の内容的にせいぜいガウス分布
[tex:{ \displaystyle \mathcal{N}(x | \mu, \sigma) = \frac{1}{(\sqrt{2 \pi} \sigma)} {\rm exp} \left(- \frac{(x - \mu)2}{2 \sigma2}\right) }]
が書ければいいんだけど、これも書けないのか。
解決法
書けない理由は分からないけれど、解決法はありました。
やまいもさんの記事 TeXをMarkdown記法でも使ってみた。 - いものやま。
によれば、<pre> </pre>
で囲えばよいとのこと。
つまり、
<pre> [tex:{ \displaystyle {\rm det}(A) = \sum_{\sigma \in \mathscr{S}(N)}{\rm sgn}(\sigma) \prod_{i = 1}^ n a_{i \sigma(i)} }] </pre>
や
<pre> [tex:{ \displaystyle \mathcal{N}(x | \mu, \sigma) = \frac{1}{(\sqrt{2 \pi} \sigma)} {\rm exp} \left(- \frac{(x - \mu)^2}{2 \sigma^2}\right) }] </pre>
とすれば、
となる!
これを利用して少しずつ記事を書いていくつもりです。
*1:両者とも間違っている式ですが、そもそも下が書けないと正しい式が書けないので