指数型分布族について
推定論について書こうと思っていたけれど、 時間がなくなったので 今日は指数型分布族の導入を
設定
データ集合が与えられているとして、を集合上の確率分布全体のなす集合とする。 また、モデルとして、 を仮定する。 ここで、は次元ベクトルとみなせるので、
と書くとする*1。
指数型分布族
指数型分布族とは、モデルの一種で、その要素が常に下のように書くことができるもの*2。
ここで、やは上の(のみの)実数値関数、はのみの実数値関数なのに注意。
また、はその定義から、
と書ける。 ちなみに指数型分布族のパラメータは、自然パラメータとよばれる。
十分統計量や最尤推定量との関係
今回も、データが出てくる順番に関係なく毎回モデル上のひとつの分布にしたがって出てくるとしよう。 このとき、データ列の具体値が得られる確率は
となっているから、モデルが指数型分布族だった場合、
となっていて、これ自身なんらかの指数型分布族の元となっている。ここで、
と書けることに注意すると、分解定理から、個の実数の組は十分統計量だと言うことが分かる。また、これをで割った、
も十分統計量だ。ここで、実際にデータから計算された十分統計量をとして、
とすると、最尤推定量は
とルジャンドル変換の形で書けることが知られている。
指数型分布族になっているモデル例
これまでいろいろ書いてきたが、「こんな人工的に見えるモデル使えるのか?」と言う疑問が当然でてくると思う。
じつは、指数型分布族になっているモデルは手近なところにいろいろある*3。 例えば、正規分布で期待値や標準偏差をパラメータにしたモデルは指数型分布族だし、 有限の離散集合上の分布全体なんてのも指数型分布族になる。
このあたりのことは、日を改めて書きたいと思う。