統計モデリング メモ


ただのメモです。

統計モデリング 勉強会メモ

 

統計モデリングとは

下記の説明がわかりやすかったです。

統計学の手法を使って、システムを記述し、理解・説明するための枠組み

下記資料の内容をお借りしています。
チョコボールに学ぶ実践的ベイズ統計モデリング入門

 

統計モデリングを使用する流れ

1. 扱うデータを確認
2. 確率分布を仮定(モデリング)
3. データにあてはめるパラメータを推定
4. モデリング結果を評価

4が悪ければ、2に戻って、最適なモデリングを探す作業を行います。
これを繰り返していく。

 

モデリング(2)

正規分布とか二項分布とかの様々なモデルをパタメトリックなのか
パラメトリックのイメージ

  • 正規分布
    平均、分散がわかればわかる
  • 二項分布
    表がでる回数がわかればわかる

モデルの当てはめ方

離散系なのか連続系なのかで判断する。

【離散系】
・ベルヌーイ分布
・二項分布
・ポアソン分布

【連続系】
・ベータ分布
・正規分布
・t分布

 

データにあてはめるパラメータを推定(3)

パラメータの推定方法には、大きく分けて、2つの方法がある。

  1. 最尤推定
    点推定 → よく自分たちが行っている平均など
  2. ベイズ推定
    分布推定

ベイズ推定

原因の確率をも求める枠組み

【ベイズの定理】
尤度関数と事前分布をかけて、事後分布を求めるもの
$$P(A|B) \propto P(B|A)P(A)$$
P(B|A) → 尤度関数
P(A) → 事前分布

上の無限大のような記号は、比例の意味のようです
https://ja.wikipedia.org/wiki/%E6%AF%94%E4%BE%8B%E8%A8%98%E5%8F%B7

何も情報がない場合は、事前分布は一様分布になる。

ベイズ推定で使用されるのは、ベータ分布が多い?
メリット:いろんな形を表現できる

 

参考にした記事

https://www.slideshare.net/YoichiTokita/20190209-bayes-modelingspub