さて、高嶋君から大量データを分析する際に情報量統計学(最尤法)とベイズ統計はもっとも適しているのではないかと考えているとのことなので、まずベイズ統計についてちょっとかじってみようと思う。
そこで選んだのが、Excelでスッキリわかるシリーズ?のベイズ統計入門。Excel使いながら、自分で確認しながらできるので、自分のような数学に弱い人間にはちょうど良いのではなかろうか。
Excelでスッキリわかる ベイズ統計入門 涌井 良幸 涌井 貞美 日本実業出版社 2010-11-11 by G-Tools |
目次は以下のとおり。
- 序章 ベイズ理論を学ぶ前に(そもそもベイズの理論とは何か?、「融通」が効いて「寛容」なベイズの理論
- 1章 ベイズ理論のための確率統計入門(ベイズ理論の具体的な考え方、ベイズ理論を理解するための確率の知識、確率変数と確率分布は統計モデルの柱、ベイズ理論で多用される有名な確率分布、尤度関数を最大にする値を推定値とする最尤推定法)
- 2章 Excelで確かめるベイズの定理(ベイズの定理と基本公式、ベイズ理論の主役となるベイズの展開公式、2つの壺の一方から取り出した玉、さてどちらから?、壺の”真贋”をベイズで推定、診断結果をベイズで検証すると意外な結果が!、コラム:ベイズの基本公式とベイジアンネットワーク)
- 3章 ベイズの定理の応用問題(人の性格をベイズ理論で定量的に判断、コラム:横軸に文字のラベルを指定、「心模様」を確率分布のグラフで表現、「彼女が自分に寄せる思い」をベイズで分類、迷惑メールの振り分けを簡単に実現するナイーブベイズ、コラム:ナイーブベイズ分類は壺の問題と等価)
- 4章 ベイズ統計の基本(ベイズの定理からベイズ統計の基本公式へ、薬の効能の分布をベイズで予測、製造ラインの狂いをベイズで予測)
- 5章 自然な共役分布(ベイズ統計と自然な共役分布、コインの表の出る確率分布はベータ分布で表現、ポテトチップの内容量の分布をベイズで調べる、出生率や死亡率の算定に自然な共役分布が利用されている、コラム:出生率や死亡率に関するベイズ推定の公式の証明)
- 6章 ベイズ推定とベイズ決定(時ご期待損失最小化がベイズ流の推定・決定の基本、文字パターンをMAP推定、標本からポテトチップの内容量の分布関数を推定、コラム:正規母集団分布を事後分布から推定する公式、計画実施を経験情報に基づいてMAP決定、「事後期待損失を最小化」する意思決定法がベイズの決断、コラム:MAP推定法と最尤推定法)
- 7章 線形回帰モデルへの応用は?(回帰分析を復習する、単回帰分析にベイズを応用する、重回帰分析にもベイズを応用)
- 付録 さらに深く理解を深めるために(Excelのそるバー利用法、Excelでベータ分布の確率密度関数の値を求める、期待損失最小化で実現される中央値、最頻値、平均値、簡単な線形回帰モデルの事後分布の算出、一般的な線形回帰モデルの事後分布の算出)
ここまで書くとこれだけでベイズを理解できたような気分になってしまう[E:coldsweats01]
でもすべてはこれから始まるのだ。さてもう一方の情報量基準だが、これは古典?的な入門書を昔、読んだ。それを再読しようと思う。
先をよむ統計学―「情報量規準」とは何か (ブルーバックス) 鈴木 義一郎 講談社 1991-01 by G-Tools |
これは大昔に読んだが、内容はすでに忘れている・・・というか当時どこまで理解していたかも怪しい。今回いい機会だからちゃんと理解してみよう。
そう言えば、ニュートン・ムックにも確率関係のものがあったな。しかも積読になっていたような・・・帰ったらちょっと見てみよう。
確率に強くなる―「偶然」にひそむ数学法則 (ニュートンムック Newton別冊) ニュートンプレス 2009-12 by G-Tools |