予測を確率分布として与えるガウス過程回帰ー分散の値から予測のばらつき具合も評価可能!ー【Pythonプログラム付】

統計・機械学習

ガウス過程回帰 (Gaussian Process Regression)は,予測が確率分布(ガウス分布)で与えられ,分散の値から予測のばらつき具合も評価することができます。背景にあるガウス過程は様々な分野で研究されており,クリギングやカルマンフィルタ,ニューラルネットワークなど多くの手法に関連するモデルです。本記事では,ガウス過程回帰の定義と解釈について解説します。

pythonによるサンプルプログラムはこちらからどうぞ。

大きい画面で表示したい方はこちらからご覧ください。

クリエイティブ・コモンズ・ライセンス

 

スライドの目次

  • 本記事の内容と対象
  • ①ガウス分布とは
  • ガウス分布(正規分布)とは
  • 標準偏差と確率
  • 分散のイメージ
  • 2次元のガウス分布
  • 共分散のイメージ
  • N次元のガウス分布(多変量正規分布)
  • ②ガウス過程回帰をざっくり理解する
  • 回帰分析の前提
  • 最小二乗法の場合
  • ガウス過程回帰の場合
  • ガウス過程回帰の特徴
  • ガウス過程回帰のざっくりまとめ
  • ③ガウス過程とは
  • ガウス過程の定義
  • 線形回帰モデルの引用
  • 非線形写像
  • 重みをガウス分布に従って生成
  • 出力ベクトルの平均と共分散行列
  • まとめると…
  • 出力データの平均は0でよいのか?
  • ガウス過程の共分散行列の解釈
  • カーネル関数の導入
  • ④ガウス過程を用いた回帰分析
  • 未知のデータをどう予測するか?
  • 最小二乗法なら簡単
  • ガウス過程では一筋縄ではいかない
  • 未知の入力データを含んだ分布を考える
  • 予測分布の期待値と分散の解釈

参考文献

  • C.M. ビショップ,パターン認識と機械学習 上, 丸善出版 (2012)
  • C.M. ビショップ,パターン認識と機械学習 下, 丸善出版 (2012)
  • 持橋大地・大羽成征,ガウス過程と機械学習,講談社 (2019)

質問、コメント等ございましたら、下部のコメント欄,もしくはメールやTwitterよりご連絡ください。

コメント

  1. fukumoto より:

    「ガウス過程回帰と機械学習」を読んでいて分からないことを調べている中でこちらの記事にたどり着きました。
    有用な解説ありがとうございます。

    スライド23の平均で引くという操作ですが、ここでの平均はスカラー average(y_1,…,y_n) で考えているように見えるのですが、それで良いのでしょうか?
    ベクトルyの平均はベクトルで、スライド13の点線に乗っている [mu*_1,…,mu*_n] ではないのでしょうか?

    • yuki より:

      こんにちは。質問ありがとうございます。
      時間をいただけると幸いです。私が不勉強のせいで,明確な回答がパッと思い浮かびません。

      直感的には,
      スカラーaverage(y_1,…,y_n)をベクトルyの平均とすることで,尤度の高いエリアでのサンプリングを達成している,ような気がします。(図3.5のイメージ)
      また,スライド13の平均はサンプリング(y_1,…,y_n)が与えられたときの事後分布から算出しているので,平均ベクトルにはふさわしくないような気がします。

      明確な回答が思い浮かんだら,追記いたします。

タイトルとURLをコピーしました