さて、話を「q(x)について」に戻します。
そこでの議論では、脳の認識はに近づくように変化するのでした。このことをカルバック・ライブラー距離を使って書くと、
(5-1)
を最小化する、ということになります。式(5-1)には、どうやってを最小化するのか、という議論は含まれておらず、ただ単に分布は分布に近づいていく、ということを表すだけの、何のひねりもない式です。ところで、実は式(5-1)は脳の動作を表す式としては不適切なのです。どこが不適切であるか、というと
(2-1)
を計算するのにを計算する必要があるが、は
(2-2)
で計算する必要があり、この積分が脳にとって困難である、ということでした。そこで、式(5-1)を変形して、脳にとって実現可能な動作を表す式を作ります。カルバック・ライブラー距離の定義式
(3-1)
を使うと式(5-1)は
(5-2)
となります。
- ここで、そういえばは高次元のベクトルではなかったか、と私は気づいてしまいました。ここまでのところカルバック・ライブラー距離の非負の性質や、ゼロになることと2つの確率分布が一致することが同値であること、を証明したのはがスカラーの場合のみでした。がベクトルの場合のカルバック・ライブラー距離の定義や非負であること、値がゼロになるのは2つの確率分布が一致する場合のみであること、の証明はあとで行うことにして、今は先に進みます。
さて、前にも示したように
(1-2)
なので、式(2-1)は
(5-3)
と書くことが出来ます。式(5-3)を式(5-2)の右辺に代入して
よって
(5-4)
となります。この式のは感覚入力であり、認識の分布の形を変えても変化しません。よっての分布を変化させてを最小化することと右辺の
を最小化することは同等です。そこでこれをとし、脳は
(1-1)
を最小化するように動作する、と主張します。これが自由エネルギー原理です。「変分自由エネルギーに登場する変数について」で述べたようには変分自由エネルギーと呼ばれます。変分という言葉は、式(1-1)が変分法の一種とみなすことが出来るところから来ています。は関数によって値が定まるので、汎関数とみなすことが出来ます。変分法は汎関数の最大値または最小値を与えるような関数の形を求める問題です。式(1-1)ではを最小にするようなを求めることが課題とされています。
これで、変分自由エネルギーの式の導出が出来ました。しかし、私はこの式(式(1-1))を見て、いろいろと疑問が出てきます。
1) なぜは自由エネルギーと呼ばれるのか?
2) 先に
(2-2)
を計算することは脳にとって困難としておきながら、なぜ、
(1-1)
を計算することは脳にとって可能としているのか?
どちらも同じによる積分なので困難さは同等ではないのか?
3) がベクトルの場合でもカルバック・ライブラー距離は式(3-1)で大丈夫なのか?