自由エネルギー原理の式の導出

さて、話を「q(x)について」に戻します。
そこでの議論では、脳の認識q(x)p(x|s)に近づくように変化するのでした。このことをカルバック・ライブラー距離を使って書くと、

D_{\rm{KL}}(q(x)||p(x|s))     (5-1)

を最小化する、ということになります。式(5-1)には、どうやってD_{\rm{KL}}(q(x)||p(x|s))を最小化するのか、という議論は含まれておらず、ただ単に分布q(x)は分布p(x|s)に近づいていく、ということを表すだけの、何のひねりもない式です。ところで、実は式(5-1)は脳の動作を表す式としては不適切なのです。どこが不適切であるか、というと

p(x|s)=\displaystyle\frac{p(s|x)p(x)}{p(s)}     (2-1)

を計算するのにp(s)を計算する必要があるが、p(s)

p(s)=\displaystyle{\int}p(x,s)dx     (2-2)

で計算する必要があり、この積分が脳にとって困難である、ということでした。そこで、式(5-1)を変形して、脳にとって実現可能な動作を表す式を作ります。カルバック・ライブラー距離の定義式

D_{\rm{KL}}(p||q)=\displaystyle{\int}p(x)\log\left(\frac{p(x)}{q(x)}\right)dx     (3-1)

を使うと式(5-1)は

D_{\rm{KL}}(q(x)||p(x|s))=\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x|s)}\right)dx     (5-2)

となります。

  • ここで、そういえばxは高次元のベクトルではなかったか、と私は気づいてしまいました。ここまでのところカルバック・ライブラー距離の非負の性質や、ゼロになることと2つの確率分布が一致することが同値であること、を証明したのはxスカラーの場合のみでした。xがベクトルの場合のカルバック・ライブラー距離の定義や非負であること、値がゼロになるのは2つの確率分布が一致する場合のみであること、の証明はあとで行うことにして、今は先に進みます。

さて、前にも示したように

p(x,s)=p(s|x)p(x)     (1-2)

なので、式(2-1)は

p(x|s)=\displaystyle\frac{p(x,s)}{p(s)}     (5-3)

と書くことが出来ます。式(5-3)を式(5-2)の右辺に代入して

D_{\rm{KL}}(q(x)||p(x|s))=\displaystyle{\int}q(x)\log\left(\frac{q(x)p(s)}{p(x,s)}\right)dx={\int}q(x)\left[\log\left(\frac{q(x)}{p(x,s)}\right)+\log{p(s)}\right]dx

=\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx+{\int}q(x)\log{p(s)}dx={\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx+\log{p(s)}{\int}q(x)dx

=\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx+\log{p(s)}

よって

D_{\rm{KL}}(q(x)||p(x|s))=\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx+\log{p(s)}     (5-4)

となります。この式のsは感覚入力であり、認識の分布q(x)の形を変えても変化しません。よってq(x)の分布を変化させてD_{\rm{KL}}(q(x)||p(x|s))を最小化することと右辺の

\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx

を最小化することは同等です。そこでこれをFとし、脳は

F=\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx     (1-1)

を最小化するように動作する、と主張します。これが自由エネルギー原理です。「変分自由エネルギーに登場する変数について」で述べたようにF変分自由エネルギーと呼ばれます。変分という言葉は、式(1-1)が変分法の一種とみなすことが出来るところから来ています。Fは関数q(x)によって値が定まるので、汎関数とみなすことが出来ます。変分法汎関数の最大値または最小値を与えるような関数の形を求める問題です。式(1-1)ではFを最小にするようなq(x)を求めることが課題とされています。


これで、変分自由エネルギーFの式の導出が出来ました。しかし、私はこの式(式(1-1))を見て、いろいろと疑問が出てきます。

1) なぜFは自由エネルギーと呼ばれるのか?

2) 先に

 p(s)=\displaystyle{\int}p(x,s)dx     (2-2)

 を計算することは脳にとって困難としておきながら、なぜ、

 F=\displaystyle{\int}q(x)\log\left(\frac{q(x)}{p(x,s)}\right)dx     (1-1)

 を計算することは脳にとって可能としているのか?
 どちらも同じxによる積分なので困難さは同等ではないのか?

3) xがベクトルの場合でもカルバック・ライブラー距離は式(3-1)で大丈夫なのか?