変分自由エネルギーに登場する変数について

熱力学や統計力学の自由エネルギーではなくて、今度は、脳科学のフリストンの自由エネルギー原理における変分自由エネルギーの式を検討していきます。変分自由エネルギーFの式は下のようなものです。

F=\displaystyle\int q(x)\log\left( \frac{q(x)}{p(x,s)} \right) dx     (1-1)

この式にはq(x)とかp(x,s)のように、熱力学では見慣れない記号が出てきます。それ以前にxが何でsが何か、というところを明確にしなければなりません。


まず、sは脳が受け取る感覚を表しています。感覚といっても漠然としていますから、例えば視覚としてみましょう。その場合は感覚sは、網膜に映った画像信号と考えればよいと思います。そのような画素がいっぱいあるデータを一文字のsで表してよいものでしょうか? ここで、sはベクトルであると考えてみます。例えば、網膜から出ている視神経の1つの伝える光の強度の信号を1つの実数で表し、それらを視神経の数だけ並べたベクトルがこのsだと考えます。そうすれば、網膜に映った画像信号を一文字のsで表すことも妥当であると分かります。


次にxは、視覚の例でいえば脳が認識している外界の形状を表しています。正直なところ私は脳が物の形状をどのような風に数値化(あるいはコード化)しているのか、見当がつきません。まさかその物体の各点が脳内で3次元の座標で表されているとも思えません。それで、私にはxの具体的なイメージがわきません。むしろ私には、物の形状は「丸い」「大きさは握りこぶしぐらい」「黒い」「食べれなそう」「固そう」「重そう」というような属性のリストとして表現されるのではないか、と想像します。


外界の物体の形状が脳内でどのように表現されるのか私には分かりませんが、ともかくそれがベクトルxで表現され得るものであると考えます。


一般に感覚のデータsは、形状のデータxを形成するのに十分な情報量を持っていません。sは二次元のデータであるのに対しxは3次元のデータです。しかし、脳は網膜上の2次元のデータから3次元の世界を構成しています。そこでは意識に上らない推論がなされています。脳は視覚情報からそれ以外の点についても脳内の映像を再構成しているらしいのですが、私はそれについて確かな情報を得ていません。


脳はsを変形してxを作っているのではなく、予め脳が予測しているxがあって、sを受け取ることによってxを調整している、と考えるのがフリストンの理論の基礎のようです。


次にq(x)は何かを説明する番ですが、その前にp(x)を説明しなければなりません。これらはどちらも確率分布を表しています。まず、p(x)についてですが、脳はxを1点(=1データ)として予測しているのではなく、確率分布p(x)の形で予測している、としています。私にはその根拠が分かりません。


次に、p(x, s)xsの同時確率分布です。そして

p(x, s)=p(s|x)p(x)     (1-2)

が成り立ちます。ここでp(s|x)xを一つ定めた時のsの条件付き確率分布です。これについては、脳は今までの学習によってxという形状があれば、どのような感覚sを受信できるか、ということを知っている、としています。その知識を脳は、xであるという条件の下でsを受信する確率の分布p(s|x)の形で持っているとしています。私は最初のうち、ここが理解出来ませんでした。しかし、その後、これは以下のような意味なのだと理解しました。


xsの関係を通常の関数の形に書けば

s=g(x)     (1-3)

です。しかし、感覚には誤差がつきものと考えて式(1-3)に誤差\epsilonを加えます。

s=g(x)+\epsilon     (1-4)

式(1-4)ではxが定まってもsは定まらず、sはある確率分布を取ることになります。これをp(s|x)と書き表したのでした。\epsilonの分布をp_{\epsilon}(\epsilon{)}で表すことに
すると、

p(s|x)=p_{\epsilon}(s-g(x))     (1-5)

を意味することになります。たとえばx,s,\epsilonが全てスカラーのデータであるとして、\epsilonが平均ゼロ、標準偏差\sigma正規分布だとすると

p(s|x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}\exp\left(-\frac{(s-g(x))^2}{2\sigma^2}\right)     (1-6)

になります。