多次元の場合のカルバック・ライブラー距離

ここでは前回「自由エネルギー原理の式の導出」の最後で並べた疑問点のうち

3) xがベクトルの場合でもカルバック・ライブラー距離は式(3-1)で大丈夫なのか?

を解決しようと思います。なお式(3-1)は

D_{\rm{KL}}(p||q)=\displaystyle{\int}p(x)\log\left(\frac{p(x)}{q(x)}\right)dx     (3-1)

でした。


このエントリーでは変数がベクトルであることを明示するためにベクトルの変数は\mathbf{x,y}のように書くことにします。一方スカラー値はx,yのように書くことにします。例えばn次元の縦ベクトル\mathbf{x}i番目の成分をx_iと書くとすれば

\mathbf{x}=(x_1,x_2,\cdots,x_n)^{\rm{T}}     (6-1)

と書くことが出来ます。ここで\rm{T}は行列の転置を表します。


さて、xがベクトル\mathbf{x}になった場合のカルバック・ライブラー距離を

D_{\rm{KL}}(p||q)=\displaystyle{\int}p(\mathbf{x})\log\left(\frac{p(\mathbf{x})}{q(\mathbf{x})}\right)\mathbf{dx}     (6-2)

で定義します。ここで\mathbf{x}による積分

\displaystyle\int[ ]\mathbf{dx}

x_1,x_2,\cdots,x_nによる多重積分

\displaystyle\int[ ]\mathbf{dx}=\int\int\cdots\int[ ]{dx_1}dx_2\cdots{dx_n}     (6-3)

を意味します。式(6-3)は式(3-1)のx\mathbf{x}に置き換えただけの式になっています。


では、式(6-2)で定義されたカルバック・ライブラー距離が非負であり、さらにゼロになるのはp(\mathbf{x})q(\mathbf{x})が一致する場合に限る、ということを確かめていきましょう。まず、イェンゼンの不等式を拡張します。


イェンゼンの不等式」の式(4-1), (4-2), (4-2-1)については修正の必要がありません。

f(t)\le{f'}(\alpha)(t-\alpha)+f(\alpha)     (4-2-1)

が成り立ち、等号が成り立つのはt=\alphaの時のみでした。式(4-2)にt=g(\mathbf{x})を代入します。ここで\mathbf{x}はベクトルです。

f(g(\mathbf{x}))\le{f}'(\alpha)(g(\mathbf{x})-\alpha)+f(\alpha)     (6-4)

ここでベクトル\mathbf{x}についての確率分布p(\mathbf{x})を考えます。このp(\mathbf{x})については

\displaystyle{\int}p(\mathbf{x})\mathbf{dx}=1     (6-5)

と、p(\mathbf{x})\ge0が成り立ちます。p(\mathbf{x})を式(6-4)の両辺に掛けます。p(\mathbf{x})\ge0なので不等号の向きは変わりません。

f(g(\mathbf{x}))p(\mathbf{x})\le{f}'(\alpha)(g(\mathbf{x})-\alpha)p(\mathbf{x})+f(\alpha)p(\mathbf{x})

さらに両辺を\mathbf{x}積分します。

\displaystyle{\int}f\left(g(\mathbf{x})\right)p(\mathbf{x})\mathbf{dx}\le{f}'(\alpha)\int\left(g(\mathbf{x})-\alpha\right)p(\mathbf{x})\mathbf{dx}+f(\alpha){\int}p(\mathbf{x})\mathbf{dx}

\displaystyle{\int}f\left(g(\mathbf{x})\right)p(\mathbf{x})\mathbf{dx}\le{f}'(\alpha){\int}g(\mathbf{x})p(\mathbf{x})\mathbf{dx}-f'(\alpha)\alpha{\int}p(\mathbf{x})\mathbf{dx}+f(\alpha){\int}p(\mathbf{x})\mathbf{dx}

\displaystyle{\int}f\left(g(\mathbf{x})\right)p(\mathbf{x})\mathbf{dx}\le{f}'(\alpha){\int}g(\mathbf{x})p(\mathbf{x})\mathbf{dx}-f'(\alpha)\alpha+f(\alpha)     (6-6)

ここで

\alpha=\displaystyle{\int}g(\mathbf{x})p(\mathbf{x})\mathbf{dx}     (6-7)

と置くと、式(6-6)は

\displaystyle{\int}f\left(g(\mathbf{x})\right)p(\mathbf{x})\mathbf{dx}\le{f}'(\alpha)\alpha-f'(\alpha)\alpha+f\left({\int}g(\mathbf{x})p(\mathbf{x})\mathbf{dx}\right)=f\left({\int}g(\mathbf{x})p(\mathbf{x})\mathbf{dx}\right)

よって以下が成り立ちます。

\displaystyle{\int}f\left(g(\mathbf{x})\right)p(\mathbf{x})\mathbf{dx}\le{f}\left({\int}g(\mathbf{x})p(\mathbf{x})\mathbf{dx}\right)     (6-8)

これが、多次元に拡張したイェンゼンの不等式です。


次に

f(x)=\log{x}     (3-7)

と置きます。また、

\displaystyle{g}(\mathbf{x})=\frac{q(\mathbf{x})}{p(\mathbf{x})}    (6-9)

と置きます。ただしq(\mathbf{x})は確率分布であり、

\displaystyle{\int}q(\mathbf{x})\mathbf{dx}=1     (6-10)

かつq(\mathbf{x})\ge0を満たすとします。
式(3-7), (6-9)を式(6-8)に代入すると

\displaystyle{\int}p(\mathbf{x})\log\left(\frac{q(\mathbf{x})}{p(\mathbf{x})}\right)\mathbf{dx}\le\log\left(\int{q}(\mathbf{x})\mathbf{dx}\right)

となります。この式の右辺に式(6-10)を代入して

 \displaystyle{\int}p(\mathbf{x})\log\left(\frac{q(\mathbf{x})}{p(\mathbf{x})}\right)\mathbf{dx}\le\log1

よって

 \displaystyle{\int}p(\mathbf{x})\log\left(\frac{q(\mathbf{x})}{p(\mathbf{x})}\right)\mathbf{dx}\le0

\displaystyle{\int}p(\mathbf{x})\log\left(\frac{p(\mathbf{x})}{q(\mathbf{x})}\right)\mathbf{dx}\ge0

この式と式(6-2)から

D_{\rm{KL}}(p||q)\ge0     (3-3)

が成り立ちます。


D_{\rm{KL}}(p||q)=0p(\mathbf{x})=q(\mathbf{x})が同値であることの証明はスカラーxの場合と同じなので省略します。