D K L ( q ϕ ( z ∣ x ( i ) ) ∣ ∣ p θ ( z ) ) D_{KL}(q_{\bm \phi}(\bold z|\bold x^{(i)})||p_{\bm \theta}(\bold z)) D K L ( q ϕ ( z ∣ x ( i ) ) ∣∣ p θ ( z )) 를 풀어 쓰면
∫ − ∞ ∞ q ϕ ( z ∣ x ( i ) ) log q ϕ ( z ∣ x ( i ) ) d z − ∫ − ∞ ∞ q ϕ ( z ∣ x ( i ) ) log p θ ( z ) d z ⋯ ( 1 ) \int_{-\infty}^\infty q_{\bm \phi}(\bold z|\bold x^{(i)})\log q_{\bm \phi}(\bold z|\bold x^{(i)}) d \bold z- \int_{-\infty}^\infty q_{\bm \phi}(\bold z|\bold x^{(i)})\log {p_{\bm \theta}(\bold z)} d \bold z\qquad\cdots(1) ∫ − ∞ ∞ q ϕ ( z ∣ x ( i ) ) log q ϕ ( z ∣ x ( i ) ) d z − ∫ − ∞ ∞ q ϕ ( z ∣ x ( i ) ) log p θ ( z ) d z ⋯ ( 1 ) 이 적분을 구하기 위해서 어느 정도 정리가 필요하다.
정규분포의 크로스 엔트로피
평균과 분산이 μ , σ \mu, \sigma μ , σ 인 정규분포함수를 N μ , σ ( x ) \mathrm N_{\mu,\sigma}(x) N μ , σ ( x ) 로 나타내자. 여기서, 음의 크로스 엔트로피를 구해보자.
∫ − ∞ ∞ N μ 1 , σ 1 ( x ) log N μ 2 , σ 2 ( x ) d x = ∫ − ∞ ∞ N μ 1 , σ 1 ( x ) ( − log ( 2 π σ 2 ) − ( x − μ 2 ) 2 2 σ 2 2 ) d x \int_{-\infty}^\infty \mathrm N_{\mu_1,\sigma_1}(x)\log \mathrm N_{\mu_2,\sigma_2}(x)dx=\int_{-\infty}^\infty \mathrm N_{\mu_1,\sigma_1}(x)\left(-\log(\sqrt{2\pi}\sigma_2)-{{(x-\mu_2)^2}\over {2\sigma_2^2}}\right)dx ∫ − ∞ ∞ N μ 1 , σ 1 ( x ) log N μ 2 , σ 2 ( x ) d x = ∫ − ∞ ∞ N μ 1 , σ 1 ( x ) ( − log ( 2 π σ 2 ) − 2 σ 2 2 ( x − μ 2 ) 2 ) d x = − log ( 2 π σ 2 ) − ∫ − ∞ ∞ ( x − μ 2 ) 2 2 σ 2 2 N μ 1 , σ 1 ( x ) d x ⋯ ( 2 ) =-\log(\sqrt{2\pi}\sigma_2)-\int_{-\infty}^\infty {{(x-\mu_2)^2}\over {2\sigma_2^2}}\mathrm N_{\mu_1,\sigma_1}(x)dx\qquad \cdots(2) = − log ( 2 π σ 2 ) − ∫ − ∞ ∞ 2 σ 2 2 ( x − μ 2 ) 2 N μ 1 , σ 1 ( x ) d x ⋯ ( 2 ) 이 식의 두 번째 항을 계산하면,
1 2 σ 2 2 ( ∫ − ∞ ∞ x 2 N μ 1 , σ 1 ( x ) d x − 2 μ 2 ∫ − ∞ ∞ x N μ 1 , σ 1 ( x ) d x + μ 2 2 ∫ − ∞ ∞ N μ 1 , σ 1 ( x ) d x ) {1\over 2\sigma_2^2}\left(\int_{-\infty}^\infty x^2\mathrm N_{\mu_1,\sigma_1}(x)dx-2\mu_2\int_{-\infty}^\infty x \mathrm N_{\mu_1,\sigma_1}(x)dx+\mu_2^2\int_{-\infty}^\infty \mathrm N_{\mu_1,\sigma_1}(x)dx\right) 2 σ 2 2 1 ( ∫ − ∞ ∞ x 2 N μ 1 , σ 1 ( x ) d x − 2 μ 2 ∫ − ∞ ∞ x N μ 1 , σ 1 ( x ) d x + μ 2 2 ∫ − ∞ ∞ N μ 1 , σ 1 ( x ) d x ) (3)을 이용하면 (2)는
KLD 계산하기
확률분보다 다변량이므로, 엔트로피는 각 성분의 합이다. 정규분포가 diagonal covariance를 가지므로, 성분별로 계산할 수 있다.
식 (4)를 이용해 (5)에 적용하면,
따라서,