Introduction
๋ฒ ์ด์ง์ ๋ชจ๋ธ
Introduction์ ์ดํด๋ณด๊ธฐ ์ , ๋ฒ ์ด์ง์ ๋ชจ๋ธ์ด ๋ฌด์์ธ์ง ์์๋ณด์. ๋ฒ ์ด์ฆ ์ถ๋ก ์ ์ด๋ ํ ๊ด์ธก์ด ์์ ๋, ์ฌ๊ฑด์ด ์ผ์ด๋ ํ๋ฅ (์กฐ๊ฑด๋ถํ๋ฅ )์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค. ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ๋ค. ๋ถ๋ฅ ํด๋์ค C์ ๊ด์ธก๊ฐ X๊ฐ ์์ ๋๋ฅผ ์๋ก ๋ค๋ฉด
๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ(wiki)๋ฅผ ์๊ฐํ๋ฉด, ์ด๋ค ํด๋์ค๊ฐ ์ฃผ์ด์ก์ ๋ ๊ด์ธก๊ฐ X์ ๊ฐ๊ฐ์ n๊ฐ์ ํน์ฑ๋ค์ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ผ๋ก ๊ฐ์ ํ๋ฏ๋ก,
๋ก ํํ๋์ด posterior์ ๊ตฌํ ์ ์๋ค. ์ด๋ ๊ฒ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ ์ฌ์ฉํ ํ๋ฅ ๋ชจ๋ธ์ ๋ฒ ์ด์ง์ ๋ชจ๋ธ์ด๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ VAE์ ๊ฐ์ ์์ฑ ๋ชจ๋ธ๋ ์ด์ ๊ฐ์ ๋ฒ ์ด์ง์ ๋ชจ๋ธ์ด๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ์ ํ๋ฅ ๋ชจ๋ธ์ ๊ทธ๋ํ๋ก ๋ํ๋ด๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ ํฅ ๋น์ํ ๊ทธ๋ํ(DAG)๋ก ๋ํ๋ด์ด์ง๋ค. ๊ฐ ๋ ธ๋๋ ํ๋ฅ ๋ณ์๋ฅผ ์๋ฏธํ๊ณ , ๊ฐ ์ฃ์ง๋ ๋ ํ๋ฅ ๋ณ์ ์ฌ์ด์ ํ๋ฅ ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
์์ ํ๋ฅ ๋ชจ๋ธ์ ๊ฒฐํฉํ๋ฅ ์ ๊ตฌํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ด์ด์ง๋ค(ํ๋ฅ ๊ฐ ํ๋๊ฐ ์๋ ๋ถํฌ์ด๋ฏ๋ก ).
DnCNN(2016)๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋๋ฐ๋ discriminative model๋ก ์ค๋ช ํ๋ค. ์๋ํ๋ฉด model์ด ๋ฐ์ดํฐ์ (=๋ ธ์ด์ฆ๊ฐ ์๋ ์ด๋ฏธ์ง)์ ์์ฑํ์ง ์๊ธฐ ๋๋ฌธ์ด๋ค. DnCNN์ ๋ฐ์ดํฐ์ ์ ๋ํ ๋ถํฌ์ธ noisy image์ ๋ํ ๋ถํฌ๋ ๊ณ ๋ คํ์ง ์์ผ๋ฉฐ, ๋์ ์ธ์์ ์๋ ๋ชจ๋ ์ด๋ฏธ์ง์ ์ฌ์ ์ง์(prior) ํ๋ฅ ๋ถํฌ๋ฅผ ๋ชจ๋ธ์ ํ์ต์์ผ ๋ ธ์ด์ฆ๋ง ๋จ๋๋ก ์ด๋ฏธ์ง๋ฅผ ์ ๊ฑฐํ๋ค.
๋ฐ๋ฉด, ๋์ด๋ธ ๋ฒ ์ด์ฆ์ ํ๋ฅ ๋ถํฌ๋ฅผ ์ด์ฉํ๋ฉด ๋ถ๋ฅ์ํฌ ์ ์๋ ์ง์ง๊ฐ์ ๋ฐ์ดํฐ ์ํ์ ํ๋ ๋ง๋ค ์ ์๋ค!
Intractable posterior
Intractable์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ํจ์จ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ด ์กด์ฌํ์ง ์๋ ๊ฒฝ์ฐ๋ฅผ ์ง์นญํ๋ค. ์๊ฐ๋ณต์ก๋๊ฐ ์ง์์ฆ๊ฐ์ธ ๊ฒฝ์ฐ๊ฐ ์๋ค.
Abstract์ ๋ํ๋ ์ฒซ ๋ฒ์งธ ๋ชฉํ์ ํด๋นํ๋ค.
posterior(์ฌํํ๋ฅ )๋ถํฌ๋ฅผ ํ์ตํ๋ ๊ฒ์ด ํ๋ฅ ๋ชจ๋ธ(directed๋ก ํ์ ํ๋ค - ๋ฐฉํฅ์ฑ์ด ์์)์ ์ฌ์ฉํด ์์ธกํ๊ณ ์ํ์ ์์ฑํ๋ ๋ฐ ๋งค์ฐ ์ค์ํ๋ค. ๊ทธ๋ฐ๋ฐ ์ด posterior๊ฐ ๋งค์ฐ ๋ณต์กํ ๋ถํฌ๋ฅผ ๊ฐ์ง๊ณ ์์ด์ ์ต์ ํํ๊ธฐ ์ด๋ ต๋ค๋ฉด ์ด๋กํ ๊น?
Variational Bayesian ๋ฐฉ๋ฒ์ ๊ณ์ฐํ๊ธฐ ์ด๋ ค์ด ๋ถํฌ๋ฅผ ๊ทผ์ฌํด ๋ค๋ฃฐ ์ ์๋๋ก ๋ง๋ค์ด ์ค๋ค. ๋ณต์กํ posterior ๋ถํฌ๋ฅผ ํ์ตํ๊ธฐ ์ํด ์ ํต์ ์ผ๋ก ์ฌ์ฉ๋์๋ variational bayesian ์ ๊ทผ๋ฒ์ธ mean-field ๊ทผ์ฌ๋ posterior์ ๋ํ ํด์์ ์ธ ํด๋ฅผ ํ์๋ก ํ๋ฏ๋ก, ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ์ด์๋ค.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ด ๋ ผ๋ฌธ์์ , variational lower bound๋ฅผ reparameterizeํจ์ผ๋ก์จ, ์ฐ์์ ์ ์ฌ ๋ณ์๋ฅผ ๊ฐ์ง๋ ์ด๋ ๋ชจ๋ธ์ ๋ํด์๋ ์ ์ฉํ ์ ์๋, SGD๋ก ์ต์ ํ ๊ฐ๋ฅํ ๋ฐฉ๋ฒ(SGVB)์ ์ค๋ช ํ๋ค.
Large Dataset
Abstract์ ๋ํ๋ ๋ ๋ฒ์งธ ๋ชฉํ์ ํด๋นํ๋ค.
IID(์๋ก ๋ ๋ฆฝ์ด๊ณ ๋ชจ๋ ๊ฐ์ ๋ถํฌ๋ฅผ ๊ฐ์ง๋ ํ๋ฅ ๋ณ์๋ค)์ธ ๋ฐ์ดํฐ์ ๊ณผ ๊ฐ ๋ฐ์ดํฐ ํ๋ํ๋์ ๋ํด ์ ์ฌ ๋ณ์๊ฐ ์๋ ๊ฒฝ์ฐ์ ๋ํด Auto-Encoding Variational Bayes(AEVB) ๋ฐฉ๋ฒ์ ๋ ผ๋ฌธ์์ ์ ์ํ๋ค. AEVB๋ SGD๋ก ์ต์ ํ ๊ฐ๋ฅํ Variational Bayes(SGVB) ์ถ์ ๋(๋ชจ๋ธ ํ๋ผ๋ฏธํฐ์ ์ถ์ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ์๊ฐํ์)์ ์ฌ์ฉํจ์ผ๋ก์จ ํ์ต์ด ์ฉ์ดํ๊ณ ancestral sampling์ ํตํด ์๋ก์ด ์ํ์ ์์ฑํ๋ ์ถ๋ก ๋ ํจ์จ์ ์ผ๋ก ํ ์ ์๋ค.
์์์ ๋ณด์๋ฏ, Ancestral Sampling์ด๋ ์ ํฅ ๋น์ํ ๊ทธ๋ํ(DAG)๋ก ๋ํ๋ด์ด์ง๋ ๋ฒ ์ด์ง์ ๋คํธ์ํฌ์์ ํ๋ฅ ๋ณ์๋ฅผ ์์๋๋ก ์ํ๋งํด ์๋ก์ด ์ํ์ ์์ฑํ๋ ๊ณผ์ ์ด๋ค.
๋ณธ๋๋ผ๋ฉด MCMC(Markov Chain Monte Carlo) Sampling์ด๋ผ๋ cost๊ฐ ๋์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํด ์ํ๋ง์ ํ์ง๋ง, ์๋ก์ด ๋ฐฉ๋ฒ์ ์ฌ์ฉํด ๋์ฑ ํจ์จ์ ์ผ๋ก ์ํ๋งํ ์ ์๋ค.
Variational Auto-Encoder
VAE๋
๋ณต์กํ ๋ถํฌ๋ฅผ ๊ฐ์ง posterior์ ๊ทผ์ฌํ๊ณ , lower bound๋ฅผ ์ฌ๋ ค ์ต์ ํํ๊ธฐ ์ํด Gradient descent๋ฅผ ์ฌ์ฉํ ์ ์๋๋ก ๋ง๋ค์๋ค(Variational).
์ด๋ฅผ ํ์ต์ํค๊ธฐ ์ํ encoder-decoder ๋ฅผ ์ฌ์ฉํ๋ Auto-Encoder์ ์ ์ฌํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ค.
์ฐ์ ์ ์ฌ ๋ณ์๊ฐ ์กด์ฌํ๋ฉด์ ๋ค๋ฃจ๊ธฐ ํ๋ posterior๊ฐ ์์ ๋๋, ํจ์จ์ ์ผ๋ก ์ต์ ํ(GD)/์ถ๋ก (Ancestral Sampling, ์ํ์์ฑ)ํ ์ ์๋ค.
๋ค์ ๋งํด, VAE๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ์ต์ ํํ๋ฉด (์ ์ฌ๋ณ์์์ ๋ฐ์ดํฐ๊ฐ ์ ๋ํ๋ค๋ ๊ฐ์ ์์)
์์ฑ ๋ชจ๋ธ๋ก์ ์๋ก์ด ์ํ์ ์์ฑํ ์ ์๋ค.
์ ์ฌ๋ณ์๋ฅผ ์กฐ์ ํจ์ผ๋ก์จ ์ํ ์์ฑ์ ์กฐ์ ํ ์ ์๋ค.
Last updated