Introduction
Last updated
Was this helpful?
Last updated
Was this helpful?
Introduction์ ์ดํด๋ณด๊ธฐ ์ , ๋ฒ ์ด์ง์ ๋ชจ๋ธ์ด ๋ฌด์์ธ์ง ์์๋ณด์. ๋ฒ ์ด์ฆ ์ถ๋ก ์ ์ด๋ ํ ๊ด์ธก์ด ์์ ๋, ์ฌ๊ฑด์ด ์ผ์ด๋ ํ๋ฅ (์กฐ๊ฑด๋ถํ๋ฅ )์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ค. ๋ฒ ์ด์ฆ ์ ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ๋ค. ๋ถ๋ฅ ํด๋์ค C์ ๊ด์ธก๊ฐ X๊ฐ ์์ ๋๋ฅผ ์๋ก ๋ค๋ฉด
์ด๋ค. ๋ถ์๋ ๊ฒฐํฉํ๋ฅ ์ด๋ค. ๋ฅผ ์ฌํํ๋ฅ (posterior), ๋ฅผ ์ฌ์ ํ๋ฅ (prior), ๋ฅผ ๊ฐ๋ฅ๋(likelihood), ๋ฅผ ๊ด์ธก๊ฐ(evidence)์ผ๋ก ๋ถ๋ฅธ๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ(wiki)๋ฅผ ์๊ฐํ๋ฉด, ์ด๋ค ํด๋์ค๊ฐ ์ฃผ์ด์ก์ ๋ ๊ด์ธก๊ฐ X์ ๊ฐ๊ฐ์ n๊ฐ์ ํน์ฑ๋ค์ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ผ๋ก ๊ฐ์ ํ๋ฏ๋ก,
๋ก ํํ๋์ด posterior์ ๊ตฌํ ์ ์๋ค. ์ด๋ ๊ฒ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ ์ฌ์ฉํ ํ๋ฅ ๋ชจ๋ธ์ ๋ฒ ์ด์ง์ ๋ชจ๋ธ์ด๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ VAE์ ๊ฐ์ ์์ฑ ๋ชจ๋ธ๋ ์ด์ ๊ฐ์ ๋ฒ ์ด์ง์ ๋ชจ๋ธ์ด๋ค.
๋์ด๋ธ ๋ฒ ์ด์ฆ ๋ถ๋ฅ๊ธฐ์ ํ๋ฅ ๋ชจ๋ธ์ ๊ทธ๋ํ๋ก ๋ํ๋ด๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ ํฅ ๋น์ํ ๊ทธ๋ํ(DAG)๋ก ๋ํ๋ด์ด์ง๋ค. ๊ฐ ๋ ธ๋๋ ํ๋ฅ ๋ณ์๋ฅผ ์๋ฏธํ๊ณ , ๊ฐ ์ฃ์ง๋ ๋ ํ๋ฅ ๋ณ์ ์ฌ์ด์ ํ๋ฅ ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
์์ ํ๋ฅ ๋ชจ๋ธ์ ๊ฒฐํฉํ๋ฅ ์ ๊ตฌํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ด์ด์ง๋ค(ํ๋ฅ ๊ฐ ํ๋๊ฐ ์๋ ๋ถํฌ์ด๋ฏ๋ก ).
DnCNN(2016)๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋๋ฐ๋ discriminative model๋ก ์ค๋ช ํ๋ค. ์๋ํ๋ฉด model์ด ๋ฐ์ดํฐ์ (=๋ ธ์ด์ฆ๊ฐ ์๋ ์ด๋ฏธ์ง)์ ์์ฑํ์ง ์๊ธฐ ๋๋ฌธ์ด๋ค. DnCNN์ ๋ฐ์ดํฐ์ ์ ๋ํ ๋ถํฌ์ธ noisy image์ ๋ํ ๋ถํฌ๋ ๊ณ ๋ คํ์ง ์์ผ๋ฉฐ, ๋์ ์ธ์์ ์๋ ๋ชจ๋ ์ด๋ฏธ์ง์ ์ฌ์ ์ง์(prior) ํ๋ฅ ๋ถํฌ๋ฅผ ๋ชจ๋ธ์ ํ์ต์์ผ ๋ ธ์ด์ฆ๋ง ๋จ๋๋ก ์ด๋ฏธ์ง๋ฅผ ์ ๊ฑฐํ๋ค.
๋ฐ๋ฉด, ๋์ด๋ธ ๋ฒ ์ด์ฆ์ ํ๋ฅ ๋ถํฌ๋ฅผ ์ด์ฉํ๋ฉด ๋ถ๋ฅ์ํฌ ์ ์๋ ์ง์ง๊ฐ์ ๋ฐ์ดํฐ ์ํ์ ํ๋ ๋ง๋ค ์ ์๋ค!
Intractable์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ํจ์จ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ด ์กด์ฌํ์ง ์๋ ๊ฒฝ์ฐ๋ฅผ ์ง์นญํ๋ค. ์๊ฐ๋ณต์ก๋๊ฐ ์ง์์ฆ๊ฐ์ธ ๊ฒฝ์ฐ๊ฐ ์๋ค.
Abstract์ ๋ํ๋ ์ฒซ ๋ฒ์งธ ๋ชฉํ์ ํด๋นํ๋ค.
posterior(์ฌํํ๋ฅ )๋ถํฌ๋ฅผ ํ์ตํ๋ ๊ฒ์ด ํ๋ฅ ๋ชจ๋ธ(directed๋ก ํ์ ํ๋ค - ๋ฐฉํฅ์ฑ์ด ์์)์ ์ฌ์ฉํด ์์ธกํ๊ณ ์ํ์ ์์ฑํ๋ ๋ฐ ๋งค์ฐ ์ค์ํ๋ค. ๊ทธ๋ฐ๋ฐ ์ด posterior๊ฐ ๋งค์ฐ ๋ณต์กํ ๋ถํฌ๋ฅผ ๊ฐ์ง๊ณ ์์ด์ ์ต์ ํํ๊ธฐ ์ด๋ ต๋ค๋ฉด ์ด๋กํ ๊น?
Variational Bayesian ๋ฐฉ๋ฒ์ ๊ณ์ฐํ๊ธฐ ์ด๋ ค์ด ๋ถํฌ๋ฅผ ๊ทผ์ฌํด ๋ค๋ฃฐ ์ ์๋๋ก ๋ง๋ค์ด ์ค๋ค. ๋ณต์กํ posterior ๋ถํฌ๋ฅผ ํ์ตํ๊ธฐ ์ํด ์ ํต์ ์ผ๋ก ์ฌ์ฉ๋์๋ variational bayesian ์ ๊ทผ๋ฒ์ธ mean-field ๊ทผ์ฌ๋ posterior์ ๋ํ ํด์์ ์ธ ํด๋ฅผ ํ์๋ก ํ๋ฏ๋ก, ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ์ด์๋ค.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ด ๋ ผ๋ฌธ์์ , variational lower bound๋ฅผ reparameterizeํจ์ผ๋ก์จ, ์ฐ์์ ์ ์ฌ ๋ณ์๋ฅผ ๊ฐ์ง๋ ์ด๋ ๋ชจ๋ธ์ ๋ํด์๋ ์ ์ฉํ ์ ์๋, SGD๋ก ์ต์ ํ ๊ฐ๋ฅํ ๋ฐฉ๋ฒ(SGVB)์ ์ค๋ช ํ๋ค.
Abstract์ ๋ํ๋ ๋ ๋ฒ์งธ ๋ชฉํ์ ํด๋นํ๋ค.
IID(์๋ก ๋ ๋ฆฝ์ด๊ณ ๋ชจ๋ ๊ฐ์ ๋ถํฌ๋ฅผ ๊ฐ์ง๋ ํ๋ฅ ๋ณ์๋ค)์ธ ๋ฐ์ดํฐ์ ๊ณผ ๊ฐ ๋ฐ์ดํฐ ํ๋ํ๋์ ๋ํด ์ ์ฌ ๋ณ์๊ฐ ์๋ ๊ฒฝ์ฐ์ ๋ํด Auto-Encoding Variational Bayes(AEVB) ๋ฐฉ๋ฒ์ ๋ ผ๋ฌธ์์ ์ ์ํ๋ค. AEVB๋ SGD๋ก ์ต์ ํ ๊ฐ๋ฅํ Variational Bayes(SGVB) ์ถ์ ๋(๋ชจ๋ธ ํ๋ผ๋ฏธํฐ์ ์ถ์ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ์๊ฐํ์)์ ์ฌ์ฉํจ์ผ๋ก์จ ํ์ต์ด ์ฉ์ดํ๊ณ ancestral sampling์ ํตํด ์๋ก์ด ์ํ์ ์์ฑํ๋ ์ถ๋ก ๋ ํจ์จ์ ์ผ๋ก ํ ์ ์๋ค.
์์์ ๋ณด์๋ฏ, Ancestral Sampling์ด๋ ์ ํฅ ๋น์ํ ๊ทธ๋ํ(DAG)๋ก ๋ํ๋ด์ด์ง๋ ๋ฒ ์ด์ง์ ๋คํธ์ํฌ์์ ํ๋ฅ ๋ณ์๋ฅผ ์์๋๋ก ์ํ๋งํด ์๋ก์ด ์ํ์ ์์ฑํ๋ ๊ณผ์ ์ด๋ค.
๋ณธ๋๋ผ๋ฉด MCMC(Markov Chain Monte Carlo) Sampling์ด๋ผ๋ cost๊ฐ ๋์ ๋ฐฉ๋ฒ์ ์ฌ์ฉํด ์ํ๋ง์ ํ์ง๋ง, ์๋ก์ด ๋ฐฉ๋ฒ์ ์ฌ์ฉํด ๋์ฑ ํจ์จ์ ์ผ๋ก ์ํ๋งํ ์ ์๋ค.
VAE๋
๋ณต์กํ ๋ถํฌ๋ฅผ ๊ฐ์ง posterior์ ๊ทผ์ฌํ๊ณ , lower bound๋ฅผ ์ฌ๋ ค ์ต์ ํํ๊ธฐ ์ํด Gradient descent๋ฅผ ์ฌ์ฉํ ์ ์๋๋ก ๋ง๋ค์๋ค(Variational).
์ด๋ฅผ ํ์ต์ํค๊ธฐ ์ํ encoder-decoder ๋ฅผ ์ฌ์ฉํ๋ Auto-Encoder์ ์ ์ฌํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ค.
์ฐ์ ์ ์ฌ ๋ณ์๊ฐ ์กด์ฌํ๋ฉด์ ๋ค๋ฃจ๊ธฐ ํ๋ posterior๊ฐ ์์ ๋๋, ํจ์จ์ ์ผ๋ก ์ต์ ํ(GD)/์ถ๋ก (Ancestral Sampling, ์ํ์์ฑ)ํ ์ ์๋ค.
๋ค์ ๋งํด, VAE๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ์ต์ ํํ๋ฉด (์ ์ฌ๋ณ์์์ ๋ฐ์ดํฐ๊ฐ ์ ๋ํ๋ค๋ ๊ฐ์ ์์)
์์ฑ ๋ชจ๋ธ๋ก์ ์๋ก์ด ์ํ์ ์์ฑํ ์ ์๋ค.
์ ์ฌ๋ณ์๋ฅผ ์กฐ์ ํจ์ผ๋ก์จ ์ํ ์์ฑ์ ์กฐ์ ํ ์ ์๋ค.
๋ก์ง์คํฑ ํ๊ท์ ๊ฐ์ ํ๋ณ ๋ชจ๋ธ์ ํ๋ฅ ๋ถํฌ ๋ฅผ ์ง์ ํ์ตํด ์ถ๋ ฅํ๋๋ก ํ๋ ๋ฐ๋ฉด, ์์ฑ ๋ชจ๋ธ์ ์ํ์ ์์ฑํ ์ ์๋๋ก likelihood์ prior ๋ฅผ ํ์ตํจ์ผ๋ก์จ posterior ๋ฅผ ๊ฐ์ ์ ์ผ๋ก ํ์ตํ๋ค. ๋์ด๋ธ ๋ฒ ์ด์ฆ์ ๊ฒฝ์ฐ, ํ๋ฅ ๋ณ์ C๋ฅผ ์ํ๋งํ ๋ค, ํ๋ฅ ์ ์ด์ฉํด ๋ถํฐ ๊น์ง ์ํ๋งํ๋ค๋ฉด, ์๋ก์ด ์ํ์ ์์ฑํ ์ ์๋ค. ์ด๊ฒ์ด Ancestral(Forward) Sampling์ด๋ค. ์ฆ, ๋์ด๋ธ ๋ฒ ์ด์ฆ๋ ์์ฑ ๋ชจ๋ธ์ด๋ค.