Introduction

๋ฒ ์ด์ง€์•ˆ ๋ชจ๋ธ

Introduction์„ ์‚ดํŽด๋ณด๊ธฐ ์ „, ๋ฒ ์ด์ง€์•ˆ ๋ชจ๋ธ์ด ๋ฌด์—‡์ธ์ง€ ์•Œ์•„๋ณด์ž. ๋ฒ ์ด์ฆˆ ์ถ”๋ก ์€ ์–ด๋– ํ•œ ๊ด€์ธก์ด ์žˆ์„ ๋•Œ, ์‚ฌ๊ฑด์ด ์ผ์–ด๋‚  ํ™•๋ฅ (์กฐ๊ฑด๋ถ€ํ™•๋ฅ )์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ๋‹ค. ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ๋ถ„๋ฅ˜ ํด๋ž˜์Šค C์™€ ๊ด€์ธก๊ฐ’ X๊ฐ€ ์žˆ์„ ๋•Œ๋ฅผ ์˜ˆ๋กœ ๋“ค๋ฉด

๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ๋ถ„๋ฅ˜(wiki)๋ฅผ ์ƒ๊ฐํ•˜๋ฉด, ์–ด๋–ค ํด๋ž˜์Šค๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ๊ด€์ธก๊ฐ’ X์˜ ๊ฐ๊ฐ์˜ n๊ฐœ์˜ ํŠน์„ฑ๋“ค์€ ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ์œผ๋กœ ๊ฐ€์ •ํ•˜๋ฏ€๋กœ,

๋กœ ํ‘œํ˜„๋˜์–ด posterior์„ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ์„ ์‚ฌ์šฉํ•œ ํ™•๋ฅ  ๋ชจ๋ธ์„ ๋ฒ ์ด์ง€์•ˆ ๋ชจ๋ธ์ด๋ผ๊ณ  ๋ถ€๋ฅด๋ฉฐ VAE์™€ ๊ฐ™์€ ์ƒ์„ฑ ๋ชจ๋ธ๋„ ์ด์™€ ๊ฐ™์€ ๋ฒ ์ด์ง€์•ˆ ๋ชจ๋ธ์ด๋‹ค.

๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ๋ถ„๋ฅ˜๊ธฐ์˜ ํ™•๋ฅ  ๋ชจ๋ธ์„ ๊ทธ๋ž˜ํ”„๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์œ ํ–ฅ ๋น„์ˆœํ™˜ ๊ทธ๋ž˜ํ”„(DAG)๋กœ ๋‚˜ํƒ€๋‚ด์–ด์ง„๋‹ค. ๊ฐ ๋…ธ๋“œ๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜๋ฅผ ์˜๋ฏธํ•˜๊ณ , ๊ฐ ์—ฃ์ง€๋Š” ๋‘ ํ™•๋ฅ ๋ณ€์ˆ˜ ์‚ฌ์ด์˜ ํ™•๋ฅ ์  ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค.

์œ„์˜ ํ™•๋ฅ  ๋ชจ๋ธ์˜ ๊ฒฐํ•ฉํ™•๋ฅ ์„ ๊ตฌํ•ด๋ณด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋‚˜ํƒ€๋‚ด์–ด์ง„๋‹ค(ํ™•๋ฅ ๊ฐ’ ํ•˜๋‚˜๊ฐ€ ์•„๋‹Œ ๋ถ„ํฌ์ด๋ฏ€๋กœ ).

DnCNN(2016)๋Š” ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๋Š”๋ฐ๋„ discriminative model๋กœ ์„ค๋ช…ํ•œ๋‹ค. ์™œ๋ƒํ•˜๋ฉด model์ด ๋ฐ์ดํ„ฐ์…‹(=๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ๋Š” ์ด๋ฏธ์ง€)์„ ์ƒ์„ฑํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. DnCNN์€ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ๋ถ„ํฌ์ธ noisy image์— ๋Œ€ํ•œ ๋ถ„ํฌ๋Š” ๊ณ ๋ คํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๋Œ€์‹  ์„ธ์ƒ์— ์žˆ๋Š” ๋ชจ๋“  ์ด๋ฏธ์ง€์˜ ์‚ฌ์ „์ง€์‹(prior) ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ๋ชจ๋ธ์— ํ•™์Šต์‹œ์ผœ ๋…ธ์ด์ฆˆ๋งŒ ๋‚จ๋„๋ก ์ด๋ฏธ์ง€๋ฅผ ์ œ๊ฑฐํ•œ๋‹ค.

๋ฐ˜๋ฉด, ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ์˜ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ์ด์šฉํ•˜๋ฉด ๋ถ„๋ฅ˜์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ์ง„์งœ๊ฐ™์€ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์„ ํ•˜๋‚˜ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค!

Intractable posterior

Intractable์€ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ํšจ์œจ์ ์ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์กด์žฌํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ๋ฅผ ์ง€์นญํ•œ๋‹ค. ์‹œ๊ฐ„๋ณต์žก๋„๊ฐ€ ์ง€์ˆ˜์ฆ๊ฐ€์ธ ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋‹ค.

Abstract์— ๋‚˜ํƒ€๋‚œ ์ฒซ ๋ฒˆ์งธ ๋ชฉํ‘œ์— ํ•ด๋‹นํ•œ๋‹ค.

posterior(์‚ฌํ›„ํ™•๋ฅ )๋ถ„ํฌ๋ฅผ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ํ™•๋ฅ  ๋ชจ๋ธ(directed๋กœ ํ•œ์ •ํ•œ๋‹ค - ๋ฐฉํ–ฅ์„ฑ์ด ์žˆ์Œ)์„ ์‚ฌ์šฉํ•ด ์˜ˆ์ธกํ•˜๊ณ  ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค. ๊ทธ๋Ÿฐ๋ฐ ์ด posterior๊ฐ€ ๋งค์šฐ ๋ณต์žกํ•œ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์–ด์„œ ์ตœ์ ํ™”ํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋ฉด ์–ด๋–กํ• ๊นŒ?

Variational Bayesian ๋ฐฉ๋ฒ•์€ ๊ณ„์‚ฐํ•˜๊ธฐ ์–ด๋ ค์šด ๋ถ„ํฌ๋ฅผ ๊ทผ์‚ฌํ•ด ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์–ด ์ค€๋‹ค. ๋ณต์žกํ•œ posterior ๋ถ„ํฌ๋ฅผ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ์ „ํ†ต์ ์œผ๋กœ ์‚ฌ์šฉ๋˜์—ˆ๋˜ variational bayesian ์ ‘๊ทผ๋ฒ•์ธ mean-field ๊ทผ์‚ฌ๋Š” posterior์— ๋Œ€ํ•œ ํ•ด์„์ ์ธ ํ•ด๋ฅผ ํ•„์š”๋กœ ํ•˜๋ฏ€๋กœ, ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์—†๋Š” ๋ฐฉ๋ฒ•์ด์—ˆ๋‹ค.

์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ด ๋…ผ๋ฌธ์—์„ , variational lower bound๋ฅผ reparameterizeํ•จ์œผ๋กœ์จ, ์—ฐ์†์  ์ž ์žฌ ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง€๋Š” ์–ด๋Š ๋ชจ๋ธ์— ๋Œ€ํ•ด์„œ๋‚˜ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š”, SGD๋กœ ์ตœ์ ํ™” ๊ฐ€๋Šฅํ•œ ๋ฐฉ๋ฒ•(SGVB)์„ ์„ค๋ช…ํ•œ๋‹ค.

Large Dataset

Abstract์— ๋‚˜ํƒ€๋‚œ ๋‘ ๋ฒˆ์งธ ๋ชฉํ‘œ์— ํ•ด๋‹นํ•œ๋‹ค.

IID(์„œ๋กœ ๋…๋ฆฝ์ด๊ณ  ๋ชจ๋‘ ๊ฐ™์€ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜๋“ค)์ธ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๊ฐ ๋ฐ์ดํ„ฐ ํ•˜๋‚˜ํ•˜๋‚˜์— ๋Œ€ํ•ด ์ž ์žฌ ๋ณ€์ˆ˜๊ฐ€ ์žˆ๋Š” ๊ฒฝ์šฐ์— ๋Œ€ํ•ด Auto-Encoding Variational Bayes(AEVB) ๋ฐฉ๋ฒ•์„ ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•œ๋‹ค. AEVB๋Š” SGD๋กœ ์ตœ์ ํ™” ๊ฐ€๋Šฅํ•œ Variational Bayes(SGVB) ์ถ”์ •๋Ÿ‰(๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ถ”์ • ๋ฐฉ๋ฒ•์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜์ž)์„ ์‚ฌ์šฉํ•จ์œผ๋กœ์จ ํ•™์Šต์ด ์šฉ์ดํ•˜๊ณ  ancestral sampling์„ ํ†ตํ•ด ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•˜๋Š” ์ถ”๋ก ๋„ ํšจ์œจ์ ์œผ๋กœ ํ• ์ˆ˜ ์žˆ๋‹ค.

์œ„์—์„œ ๋ณด์•˜๋“ฏ, Ancestral Sampling์ด๋ž€ ์œ ํ–ฅ ๋น„์ˆœํ™˜ ๊ทธ๋ž˜ํ”„(DAG)๋กœ ๋‚˜ํƒ€๋‚ด์–ด์ง€๋Š” ๋ฒ ์ด์ง€์•ˆ ๋„คํŠธ์›Œํฌ์—์„œ ํ™•๋ฅ ๋ณ€์ˆ˜๋ฅผ ์ˆœ์„œ๋Œ€๋กœ ์ƒ˜ํ”Œ๋งํ•ด ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •์ด๋‹ค.

๋ณธ๋ž˜๋ผ๋ฉด MCMC(Markov Chain Monte Carlo) Sampling์ด๋ผ๋Š” cost๊ฐ€ ๋†’์€ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ด ์ƒ˜ํ”Œ๋ง์„ ํ–ˆ์ง€๋งŒ, ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ด ๋”์šฑ ํšจ์œจ์ ์œผ๋กœ ์ƒ˜ํ”Œ๋งํ•  ์ˆ˜ ์žˆ๋‹ค.

Variational Auto-Encoder

VAE๋Š”

  • ๋ณต์žกํ•œ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง„ posterior์„ ๊ทผ์‚ฌํ•˜๊ณ , lower bound๋ฅผ ์˜ฌ๋ ค ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•ด Gradient descent๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์—ˆ๋‹ค(Variational).

  • ์ด๋ฅผ ํ•™์Šต์‹œํ‚ค๊ธฐ ์œ„ํ•œ encoder-decoder ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” Auto-Encoder์™€ ์œ ์‚ฌํ•œ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„๋‹ค.

  • ์—ฐ์† ์ž ์žฌ ๋ณ€์ˆ˜๊ฐ€ ์กด์žฌํ•˜๋ฉด์„œ ๋‹ค๋ฃจ๊ธฐ ํž˜๋“  posterior๊ฐ€ ์žˆ์„ ๋•Œ๋„, ํšจ์œจ์ ์œผ๋กœ ์ตœ์ ํ™”(GD)/์ถ”๋ก (Ancestral Sampling, ์ƒ˜ํ”Œ์ƒ์„ฑ)ํ•  ์ˆ˜ ์žˆ๋‹ค.

๋‹ค์‹œ ๋งํ•ด, VAE๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์ตœ์ ํ™”ํ•˜๋ฉด (์ž ์žฌ๋ณ€์ˆ˜์—์„œ ๋ฐ์ดํ„ฐ๊ฐ€ ์œ ๋ž˜ํ–ˆ๋‹ค๋Š” ๊ฐ€์ •์—์„œ)

  1. ์ƒ์„ฑ ๋ชจ๋ธ๋กœ์„œ ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค.

  2. ์ž ์žฌ๋ณ€์ˆ˜๋ฅผ ์กฐ์ ˆํ•จ์œผ๋กœ์จ ์ƒ˜ํ”Œ ์ƒ์„ฑ์„ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ๋‹ค.

Last updated