๐Ÿ•
AI Paper Study
  • AI Paper Study
  • Computer Vision
    • SRCNN(2015)
      • Introduction
      • CNN for SR
      • Experiment
      • ๊ตฌํ˜„ํ•ด๋ณด๊ธฐ
    • DnCNN(2016)
      • Introduction
      • Related Work
      • DnCNN Model
      • Experiment
      • ๊ตฌํ˜„ํ•ด๋ณด๊ธฐ
    • CycleGAN(2017)
      • Introduction
      • Formulation
      • Results
      • ๊ตฌํ˜„ํ•ด๋ณด๊ธฐ
  • Language Computation
    • Attention is All You Need(2017)
      • Introduction & Background
      • Model Architecture
      • Appendix - Positional Encoding ๊ฑฐ๋ฆฌ ์ฆ๋ช…
  • ML Statistics
    • VAE(2013)
      • Introduction
      • Problem Setting
      • Method
      • Variational Auto-Encoder
      • ๊ตฌํ˜„ํ•ด๋ณด๊ธฐ
      • Appendix - KL Divergence ์ ๋ถ„
  • ์ง๊ด€์  ์ดํ•ด
    • Seq2Seq
      • Ko-En Translation
Powered by GitBook
On this page
  • ์ž ์žฌ ๋ณ€์ˆ˜์™€ ๋ฐ์ดํ„ฐ
  • ํ•ด๊ฒฐํ•˜๋ ค๋Š” ๋ฌธ์ œ
  • ์ดํ•ด๊ฐ€ ์•ˆ๊ฐ€์š”๐Ÿ˜ญ

Was this helpful?

  1. ML Statistics
  2. VAE(2013)

Problem Setting

์ž ์žฌ ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง„ ๋‹ค์–‘ํ•œ ํ™•๋ฅ ๋ชจ๋ธ์ด ๋Œ€ํ•ด ํ™•๋ฅ ์  ํ•จ์ˆ˜์ธ 'lower bound estimator'๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด ์ฒซ ๋ชฉ์ ์ด๋‹ค. IIDํ•œ ๋ฐ์ดํ„ฐ์…‹์„ ๊ฐ€์ •ํ•˜๊ณ , ML(์ตœ๋Œ€ ๊ฐ€๋Šฅ๋„)๊ณผ MAP(์ตœ๋Œ€ ์‚ฌํ›„ํ™•๋ฅ )์„ ์‚ฌ์šฉํ•ด ์ž ์žฌ๋ณ€์ˆ˜ ๋ถ„ํฌ์™€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ถ”๋ก ํ•œ๋‹ค.

์ž ์žฌ ๋ณ€์ˆ˜์™€ ๋ฐ์ดํ„ฐ

์„œ๋กœ ๋…๋ฆฝ์ด๊ณ  ๋™์ผํ•œ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๋Š” ๋ฐ์ดํ„ฐ์…‹ X={x(i)}i=1N\bold X=\{\bold x^{(i)}\}_{i=1}^{N}X={x(i)}i=1Nโ€‹ ์ด ์žˆ๋‹ค๊ณ  ํ•˜๊ณ , ๋žœ๋คํ•˜๊ฒŒ ์ฃผ์–ด์ง„๋‹ค๊ณ  ํ•˜์ž. ์ด ๋ฐ์ดํ„ฐ์…‹์€ ๊ด€์ธก๋˜์ง€ ์•Š์€ ํ™•๋ฅ ๋ณ€์ˆ˜์ธ z\bold zz๋กœ๋ถ€ํ„ฐ ๋žœ๋คํ•˜๊ฒŒ ์ƒ์„ฑ๋œ๋‹ค. ์ด ๊ณผ์ •์€ ๋‘ ๋‹จ๊ณ„๋กœ ์ด๋ฃจ์–ด์ง€๋Š”๋ฐ,

  1. z(i)\bold z^{(i)}z(i)๊ฐ€ ์‚ฌ์ „ํ™•๋ฅ  ๋ถ„ํฌ(prior distribution) pฮธโˆ—(z)p_{\theta^*}(\bold z)pฮธโˆ—โ€‹(z)๋กœ๋ถ€ํ„ฐ ์ƒ์„ฑ๋œ๋‹ค.

  2. x(i)\bold x^{(i)}x(i)๊ฐ€ ์กฐ๊ฑด๋ถ€ํ™•๋ฅ  ๋ถ„ํฌ์ธ pฮธโˆ—(xโˆฃz)p_{\theta^*}(\bold x|\bold z)pฮธโˆ—โ€‹(xโˆฃz)๋กœ๋ถ€ํ„ฐ ์ƒ์„ฑ๋œ๋‹ค.

์—ฌ๊ธฐ์„œ ๊ฐ€์ •์ด ์žˆ๋‹ค.

  • pฮธโˆ—(xโˆฃz)p_{\theta^*}(\bold x|\bold z)pฮธโˆ—โ€‹(xโˆฃz)์™€pฮธโˆ—(z)p_{\theta^*}(\bold z)pฮธโˆ—โ€‹(z)๋Š” ๊ฐ๊ฐ pฮธ(xโˆฃz)p_{\theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)์™€ pฮธ(z)p_{\theta}(\bold z)pฮธโ€‹(z)์˜ parametric family(ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ๋‹ค๋ฅด๊ณ  ๊ฐ™์€ ํ˜•ํƒœ)

  • pฮธ(xโˆฃz)p_{\theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)์™€ pฮธ(z)p_{\bm\theta}(\bold z)pฮธโ€‹(z)์˜ ํ™•๋ฅ ๋ฐ€๋„ํ•จ์ˆ˜๊ฐ€ z\bold zz์™€ ฮธ\bm \thetaฮธ์— ๋Œ€ํ•ด ๊ฑฐ์˜ ๋ชจ๋“  ๊ณณ์—์„œ ๋ฏธ๋ถ„ ๊ฐ€๋Šฅ

ฮธโˆ—\bm \theta^*ฮธโˆ—์€ ์ƒ์„ฑ์— ์‚ฌ์šฉ๋˜๋Š” true ํŒŒ๋ผ๋ฏธํ„ฐ์ด๋‹ค. ์ด ๊ณผ์ •์€ ์šฐ๋ฆฌ๊ฐ€ ๊ด€์ฐฐํ•  ์ˆ˜ ์—†๋‹ค.

**๋ชฉํ‘œ: ์šฐ๋ฆฌ๋Š” ์ด ๋ถ„ํฌ๋ฅผ ํ•™์Šตํ•˜๊ณ  ์ถ”๋ก (์ƒ˜ํ”Œ์ƒ์„ฑ)ํ•˜๊ธฐ ์œ„ํ•ด์„œ ฮธ\bm \thetaฮธ๊ฐ€ ฮธโˆ—\bm \theta^*ฮธโˆ—์— ๊ฐ€๊นŒ์›Œ์ง€๋ก ์ตœ์ ํ™”ํ•ด์•ผ ํ•œ๋‹ค.

ํ•ด๊ฒฐํ•˜๋ ค๋Š” ๋ฌธ์ œ

ฮธ\bm \thetaฮธ๋ฅผ์ตœ์ ํ™”ํ•˜๋Š” ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์ด ์žˆ์ง€๋งŒ ๋‹ค์Œ ๋‘ ๊ฑธ๋ฆผ๋Œ์ด ์žˆ๋‹ค. ๋‘ ๊ทผ๋ณธ์  ๋ฌธ์ œ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ๋ฐฉ๋ฒ•์„ ์ฐพ์œผ๋ ค ํ•œ๋‹ค.

  1. ์ฃผ๋ณ€ํ™•๋ฅ ์ธ pฮธ(x)=โˆซpฮธ(z)pฮธ(xโˆฃz)dzp_{\bm \theta}(\mathbf{x})=\int p_{\bm \theta}(\bold z)p_{\bm \theta}(\bold x|\bold z)d\bold zpฮธโ€‹(x)=โˆซpฮธโ€‹(z)pฮธโ€‹(xโˆฃz)dz๊ฐ€ ๊ณ„์‚ฐํ•˜๊ธฐ ์–ด๋ ต๋‹ค. z\bold zz์˜ ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ์–ด๋– ํ•œ ๋ถ„ํฌ๋กœ ๊ฐ€์ •ํ•˜๋”๋ผ๋„ pฮธ(xโˆฃz)p_{\bm \theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)๋ฅผ ์ ๋ถ„ํ•  ์ˆ˜ ์—†๋‹ค. ML์ด๋‚˜ MAP๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ถ”์ •ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” EM ์•Œ๊ณ ๋ฆฌ์ฆ˜๋„ pฮธ(zโˆฃx)=pฮธ(xโˆฃz)pฮธ(z)pฮธ(x)p_{\bm \theta}(\bold z|\bold x)=\frac{p_{\bm \theta}(\bold x|\bold z)p_{\bm \theta}(\bold z)}{p_{\bm \theta}(\bold x)}pฮธโ€‹(zโˆฃx)=pฮธโ€‹(x)pฮธโ€‹(xโˆฃz)pฮธโ€‹(z)โ€‹ ๊ฐ€ ๊ณ„์‚ฐํ•˜๊ธฐ ํž˜๋“ค๊ธฐ ๋•Œ๋ฌธ์— likelihood์˜ ๊ธฐ๋Œ“๊ฐ’์„ ๊ณ„์‚ฐํ•˜๊ธฐ ์–ด๋ ต๋‹ค. z\bold zz๋ฒกํ„ฐ์˜ ์ฐจ์›์ด ์ฆ๊ฐ€ํ• ์ˆ˜๋ก z\bold zz๋ฒกํ„ฐ๋Š” ์ง€์ˆ˜์ ์œผ๋กœ ๋งŽ์€ ๊ฐ’์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๊ธฐ์—, ์ตœ์ ํ™”๊ฐ€ ์–ด๋ ต๋‹ค.

  2. ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ๋” ์ข‹์•„์ง€๋Š”๋ฐ, ๋ฐ์ดํ„ฐ๊ฐ€ ๋„ˆ๋ฌด ๋งŽ๋‹ค. ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ์ƒ˜ํ”Œ๋ง์„ ๊ณ„์† ์ง„ํ–‰ํ•ด์•ผ ํ•˜๋Š”๋ฐ, Monte Carlo EM ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๊ฐ™์€ ๋žœ๋คํ•œ ๊ณผ์ •์€ ๋„ˆ๋ฌด ๋А๋ ค์„œ, ํ•™์Šตํ•˜๋Š”๋ฐ ํ•œ์„ธ์›”์ด ๊ฑธ๋ฆฐ๋‹ค.

์œ„ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์กฐ๊ธˆ ๋” ์ง์ ‘์ ์ธ ๋ฌธ์ œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  1. ํŒŒ๋ผ๋ฏธํ„ฐ ฮธ\bm \thetaฮธ์— ๋Œ€ํ•œ ํšจ์œจ์ ์ธ ๊ทผ์‚ฌ ML/MAP๋ฐฉ๋ฒ• ์ฐพ๊ธฐ (z๋กœ๋ถ€ํ„ฐ x๋ฅผ ๋งŒ๋“œ๋Š” ๊ณผ์ •์„ ๋ฌ˜์‚ฌํ•ด ์ƒ˜ํ”Œ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Œ; ๊ทผ์‚ฌ์  theta ์ฐพ๊ธฐ)

  2. ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ฮธ\bm \thetaฮธ์ผ ๋•Œ, pฮธ(zโˆฃx)p_{\bm \theta}(\bold z|\bold x)pฮธโ€‹(zโˆฃx)์˜ ํšจ์œจ์ ์ธ ๊ทผ์‚ฌ ๋ฐฉ๋ฒ• ์ฐพ๊ธฐ (x๋กœ๋ถ€ํ„ฐ z๋กœ representationํ•˜๋Š” ๋ฌธ์ œ์—์„œ ํšจ๊ณผ์ )

  3. x\bold xx๋ถ„ํฌ์— ๋Œ€ํ•œ ํšจ์œจ์ ์ธ ๊ทผ์‚ฌ ์ฐพ๊ธฐ (denoising, SISR๊ณผ ๊ฐ™์€ prior ๋ชจ๋ธ๋ง ๋ฌธ์ œ์—์„œ ํšจ๊ณผ์ )

์ด ์„ธ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๊ณ„์‚ฐํ•˜๊ธฐ ์–ด๋ ค์šด posterior pฮธ(zโˆฃx)p_{\bm \theta}(\bold z|\bold x)pฮธโ€‹(zโˆฃx)๋Œ€์‹ , ๊ทผ์‚ฌ์‹œํ‚จ ์ƒˆ๋กœ์šด ๋ชจ๋ธ qฯ•(zโˆฃx)q_{\bm \phi}(\bold z|\bold x)qฯ•โ€‹(zโˆฃx)๋ฅผ ์ด์šฉํ•œ๋‹ค. mean-field ๊ทผ์‚ฌ๋ฒ•๊ณผ๋Š” ๋‹ค๋ฅด๊ฒŒ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋ชจ๋‘ ๋ถ„ํ•ดํ•ด์„œ ๊ณฑํ•˜๊ณ  ์ตœ์ ํ™”ํ•˜๋Š” ํž˜๋“  ๊ณ„์‚ฐ์„ ํ•  ํ•„์š”๊ฐ€ ์—†๋‹ค. ฮธ\bm \thetaฮธ ๋ฐ ฯ•\bm \phiฯ• ๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ด ๋…ผ๋ฌธ์—์„œ ์†Œ๊ฐœํ•œ๋‹ค.

Encoding-Decoding ์œผ๋กœ ์„ค๋ช…ํ•ด ๋ณด์ž. ๊ด€์ธก๋˜์ง€ ์•Š์€ 'ํžˆ๋“  ์ฝ”๋“œ'์ธ ์ž ์žฌ๋ณ€์ˆ˜ z\bf zz ๊ฐ€ ์žˆ๋‹ค. qฯ•(zโˆฃx)q_{\bm \phi}(\bold z|\bold x)qฯ•โ€‹(zโˆฃx) ๋Š” ๋ฐ์ดํ„ฐํฌ์ธํŠธ x\bold xx ๋ฅผ z\bold zz ๋กœ q์˜ ๋ถ„ํฌ์— ๋”ฐ๋ผ encodingํ•œ๋‹ค. ์ด encoder๋Š” ์–ด๋–ค ํžˆ๋“  ์ฝ”๋“œ z\bold zz ์—์„œ ์ด๋Ÿฐ x\bold xx ๊ฐ€ ์ƒ์„ฑ๋˜์–ด์•ผ ํ• ์ง€๋ฅผ ๋‚ดํฌํ•œ๋‹ค. ๊ฐ™์€ ๋งฅ๋ฝ์—์„œ, ์ƒ์„ฑ ๋ชจ๋ธ์ธ decoder๋Š” pฮธ(xโˆฃz)p_{\bm \theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)๋กœ z\bold zz ์—์„œ x\bold xx ๋ฅผ decoder์˜ ๋ถ„ํฌ์— ๋”ฐ๋ผ ์ƒ์„ฑํ•œ๋‹ค.

์ดํ•ด๊ฐ€ ์•ˆ๊ฐ€์š”๐Ÿ˜ญ

  • ์น ํ•ด์ง„ ๋…ธ๋“œ์ธx\bold xx๋Š” ์šฐ๋ฆฌ๊ฐ€ ๊ด€์ธก ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ์ด๋‹ค.

  • ์‹ค์„  ํ™”์‚ดํ‘œ ๋ถ€๋ถ„์€ ์ž ์žฌ๋ณ€์ˆ˜ z\bold zz๋กœ๋ถ€ํ„ฐ pฮธ(xโˆฃz)p_{\bm \theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)์— ์˜ํ•ด ํ™•๋ฅ ์ ์œผ๋กœ ๋ฐ์ดํ„ฐx\bold xx๊ฐ€ ์ƒ์„ฑ๋˜๋Š” ์ƒํ™ฉ์„ ๋งํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์šฐ๋ฆฌ๋Š” ์ด ๊ณผ์ •์„ ๊ฐ€๊น๊ฒŒ ์•Œ์•„๋‚ด ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•˜๊ณ  ์‹ถ๋‹ค.

  • ์ด ํ™•๋ฅ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์•Œ๋ฉด ์ž ์žฌ๋ณ€์ˆ˜ z\bold zz๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ x\bold xx๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค!

pฮธ(x)p_{\bm \theta}(\bold x)pฮธโ€‹(x)๋ฅผ ์•Œ๋ฉด ๊ทธ ๋ถ„ํฌ์—์„œ ์ƒ˜ํ”Œ๋ง ํ•˜๋‚˜ ํ•˜๋ฉด ๋˜์ง€๋งŒ, ์—„์ฒญ๋‚˜๊ฒŒ ๋ณต์žก๋„๊ฐ€ ๋†’์€ ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์™€ ๋‰ด๋Ÿด ๋„ท์—์„ , pฮธ(z),pฮธ(x)p_{\bm \theta}(\bold z), p_{\bm \theta}(\bold x)pฮธโ€‹(z),pฮธโ€‹(x) ๋ชจ๋‘ ๋ชจ๋ฅด๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋Œ€๋ถ€๋ถ„์ด๋‹ค.

๊ทธ๋Ÿผ ๋‚˜์ด๋ธŒ ๋ฒ ์ด์ฆˆ ์˜ˆ์‹œ์—์„œ ๋ณด์•˜๋˜ ๊ฒƒ ์ฒ˜๋Ÿผ posterior๋ฅผ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์„๊นŒ? EM ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ ฮธ\bm \thetaฮธ ๋ฅผ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•ด x\bold xx ์— ๋Œ€ํ•œ z\bold zz ์˜ ์กฐ๊ฑด๋ถ€ํ™•๋ฅ  ๋ถ„ํฌ(posterior)์„ ๊ณ„์‚ฐํ•˜๋ฉด ์ฃผ์–ด์ง„ z\bold zz ์— ๋Œ€ํ•œ x\bold xx๋ฅผ ์ƒ˜ํ”Œ๋งํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ฒ ์ด์ฆˆ ์ •๋ฆฌ์— ๋”ฐ๋ผ

pฮธ(zโˆฃx)=pฮธ(xโˆฃz)pฮธ(z)pฮธ(x)p_{\bm \theta}(\bold z|\bold x)=\frac{p_{\bm \theta}(\bold x|\bold z)p_{\bm \theta}(\bold z)}{p_{\bm \theta}(\bold x)}pฮธโ€‹(zโˆฃx)=pฮธโ€‹(x)pฮธโ€‹(xโˆฃz)pฮธโ€‹(z)โ€‹

์ธ๋ฐ, pฮธ(x)p_{\bm \theta}(\bold x)pฮธโ€‹(x)๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์‹์€

pฮธ(x)=โˆซpฮธ(z)pฮธ(xโˆฃz)dzp_{\bm \theta}(\bold x)=\int p_{\bm \theta}(\bold z)p_{\bm \theta}(\bold x|\bold z)d\bold zpฮธโ€‹(x)=โˆซpฮธโ€‹(z)pฮธโ€‹(xโˆฃz)dz

๋กœ ๋‚˜ํƒ€๋‚œ๋‹ค. z\bold zz์˜ ๋ถ„ํฌ๋ฅผ ์ ์ ˆํžˆ ๊ฐ€์šฐ์‹œ์•ˆ์œผ๋กœ ๊ฐ€์ •ํ•˜๊ณ  ์ƒ˜ํ”Œ๋ง ํ•˜๋”๋ผ๋„, pฮธ(xโˆฃz)p_{\bm \theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)๋ฅผ ๋ชจ๋ฅธ๋‹ค. z\bold zz๊ฐ€ ์—ฐ์†์ด๊ณ  ์ฐจ์›์ด ํฌ๊ธฐ์— ๋ฌดํ•œํžˆ ์ ๋ถ„ํ•ด์•ผํ•˜๋ฏ€๋กœ, ๋”ฐ๋ผ์„œ ์ ๋ถ„ํ•  ์ˆ˜ ์—†๋‹ค. ์ด๊ฒƒ์€ log-likelihood๋ฅผ ํ†ตํ•ด ๋‹จ์ˆœํ•œ ์ตœ์ ํ™”๋„ ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๋ ค์ค€๋‹ค.

์ด๋ฏธ์ง€ ์ƒ์„ฑ์ฒ˜๋Ÿผ ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์€ ์ž ์žฌ ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง„ ๊ฒฝ์šฐ์— ๋ชจ๋ธ์ด ์–ด๋–ค ์ด๋ฏธ์ง€๋ฅผ ์ถœ๋ ฅํ• ์ง€ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ์€ ์ž ์žฌ๋ณ€์ˆ˜ ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ ๋ชจ๋‘ ๊ณ ๋ คํ•ด ์–ด๋–ค ์ด๋ฏธ์ง€๊ฐ€ ์ƒ์„ฑ๋ ์ง€๋ฅผ ๋งคํ•‘ํ•ด์•ผ ํ•œ๋‹ค. ๊ทธ๋ ‡์ง€๋งŒ ์ด๊ฒƒ์€ ์šฐ๋ฆฌ๊ฐ€ ๊ตฌํ•˜๋ ค๊ณ  ํ•˜๋Š” Decoder ์ด๋‹ค. ์ตœ์ ํ™” ๋Œ€์ƒ์„ ๊ณ„์‚ฐํ•ด ๊ทธ๊ฒƒ์„ ์ตœ์ ํ™”ํ•˜๋ ค๋Š” ์ˆœํ™˜ ๋…ผ๋ฆฌ์— ๋น ์ง„๋‹ค.

๊ทธ๋ž˜์„œ ์—ฌ๊ธฐ์„œ ํ•ด๋ณผ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด, posterior๋ฅผ ๊ทผ์‚ฌ์‹œํ‚ค๋Š” ๊ฒƒ์ด๋‹ค. ํŒŒ๋ผ๋ฏธํ„ฐ ฯ•\bm \phiฯ•๋ฅผ ์ƒˆ๋กญ๊ฒŒ ์ ์šฉํ•˜์ž. ๊ทผ์‚ฌ์‹œํ‚จ posteriorqฯ•(zโˆฃx)q_{\bm \phi}(\bold z|\bold x)qฯ•โ€‹(zโˆฃx) ์„ ์ตœ์ ํ™”ํ•  ์ˆ˜ ์žˆ๊ณ  ๋™์‹œ์— ํŒŒ๋ผ๋ฏธํ„ฐ ฮธ\bm \thetaฮธ ๋ฅผ ์ตœ์ ํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, pฮธ(xโˆฃz)p_{\bm \theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)๋กœ๋ถ€ํ„ฐ ์ ์ ˆํžˆ ์ƒ˜ํ”Œ๋งํ•ด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์„๊ฒƒ์ด๋‹ค. ์šฐ๋ฆฌ๋Š” ๊ทธ ๊ทผ์‚ฌ๋ฅผ ๋‰ด๋Ÿด ๋„ท์œผ๋กœ ํ•˜๋ฉฐ, ์ตœ์ ํ™”๋„ ๊ฐ€๋Šฅํ•˜๊ณ  z๊ฐ’ ์ƒ˜ํ”Œ๋ง๋„ ๊ฐ€๋Šฅํ•˜๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ Auto-encoder์™€ ์œ ์‚ฌํ•œ ๊ตฌ์กฐ๊ฐ€ ๋œ๋‹ค. qฯ•(zโˆฃx)q_{\bm \phi}(\bold z|\bold x)qฯ•โ€‹(zโˆฃx) ๋‰ด๋Ÿด๋„ท์€ '์ธ์ฝ”๋”'๊ฐ€ ๋˜๊ณ , pฮธ(xโˆฃz)p_{\bm \theta}(\bold x|\bold z)pฮธโ€‹(xโˆฃz)๋‰ด๋Ÿด๋„ท์€ '๋””์ฝ”๋”'๊ฐ€ ๋œ๋‹ค.

PreviousIntroductionNextMethod

Last updated 3 years ago

Was this helpful?

๋ฌธ์ œ ์„ค์ •์— ๋Œ€ํ•œ Graphical Probabilistic Model