DnCNN Model
๋คํธ์ํฌ ๊ตฌ์กฐ๋ ๊ธฐ๋ณธ์ ์ผ๋ก VGG ๋คํธ์ํฌ๋ฅผ image denoising์ ๋ง๊ฒ ๋ณํํ๊ณ , ๊น์ด์ patch size๋ฅผ ์ ์ ํ ๋ฐ๊พผ๋ค. ํ์ต์๋ residual leraning์ ์ฌ์ฉํ๊ณ , batch normalization๋ ์ฌ์ฉํ๋ค.
Network Formulation
Depth
Filter size๋ 3x3 ์ผ๋ก ํ๊ณ , receptive field์ ํฌ๊ธฐ๋ ๋คํธ์ํฌ์ ๊น์ด ์ ๋ํด ์ด๋ค. ์ ์ ํ ๊น์ด๋ฅผ ์ฐพ๋ ๊ฒ์ด ๋ฌธ์ ์ด๊ธฐ๋ ํ๋ค. Noise Level ์์ ๊ธฐ์กด์ ๋ค์ํ ๋ชจ๋ธ์ 36~361์ ๋ค์ํ patch size๋ฅผ ๊ฐ์ง๋ค.
CNN์ receptive field๋ ์ถ๋ ฅ ๋ ธ๋ ํ๋์ ์ํฅ์ ๋ฏธ์น๋ ์ ๋ ฅ ๋ ธ๋์ ํฌ๊ธฐ์ด๋ค. 3x3์ conv layer๋ฅผ ํ ๋ฒ ์ง๋ ๋๋ง๋ค ๋๋น ํฝ์ ์๋ -2๊ฐ ๋๋ฏ๋ก(-3+1), ์ต์ข ์ ์ผ๋ก 1ํฝ์ ์ด ๋จ๊ธฐ ์ํด์ receptive field์ ๋๋น ํฝ์ ์๋ 2d+1์ด๋ค.
Denoising์๋ d=17์ด์ง๋ง ๋ค๋ฅธ ์ผ๋ฐ์ ์ธ ๋ฌธ์ ์ ๋ํด d=20์ ์ ์ฉํ๋ค.
Loss Function
DnCNN์ ๋ ธ์ด์ฆ๊ฐ ์๋ ์ด๋ฏธ์ง์์ ๋ ธ์ด์ฆ์ ํํ๋ฅผ ์์ธกํ๋ค. ์์ ๊ฐ ๋ ธ์ด์ฆ ์๋ ์ด๋ฏธ์ง์ด๋ค. ๋ฐ๋ผ์ loss function์
์ด๋ฉฐ, ์ค์ residual noise์ ๋ํ ์์ธก๋ noise์ MSE๋ค.
Architecture
Layer # | Construction | In/out channel |
---|---|---|
1 | Conv+ReLU | c / 64 |
2~d-1 | Conv+BN+ReLU | 64 / 64 |
d | Conv | 64 / c |
๋ชจ๋ kernel์ ํฌ๊ธฐ๋ 1 channel๋น 3x3์ด๋ค.
์ ๋ ฅ๊ณผ ์ถ๋ ฅ์ ํฌ๊ธฐ๋ฅผ ๋์ผํ๊ฒ ๋ง์ถ๊ธฐ ์ํด, ์ ๋ ฅ ์ Zero paddingํ๋ค. ์ด๋ก์จ ์ด๋ฏธ์ง ๊ฒฝ๊ณ์ ์๋ ํ์ ์ ๋ณด์ํ ์ ์๋ค.
Batch Normalization + Residual Learning
๋ถ๋ช Fig. 1์ architecture๋ residual learning์ผ๋ก์จ ์ฌ์ฉ๋ ์ ์์ ๋ฟ๋ง ์๋๋ผ ๋ ธ์ด์ฆ๊ฐ ์๋ ์ด๋ฏธ์ง๋ฅผ ๊ทธ๋๋ก ์ถ๋ ฅํ๋ ๋ฐ ์ฌ์ฉ๋ ์ ์๋ค. ๋ค๋ฅธ ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด mapping์ด identity ์ ๊ฐ๊น๋ค๋ฉด ๊ทธ ์ฐจ์ด(residual)์ ์ค์ด๋ ๊ฒ์ด ์ต์ ํํ๊ธฐ ๋ ์ฝ๋ค๊ณ ์ฃผ์ฅํ๋ค. ๋ ธ์ด์ฆ๋ฅผ ์ ๊ฑฐํ๋ ๊ณผ์ ์ ์ด๋ฏธ์ง์ ํน์ ์ ๋๋ถ๋ถ ๋ณด์กดํ ์ฑ ๋ ธ์ด์ฆ๋ง ์์ ๋ ๊ฒ์ด๋ฏ๋ก identity mapping์ ๊ฐ๊น์ฐ๋ฉฐ, residual learning์ด ๋ ํจ๊ณผ์ ์ด๋ผ๋ ์์ธก์ ํ ์ ์๋ค.
SGD์์ BN์ ์ ์ฉํ์ง ์์ ๊ฒ์ด ์ ์ต์ ํ๋์ง ์๋ ๋ฐ๋ฉด, Adam์์ ์ต์ ํ๊ฐ ์ ๋๋ ๊ฒ์ผ๋ก ๋ณด์ BN์ด ์ต์ ํ์ ๋์์ ์ค ๋ค๋ ๊ฒ์ ์ ์ ์๊ณ , BN์ ์ ์ฉํ์ ๋ ๋ชจ๋ ์ต์ ํ๊ฐ ์ ๋๋ ๊ฒ์ผ๋ก ๋ณด์ BN์ด ์์ ์ ์ธ ์ต์ ํ์ ๋์์ ์ค๋ค๋ ๊ฒ์ ์ ์ ์๋ค.
ํนํ, ์ถ๋ ฅํ ๋ ธ์ด์ฆ๋ Gaussian noise์ด๋ฏ๋ก Gaussian distribution(์ ๊ท๋ถํฌ)์ ๊น์ ์ฐ๊ด์ด ์๋ค. BN์ layer ์ฌ์ด์ฌ์ด์์ ๋ชจ๋ layer์ ์ ๋ ฅ์ด unit gaussian distribution์ด ๋๋๋ก ํ๋ ๊ณผ์ ์ด๋ฏ๋ก ์ฑ๋ฅ ํฅ์์ ๊ธฐ๋ํ ์ ์๋ค(๋ชจ๋ layer์์ ์ผ๊ด์ฑ์ ์ ์งํ๊ณ ์ถ๋ ฅ์ด unit gaussian์)
Connection With TNRD
DnCNN์ one-stage TNRD์ ์ผ๋ฐํ๋ก ์ค๋ช ํ ์ ์๋ค. TNRD๋ ๋ค์์ ์ต์ ํํ๋ discriminitave ๋ฌธ์ ์ด๋ค.
๋ regularization, ์ ์ด๋ฏธ์ง์ ํฌ๊ธฐ, ๋ k๋ฒ์งธ ์ปจ๋ณผ๋ฃจ์ ์ปค๋์ด๋ฉฐ, ๋ ์กฐ์ ๊ฐ๋ฅํ k๋ฒ์งธ ํจ๋ํฐ ํจ์์ด๋ค. Gaussian denoising์์ ๋ฅผ ์ฌ์ฉํ๋ค. ์ด ์์ ๋ํ ์ฒซ๋ฒ์งธ gradient descent inference ์์
๊ฐ์ฅ ์ค๋ฅธ์ชฝ ํญ์ 0์ด๋ฏ๋ก,
y์ ๋ํ x์ residual์ gradient descent๋ก ์์ธกํ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์ ์์ 2 layer์ CNN๊ณผ ์ค์ง์ ์ผ๋ก ๊ฐ๋ค. ์ฌ๊ธฐ์ ๋ฅผ ReLU๋ก ๋ฐ๊พธ๊ณ ๊น์ด๋ฅผ ๋๋ฆฌ๊ณ batch normalization์ ์ฌ์ฉํ๋ฉด DnCNN์ด๋ค. ์ ์์ ๋ ธ์ด์ฆ ๋ ๋ฒจ์ ๋ํ ์ ๋ณด๊ฐ ์๋ค. ์์์ ๋ ๋ฒจ์ ๋ํด์ ํ์ฉํ ์ ์๋ค.
Gaussian distribution์ผ๋ ์ ์์ 0์ด์ง๋ง, ๋ค๋ฅธ ๋ถํฌ์์๋ 0์ผ ์ ์๋ค. ๋งค์ฐ ๋ง์ ๋ถํฌ๊ฐ 0๊ณผ ๊ฐ๊ฑฐ๋ ๊ฐ๊น์ด ๊ธฐ์ธ๊ธฐ๋ฅผ ๋ณด์ธ๋ค. ๋ฐ๋ผ์ SISR, JPEG ์์ถ์๋ ์ฌ์ฉํ ์ ์๋ค.
Last updated