Attention is All You Need(2017)
Original Paper - Attention Is All You Need (https://arxiv.org/abs/1706.03762)
Abstract
์ง๋ฐฐ์ ์ผ๋ก ๋ง์ด ์ฌ์ฉ๋๋ ์ํ์ค ๋ณํ ๋ชจ๋ธ์ ์ธ์ฝ๋์ ๋์ฝ๋๋ฅผ ํฌํจํ๋ฉฐ ๋ณต์กํ Recurrent / Convolutional NN์ผ๋ก ๊ตฌ์ฑ๋๋ค. ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ด๋ ๋ชจ๋ธ๋ ์ธ์ฝ๋์ ๋์ฝ๋๋ฅผ attention mechanism์ผ๋ก ์ฐ๊ฒฐํ๋ ๊ตฌ์กฐ์ด๋ค.
์ด ๋ ผ๋ฌธ์์ Recurrent/Convolutional ๊ตฌ์กฐ๋ฅผ ์์ ํ ์์ ๊ณ Attention mechanism์ ๊ธฐ๋ฐํ, ์๋กญ๊ณ ๊ฐ๋จํ ๋คํธ์ํฌ ๊ตฌ์กฐ - Transformer๋ฅผ ์๊ฐํ๋ค. ๊ธฐ๊ณ๋ฒ์ญ ์์ ์ฑ๋ฅ์ ๋น๊ตํ์ ๋ ๋ ๋ณ๋ ฌํ ์ฝ๊ณ , ์ ๊ฒ trainํด๋ ๋ ์ข์ ์ฑ๋ฅ์ ๋ด์๋ค.
-์์น์ ์ฑ๋ฅ ๋ด์ฉ ์๋ต-
๋ํ Transformer๊ฐ ๋ค๋ฅธ ์์ ์์๋ ์ ์ผ๋ฐํ๋จ์ ๋ณด์๋ค.
Last updated
Was this helpful?