Appendix - Positional Encoding 거리 증명
이므로, 특정 position p에서의 positional Encoding vector는
pos 1차이의 거리를 계산하기 위해 회전 행렬을 다음과 같이 정의하자.
그러면 k번째 이후의 positional encoding vector는
하나의 에 해당하는 거리를 구하면
이것을 모든 i에 대해 더해 루트를 씌우자.
이 값은 position p와는 무관하게 거리 k에 따른 값이다. 따라서 position 차이가 같다면 positional encoding vector의 거리 또한 거리가 항상 같다!
대표적으로, 1 position 차이나는 경우, k=1이고
Last updated