An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
이번 발표 논문의 제목은 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale으로, 일명 Visual Transformer 방법을 새롭게 제시한 논문이다.
이번 발표 논문의 제목은 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale으로, 일명 Visual Transformer 방법을 새롭게 제시한 논문이다.
BERT와 같은 Masked Language Model과 GPT와 같은 Causal Language Model의 차이점을 정리해보았다. 해당 링크를 참고하여 작성하였다.
이번 발표 논문의 제목은 Enriching Word Vectors with Subword Information으로, 일명 FastText 방법을 새롭게 제시한 논문이다.
1. 등굣길
크루스칼 알고리즘