주석이 달린 Transformer: 한 줄씩 구현
2025-08-26
이 문서는 Transformer 논문의 주석이 달린, 한 줄씩 PyTorch 구현을 제공합니다. 원 논문의 일부 섹션을 재정렬하고 제거하며 전체적으로 주석을 추가했습니다. 이 노트북은 완전하고 실행 가능한 구현을 제공하며, Transformer 아키텍처(인코더, 디코더, 어텐션, 위치 인코딩 등), 학습 과정, 그리고 실제 사례(Multi30k 독일어-영어 번역)를 설명합니다.
더 보기
개발