Annotierter Transformer: Eine zeilenweise Implementierung
2025-08-26
Dieses Dokument präsentiert eine annotierte, zeilenweise PyTorch-Implementierung des Transformer-Papers. Es ordnet einige Abschnitte des Originalpapiers neu an und entfernt einige, und fügt durchgehend Kommentare hinzu. Das Notebook bietet eine vollständige, ausführbare Implementierung und erklärt die Transformer-Architektur (Encoder, Decoder, Attention, Positionskodierung usw.), den Trainingsprozess und ein reales Beispiel (Multi30k Deutsch-Englisch-Übersetzung).
Mehr lesen
Entwicklung