Transformador Anotado: Una Implementación Línea por Línea

2025-08-26

Este documento presenta una implementación anotada, línea por línea en PyTorch, del artículo del Transformador. Reordena y elimina algunas secciones del artículo original y agrega comentarios a lo largo del proceso. El cuaderno proporciona una implementación completa y ejecutable, explicando la arquitectura del Transformador (codificador, decodificador, atención, codificación posicional, etc.), el proceso de entrenamiento y un ejemplo del mundo real (traducción alemán-inglés Multi30k).

Desarrollo