미니멀리스트 TPU 설계: 칩 가속기 개발 입문
2025-08-19
이 글에서는 Google의 TPU V1 및 V2에서 영감을 받은 미니멀리스트 텐서 처리 장치(TPU) 설계에 대한 자세한 내용을 설명합니다. TPU는 2x2 처리 요소 그리드를 갖추고 있으며, 곱셈 누적 연산, 바이어스 추가, Leaky ReLU 활성화 함수, MSE 손실 계산을 파이프라인으로 처리합니다. 94비트 명령어 세트는 처리 요소 그리드 전체에서 수평 및 수직 데이터 흐름을 제어하고, 전처리 및 가중치 행렬 전치를 지원합니다. 이 글에서는 명령어 세트, 하드웨어 아키텍처, 모듈 추가 및 테스트 실행 프로세스에 대해 자세히 설명하여 독자를 칩 가속기 설계 세계로 안내합니다.
하드웨어
하드웨어 가속기