MiniMax-M1: 4560억 파라미터의 하이브리드 어텐션 추론 모델
2025-06-18
MiniMax-M1은 4560억 개의 파라미터를 가진 오픈 가중치의 대규모 하이브리드 어텐션 추론 모델입니다. 혼합 전문가(MoE) 아키텍처와 고속 어텐션 메커니즘을 결합하여 100만 토큰의 컨텍스트 길이를 기본적으로 지원합니다. 대규모 강화 학습으로 훈련되었으며, 수학적 추론, 소프트웨어 엔지니어링 등의 복잡한 작업에서 DeepSeek R1 및 Qwen3-235B와 같은 다른 강력한 모델을 능가합니다. 테스트 시간 계산 효율성이 높아 차세대 언어 모델 에이전트의 강력한 기반이 됩니다.
AI
하이브리드 어텐션