Transformer²: 자가 적응형 LLM의 혁신

2025-01-15
Transformer²: 자가 적응형 LLM의 혁신

Transformer²는 다양한 작업에 대해 가중치를 동적으로 조정하는 새로운 기계 학습 시스템입니다. 문어가 색깔을 바꾸거나 뇌가 손상 후 재배선되는 것과 같은 자연의 적응 메커니즘에서 영감을 얻어 대규모 언어 모델(LLM)이 실시간으로 새로운 작업에 적응할 수 있도록 합니다. 특이값 분해(SVD)와 강화 학습(RL)을 사용하여 Transformer²는 모델 가중치를 독립적인 구성 요소로 분해하고 수학, 코딩, 추론, 시각적 이해 등 다양한 작업에 대해 이러한 구성 요소를 최적으로 결합하는 방법을 학습합니다. 결과는 Transformer²가 LoRA와 같은 기존의 정적 접근 방식보다 효율성과 작업별 성능이 뛰어나며 훨씬 적은 매개변수로도 충분함을 보여줍니다. 이 연구는 지속적으로 학습하고 진화하는 "살아있는 지능"을 가진 AI 시스템을 구축하는 길을 열었습니다.

더 보기

기반 모델을 사용한 인공 생명 탐색 자동화

2024-12-24
기반 모델을 사용한 인공 생명 탐색 자동화

Sakana AI는 MIT 등과의 공동 연구를 통해 시각 언어 기반 모델을 사용하여 인공 생명의 발견을 자동화하는 알고리즘 ASAL을 개발했습니다. ASAL은 특정 목표 행동을 가진 시뮬레이션 발견, 지속적으로 참신성을 창출하는 시뮬레이션 발견, 그리고 가능한 모든 시뮬레이션을 밝히는 세 가지 탐색 문제를 해결합니다. Lenia, Boids, Particle Life 등 여러 시뮬레이션 환경에서 성공을 거두었으며, 기존 컨웨이의 생명 게임을 능가하는 개방성을 가진 새로운 인공 생명체와 셀 오토마타 규칙을 발견했습니다. 이 획기적인 성과는 수동 시뮬레이션 설계의 한계를 극복함으로써 인공 생명 연구를 활성화하고, 개방성과 자기 조직화 원칙을 통합한 미래 AI 개발에 새로운 통찰력을 제공합니다.

더 보기