Databricks의 TAO: 레이블 없는 데이터로 파인튜닝 능가

2025-03-26
Databricks의 TAO: 레이블 없는 데이터로 파인튜닝 능가

Databricks는 레이블 없는 사용 데이터만 필요로 하는 새로운 모델 튜닝 방법인 TAO(Test-time Adaptive Optimization)를 발표했습니다. 기존 파인튜닝과 달리 TAO는 테스트 시간 연산과 강화 학습을 활용하여 과거 입력 예시를 기반으로 모델 성능을 향상시킵니다. 놀랍게도 TAO는 기존 파인튜닝을 능가하여 Llama와 같은 오픈소스 모델을 GPT-4와 같은 고가의 독점 모델과 비슷한 수준의 품질로 끌어올립니다. 이 획기적인 기술은 Databricks 고객을 위해 미리 보기 버전으로 제공되며 향후 제품에도 적용될 예정입니다.