DatabricksのTAO:ラベルなしデータでファインチューニングを凌駕

2025-03-26
DatabricksのTAO:ラベルなしデータでファインチューニングを凌駕

Databricksは、ラベルなしの利用データのみを必要とする新しいモデルチューニング手法、TAO(Test-time Adaptive Optimization)を発表しました。従来のファインチューニングとは異なり、TAOはテスト時計算と強化学習を活用して、過去の入力例に基づいてモデルのパフォーマンスを向上させます。驚くべきことに、TAOは従来のファインチューニングを上回り、Llamaなどのオープンソースモデルを、GPT-4などの高価な独自モデルと同等の品質にまで高めます。この画期的な技術は、Databricksのお客様向けにプレビュー版として提供され、今後の製品にも搭載される予定です。