DatabricksのTAO：ラベルなしデータでファインチューニングを凌駕

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

2025-03-26

Databricksは、ラベルなしの利用データのみを必要とする新しいモデルチューニング手法、TAO（Test-time Adaptive Optimization）を発表しました。従来のファインチューニングとは異なり、TAOはテスト時計算と強化学習を活用して、過去の入力例に基づいてモデルのパフォーマンスを向上させます。驚くべきことに、TAOは従来のファインチューニングを上回り、Llamaなどのオープンソースモデルを、GPT-4などの高価な独自モデルと同等の品質にまで高めます。この画期的な技術は、Databricksのお客様向けにプレビュー版として提供され、今後の製品にも搭載される予定です。