TAO de Databricks: Superando el ajuste fino con datos no etiquetados

2025-03-26
TAO de Databricks: Superando el ajuste fino con datos no etiquetados

Databricks presenta TAO (Test-time Adaptive Optimization), un nuevo método de ajuste fino de modelos que solo requiere datos de uso no etiquetados. A diferencia del ajuste fino tradicional, TAO utiliza el cómputo en tiempo de prueba y el aprendizaje por refuerzo para mejorar el rendimiento del modelo basándose en ejemplos de entrada anteriores. Sorprendentemente, TAO supera el ajuste fino tradicional, llevando modelos de código abierto como Llama a una calidad comparable a la de modelos propietarios costosos como GPT-4. Esta innovación está disponible en versión preliminar para los clientes de Databricks e impulsará futuros productos.

IA