Utilización de GPU cercana al 100% para incrustar millones de documentos con Daft

2025-08-17
Utilización de GPU cercana al 100% para incrustar millones de documentos con Daft

El equipo de Daft logró una utilización de GPU cercana al 100% al incrustar millones de documentos de texto utilizando el modelo Qwen3-Embedding-0.6B. Esta publicación de blog detalla una canalización de procesamiento de datos de tres pasos: división de texto, generación de incrustaciones y procesamiento distribuido, proporcionando ejemplos de código. Posteriormente, mejoraron el rendimiento en 3x sin depender de la utilización máxima de la GPU.