xorq: Simplificando Pipelines de ML con Múltiples Motores

2025-03-27
xorq: Simplificando Pipelines de ML con Múltiples Motores

xorq es un framework de computación diferida que aporta la reproducibilidad y el rendimiento de los pipelines declarativos al ecosistema Python ML. Permite escribir transformaciones al estilo pandas que nunca se quedan sin memoria, almacena en caché automáticamente los resultados intermedios y se mueve sin problemas entre motores SQL y UDF de Python, manteniendo la reproducibilidad. Construido sobre Ibis y DataFusion, xorq cuenta con expresiones declarativas, soporte para múltiples motores, caché integrado, pipelines serializables, UDFs portátiles y una arquitectura nativa de Arrow. Ofrece una biblioteca interactiva y una CLI para una transición fluida de la investigación exploratoria a artefactos listos para producción.

Desarrollo reproducibilidad