llama.cpp a toda velocidad en GPUs Intel con IPEX-LLM

2025-03-06
llama.cpp a toda velocidad en GPUs Intel con IPEX-LLM

Esta guía muestra cómo ejecutar llama.cpp directamente en GPUs Intel utilizando el paquete zip portátil e IPEX-LLM, eliminando la necesidad de instalaciones manuales. Se ha verificado en procesadores Intel Core Ultra, procesadores Core de 11ª a 14ª generación y GPUs Intel Arc A/B-Series. La guía detalla la descarga, extracción, configuración de variables de entorno y ejemplos de ejecución, ofreciendo instrucciones personalizadas para configuraciones multi-GPU y diferentes sistemas operativos (Windows y Linux). Esto permite una ejecución fluida de modelos de lenguaje grandes en hardware Intel.

Desarrollo