llama.cpp em GPUs Intel com IPEX-LLM: Velocidade Aprimorada
2025-03-06
Este guia demonstra como executar o llama.cpp diretamente em GPUs Intel usando o pacote zip portátil e o IPEX-LLM, eliminando a necessidade de instalações manuais. Foi verificado em processadores Intel Core Ultra, processadores Core de 11ª a 14ª geração e GPUs Intel Arc A/B-Series. O guia detalha o download, extração, configuração de variáveis de ambiente e exemplos de execução, oferecendo instruções personalizadas para configurações de várias GPUs e diferentes sistemas operacionais (Windows e Linux). Isso permite a execução suave de modelos de linguagem grandes em hardware Intel.
Desenvolvimento
GPU Intel