llama.cpp WASM: 2x schnellere Geschwindigkeit durch optimiertes SIMD

2025-01-28

Simon Willisons Blogbeitrag hebt eine signifikante Verbesserung von llama.cpp hervor: eine Verdoppelung der Geschwindigkeit für die WASM-Version durch Optimierung von SIMD-Instruktionen. Überraschenderweise wurden 99% des Codes vom KI-gestützten Programmierwerkzeug DeepSeek R1 generiert. DeepSeek R1 verbrachte 3-5 Minuten mit dem „Nachdenken“ über jede Eingabeaufforderung und half dem Entwickler letztendlich, das llm_groq.py-Plugin zu verbessern und das model_map elegant zu entfernen, wodurch der Code vereinfacht wurde. Dies zeigt das immense Potenzial von KI bei der Codeoptimierung und -refactorisierung.