ART: Maximale LLM-Performance mit minimalen Codeänderungen durch RL

2025-04-30
ART: Maximale LLM-Performance mit minimalen Codeänderungen durch RL

Agent Reinforcement Trainer (ART) ist eine Open-Source-Bibliothek für Reinforcement Learning, die entwickelt wurde, um die Leistung von Large Language Models (LLMs) in Agenten-Workflows zu verbessern. ART nutzt den leistungsstarken GRPO-Algorithmus, um Modelle aus ihren eigenen Erfahrungen zu trainieren. Im Gegensatz zu den meisten RL-Bibliotheken lässt sich ART nahtlos in bestehende Codebasen integrieren und entlädt die Komplexität der RL-Trainingsschleife auf sein Backend. ART besteht aus einem Client (zur Interaktion mit Ihrem Code) und einem Server (zur Steuerung von Inferenz und Training). Die Trainingsschleife umfasst Inferenz (Datenerfassung und Zuweisung von Belohnungen) und Training (Verwendung von GRPO zum Trainieren des Modells und Aktualisieren von LoRAs). ART unterstützt die meisten mit vLLM/HuggingFace Transformers kompatiblen kausalen Sprachmodelle. Derzeit befindet sich ART in der Alpha-Phase und freut sich über Beiträge.

Entwicklung