Webtagr - Technologienummer

Beliebte Tags：

Kosmos Virtualisierung DNS-Sicherheit formale Verifikation Erreichbarkeitsanalyse KI Compilerfehler Makrokonflikt Web-Erweiterung Entwicklungsframework Alle Tags

Über Prompt Engineering hinaus: Kontext-Engineering für leistungsstarke KI-Agenten

2025-07-01

Kontext-Engineering entwickelt sich zur nächsten Grenze im Bereich KI und geht über das einfache Prompt Engineering hinaus. Es konzentriert sich darauf, LLMs umfassende kontextuelle Informationen für eine effektive Problemlösung zu liefern. Der Artikel argumentiert, dass der Erfolg von KI-Agenten von der Qualität des Kontexts abhängt, nicht nur von den Fähigkeiten des Modells. Kontext-Engineering umfasst anfängliche Anweisungen, Benutzeraufforderungen, Kurzzeitgedächtnis, Langzeitgedächtnis, Abruf externer Informationen, verfügbare Tools und strukturierte Ausgabe. Ein erfolgreicher KI-Agent, z. B. einer, der Meetings anhand von E-Mails plant, benötigt integrierte Kalenderdaten, E-Mail-Verlauf und Kontaktinformationen, um menschenähnliche Antworten statt roboterhafte Antworten zu generieren. Der Artikel betont, dass Kontext-Engineering ein dynamisches System ist, das die richtigen Informationen und Tools zum richtigen Zeitpunkt liefert und sicherstellt, dass der LLM seine Aufgabe erfüllen kann – der Schlüssel zum Aufbau robuster und zuverlässiger KI-Agenten.

DeepSeek R1: Open-Source-Modell fordert OpenAI im komplexen Schließen heraus

2025-01-31

DeepSeek R1, ein Open-Source-Modell, stellt die Modelle von OpenAI bei komplexen Denkaufgaben in Frage. Mittels Group Relative Policy Optimization (GRPO) und einem auf Reinforcement Learning basierenden mehrstufigen Trainingsansatz veröffentlichten die Entwickler nicht nur das Modell, sondern auch eine Forschungsarbeit, die dessen Entwicklung detailliert beschreibt. Die Arbeit beschreibt einen "Aha-Moment" während des Trainings, bei dem das Modell lernte, mehr Denkzeit auf ein Problem aufzuwenden, indem es seinen anfänglichen Ansatz neu bewertete, ohne menschliches Feedback. Dieser Blogbeitrag rekonstruiert diesen "Aha-Moment" mithilfe von GRPO und dem Countdown-Spiel, indem ein offenes Modell trainiert wird, um Fähigkeiten zur Selbstverifizierung und Suche zu erlernen. Ein interaktiver Jupyter-Notebook-Code sowie Skripte und Anweisungen für das verteilte Training auf Multi-GPU-Knoten oder SLURM-Clustern werden bereitgestellt, um das Erlernen von GRPO und TRL zu erleichtern.