Webtagr - Technologienummer

KI schreibt Code, KI überprüft ihn? Ist das dumm?

2025-05-01

Daksh, Mitbegründer von Greptile, stellte fest, dass ein KI-Codegenerierungswerkzeug namens Devin mehr Pull Requests einreichte als jeder menschliche Ingenieur. Dies wirft die interessante Frage auf: Sollte KI-generierter Code von KI selbst überprüft werden? Obwohl LLMs zustandslos sind, ist jeder Aufruf unabhängig. Das bedeutet aber nicht, dass KI ihren eigenen Code perfekt überprüft. KI-generierter Code steigert zwar die Effizienz, kann aber auch Fehler einführen, die für Menschen schwer zu finden sind. Studien zeigen, dass KI bei der Suche nach bestimmten Fehlertypen effektiver ist als Menschen, obwohl ihre Genauigkeit noch verbessert werden muss. Letztendlich argumentiert der Artikel, dass KI-Codeüberprüfung, obwohl nicht perfekt, effektiver ist als Menschen, um bestimmte Fehlertypen zu finden, die von der KI selbst eingeführt werden.

(www.greptile.com)

Entwicklung KI-Codeüberprüfung

Lustige Memes mit LLMs generieren: Überraschend schwierig

2025-01-06

Ein Praktikant der University of Waterloo versuchte, eine App mit LLMs und der Greptile API zu bauen, um Memes zu generieren, die GitHub-Repositories „rösten“. Der Prozess erwies sich als überraschend schwierig. Das direkte Auffordern des LLMs zu Witzen führte zu generischen Ergebnissen. Die Lösung bestand darin, die Aufgabe in Codeanalyse (mit Greptile zur Identifizierung spezifischer Probleme) und Witzgenerierung (mit dem LLM zur Erstellung gezielten Humors) zu trennen. Die Bilderzeugung erwies sich aufgrund von Einschränkungen bei der Textverarbeitung als schwierig, was zur Verwendung von vorgefertigten Meme-Vorlagen und node-canvas für die Texteingabe führte. Trotz der Hindernisse mündete das Projekt in reporoast.com, einer Website, die benutzerdefinierte Code-„Rösterei“-Memes generieren kann.

(www.greptile.com)

Entwicklung Meme-Generierung

Wie ein KI-Code-Review-Bot das Schweigen lernte

2024-12-21

Der KI-Code-Review-Bot von Greptile wurde zunächst dafür kritisiert, zu viele Kommentare zu generieren. Um dies zu beheben, experimentierten sie mit Prompt Engineering und ließen den LLM seine eigenen Kommentare bewerten, aber diese Methoden erwiesen sich als ineffektiv. Ihr Durchbruch kam von der Vektorisierung früherer Kommentare, ihrer Gruppierung in einer Vektor-Datenbank und der Filterung neuer Kommentare, die denen ähnelten, die zuvor abgelehnt wurden. Dieser Ansatz steigerte die Bearbeitungsrate der Entwickler von 19 % auf über 55 % und reduzierte den LLM-Rauschen erheblich.

(www.greptile.com)

Entwicklung Code-Review