KI schreibt Code, KI überprüft ihn? Ist das dumm?
Daksh, Mitbegründer von Greptile, stellte fest, dass ein KI-Codegenerierungswerkzeug namens Devin mehr Pull Requests einreichte als jeder menschliche Ingenieur. Dies wirft die interessante Frage auf: Sollte KI-generierter Code von KI selbst überprüft werden? Obwohl LLMs zustandslos sind, ist jeder Aufruf unabhängig. Das bedeutet aber nicht, dass KI ihren eigenen Code perfekt überprüft. KI-generierter Code steigert zwar die Effizienz, kann aber auch Fehler einführen, die für Menschen schwer zu finden sind. Studien zeigen, dass KI bei der Suche nach bestimmten Fehlertypen effektiver ist als Menschen, obwohl ihre Genauigkeit noch verbessert werden muss. Letztendlich argumentiert der Artikel, dass KI-Codeüberprüfung, obwohl nicht perfekt, effektiver ist als Menschen, um bestimmte Fehlertypen zu finden, die von der KI selbst eingeführt werden.
Mehr lesen