OpenAI gibt zu: Selbst die fortschrittlichsten KI-Modelle können menschliche Programmierer nicht ersetzen

2025-02-24
OpenAI gibt zu: Selbst die fortschrittlichsten KI-Modelle können menschliche Programmierer nicht ersetzen

Ein neuer Bericht von OpenAI zeigt, dass selbst die fortschrittlichsten Large Language Models (LLMs), wie GPT-4 und Claude 3.5, die Mehrheit der Software-Engineering-Aufgaben nicht bewältigen können. Die Forscher nutzten einen neuen Benchmark, SWE-Lancer, mit über 1400 Software-Engineering-Aufgaben von Upwork. Die Ergebnisse zeigten, dass diese Modelle nur oberflächliche Probleme lösen konnten und keine Bugs oder deren Ursachen in größeren Projekten finden konnten. Obwohl LLMs schnell sind, reichen ihre Genauigkeit und Zuverlässigkeit nicht aus, um menschliche Programmierer zu ersetzen, was den Vorhersagen von OpenAI-CEO Sam Altman widerspricht.

Entwicklung