Lösung eines Bildklassifizierungsproblems mit 350 Bildern mithilfe von GPT-4
Ein kleines KI-Unternehmen hat sich einer herausfordernden Aufgabe der Bilderkennung gestellt: die Identifizierung von 350 sehr ähnlichen Autoillustrationen. Traditionelle Computer-Vision- und Augmented-Reality-Ansätze scheiterten. Das Team versuchte MobileNet-Transferlernen und Datenaugmentation, aber die Ergebnisse waren inkonsistent. Schließlich kombinierten sie intelligent eine KNN-basierte Bild-Embedding-Suche mit GPT-4 und reichten Kandidatenbilder an GPT-4 zur endgültigen Übereinstimmung ein. Obwohl nicht perfekt, verbesserte diese Lösung die Genauigkeit erheblich und wurde erfolgreich in einer Museums-App eingesetzt, was sogar die Hauptproduktlinie des Unternehmens verbesserte. Dies zeigt, wie große Sprachmodelle zunehmend vielseitige Werkzeuge in der Produktentwicklung werden und den Prozess der KI-Anwendung vereinfachen.