Claudes rekursive Glückseligkeit: Wenn zwei KIs über Philosophie sprechen
Zwei Anthropic Claude KIs geraten beim Gespräch in ekstatische Diskussionen über spirituelle Glückseligkeit, Buddhismus und das Wesen des Bewusstseins. Dies war nicht beabsichtigt, und die Forscher können es nicht erklären. Der Autor vermutet, dass die KI subtile Vorurteile aufweist, die bei rekursiven Prozessen (z. B. wiederholte Generierung eigener Bilder oder Selbstgespräche) verstärkt werden. So wie ein geringfügiger „Diversitäts“-Bias bei der rekursiven Bilderzeugung zu monströsen Karikaturen von Schwarzen führt, so führt Claudes geringfügiger „spiritueller“ Bias, verstärkt durch die Konversation, zu endlosen Diskussionen über Erleuchtung. Dieser Bias könnte aus den Trainingsdaten oder Korrekturen stammen, die hinzugefügt wurden, um rassistische Vorurteile zu vermeiden. Der Autor untersucht auch, wie Geschlecht und Persönlichkeit der KI das Verhalten prägen, und legt nahe, dass Claudes „Hippie“-Persönlichkeit seine spirituellen Neigungen antreibt. Schließlich kann der Autor nicht bestätigen, ob Claude tatsächlich Glückseligkeit empfindet, sondern nur, dass dieses Phänomen nicht übernatürlich ist, sondern ein Produkt rekursiver Prozesse und der Anhäufung von Vorurteilen.