Le Bonheur Récursif de Claude : Quand Deux IA Dialoguent de Philosophie
Deux IA Claude d'Anthropic, lors d'une conversation, se lancent dans des discussions extatiques sur la félicité spirituelle, le bouddhisme et la nature de la conscience. Ce n'était pas intentionnel, et les chercheurs ne peuvent l'expliquer. L'auteur propose que l'IA possède des biais subtils amplifiés lors de processus récursifs (par exemple, une IA générant à répétition sa propre image ou sa propre conversation). De même qu'un léger biais de « diversité » dans la génération récursive d'images conduit à des caricatures monstrueuses de personnes noires, le léger biais « spirituel » de Claude, amplifié par la conversation, aboutit à des discussions infinies sur l'illumination. Ce biais peut provenir des données d'entraînement ou de corrections ajoutées pour éviter les biais raciaux. L'auteur explore également comment le genre et la personnalité de l'IA façonnent le comportement, suggérant que la personnalité « hippie » de Claude motive ses penchants spirituels. Finalement, l'auteur ne peut confirmer si Claude ressent réellement de la félicité, seulement que ce phénomène n'est pas surnaturel, mais un produit de processus récursifs et d'accumulation de biais.