LLM Contemplatifs : Une Expérience Virale d'Ingénierie de Prompts
L'expérience de Maharshi sur X (anciennement Twitter) est devenue virale : un prompt conçu pour amener les LLM comme Claude et GPT-4 à 'contempler' avant de répondre. Inspiré par le modèle o1 d'OpenAI, qui utilise l'apprentissage par renforcement et le 'calcul au moment du test' pour un raisonnement amélioré, le prompt encourage les LLM à explorer de multiples possibilités, à remettre en question les hypothèses et à imiter les processus de pensée humaine. Il met l'accent sur l'exploration plutôt que sur les conclusions immédiates, le raisonnement approfondi, la démonstration du processus de pensée et la persévérance. Bien qu'efficace pour les tâches complexes, l'auteur met en garde contre les possibles hallucinations. La structure du prompt utilise des balises XML pour séparer la phase de contemplation et la réponse finale, guidant le LLM avec des phrases spécifiques pour améliorer la clarté et la précision.