Visualizando el proceso de pensamiento de un gran modelo de lenguaje (R1)
2025-02-17
Los investigadores visualizaron el 'proceso de pensamiento' de un gran modelo de lenguaje, R1, guardando sus cadenas de pensamiento como texto, convirtiéndolas en incrustaciones utilizando la API de OpenAI y representándolas gráficamente de forma secuencial con t-SNE. Al calcular la similitud del coseno entre pasos consecutivos, observaron un posible proceso de tres etapas: 'búsqueda', 'pensamiento' y 'conclusión'. Se utilizaron diez indicaciones diversas, que iban desde describir cómo funciona una bicicleta hasta diseñar nuevos medios de transporte. Los investigadores proporcionan métodos para acceder a los datos de la cadena de pensamiento y al código.