Visualizando el proceso de pensamiento de un gran modelo de lenguaje (R1)

2025-02-17
Visualizando el proceso de pensamiento de un gran modelo de lenguaje (R1)

Los investigadores visualizaron el 'proceso de pensamiento' de un gran modelo de lenguaje, R1, guardando sus cadenas de pensamiento como texto, convirtiéndolas en incrustaciones utilizando la API de OpenAI y representándolas gráficamente de forma secuencial con t-SNE. Al calcular la similitud del coseno entre pasos consecutivos, observaron un posible proceso de tres etapas: 'búsqueda', 'pensamiento' y 'conclusión'. Se utilizaron diez indicaciones diversas, que iban desde describir cómo funciona una bicicleta hasta diseñar nuevos medios de transporte. Los investigadores proporcionan métodos para acceder a los datos de la cadena de pensamiento y al código.