Visualizando el proceso de pensamiento de un gran modelo de lenguaje (R1)

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Visualizando el proceso de pensamiento de un gran modelo de lenguaje (R1)

2025-02-17

Los investigadores visualizaron el 'proceso de pensamiento' de un gran modelo de lenguaje, R1, guardando sus cadenas de pensamiento como texto, convirtiéndolas en incrustaciones utilizando la API de OpenAI y representándolas gráficamente de forma secuencial con t-SNE. Al calcular la similitud del coseno entre pasos consecutivos, observaron un posible proceso de tres etapas: 'búsqueda', 'pensamiento' y 'conclusión'. Se utilizaron diez indicaciones diversas, que iban desde describir cómo funciona una bicicleta hasta diseñar nuevos medios de transporte. Los investigadores proporcionan métodos para acceder a los datos de la cadena de pensamiento y al código.

(github.com)

IA Gran Modelo de Lenguaje Visualización del Pensamiento

Moderadores de Reddit luchan contra el spam de IA generativa: una guerra que consume tiempo

¡iPhone SE 3 dentro de un Nokia Lumia 1020!