Transformer²: LLMs autoadaptáveis inovam

2025-01-15
Transformer²: LLMs autoadaptáveis inovam

O Transformer² é um novo sistema de aprendizado de máquina que ajusta dinamicamente seus pesos para várias tarefas. Inspirado nos mecanismos adaptativos da natureza, como um polvo mudando de cor ou o cérebro se reconectando, ele permite que modelos de linguagem grandes (LLMs) se adaptem a novas tarefas em tempo real. Usando Decomposição de Valor Singular (SVD) e Aprendizado por Reforço (RL), o Transformer² decompõe os pesos do modelo em componentes independentes e aprende como combiná-los de forma otimizada para diversas tarefas, incluindo matemática, codificação, raciocínio e compreensão visual. Os resultados mostram que o Transformer² supera abordagens estáticas tradicionais como LoRA em eficiência e desempenho específico da tarefa, exigindo muito menos parâmetros. Este trabalho prepara o caminho para a construção de sistemas de IA de "inteligência viva" que aprendem e evoluem continuamente.

Leia mais
IA

Automação da Busca por Vida Artificial com Modelos Fundamentais

2024-12-24
Automação da Busca por Vida Artificial com Modelos Fundamentais

A Sakana AI, em colaboração com o MIT e outras instituições, desenvolveu o ASAL, um algoritmo que utiliza modelos de linguagem e visão para automatizar a descoberta de vida artificial. O ASAL aborda três problemas de busca: encontrar simulações com comportamentos específicos, descobrir simulações que geram novidades contínuas e iluminar todas as simulações possíveis. Aplicado com sucesso em Lenia, Boids, Particle Life e outros, o ASAL descobriu novas formas de vida artificial e regras de autômatos celulares que superam o Jogo da Vida de Conway em termos de abertura. Essa descoberta promete revitalizar a pesquisa em Vida Artificial, superando as limitações do design manual de simulações e oferecendo insights para o desenvolvimento futuro de IA, incorporando princípios de abertura e auto-organização.

Leia mais