H-Nets: Uma Arquitetura de Rede Hierárquica que Supera os Transformadores

2025-07-16
H-Nets: Uma Arquitetura de Rede Hierárquica que Supera os Transformadores

As arquiteturas de IA atuais tratam todas as entradas igualmente, sem aproveitar a natureza hierárquica inerente da informação. Isso limita sua capacidade de aprender com dados brutos de alta resolução. Os pesquisadores apresentam H-Nets, uma nova arquitetura que modela nativamente a hierarquia diretamente dos dados brutos. O núcleo do H-Nets é um mecanismo de divisão dinâmica que segmenta e comprime dados brutos em conceitos significativos. Experimentos mostram que as H-Nets superam os Transformadores de última geração em modelagem de linguagem, exibindo escalabilidade e robustez aprimoradas, oferecendo um caminho promissor para a compreensão multimodal, raciocínio de longo contexto e treinamento e inferência eficientes.

Leia mais