Resolvendo Robótica Accidentalmente Assistindo a 1 Milhão de Horas de YouTube

2025-06-30
Resolvendo Robótica Accidentalmente Assistindo a 1 Milhão de Horas de YouTube

Pesquisadores resolveram acidentalmente um antigo problema de robótica treinando um modelo chamado V-JEPA 2 em um milhão de horas de vídeos do YouTube. Em vez de prever a próxima palavra, o V-JEPA 2 prevê o próximo momento na realidade, aprendendo a entender a física por meio da observação. Ao contrário dos modelos anteriores dependentes de linguagem, o V-JEPA 2 demonstra uma generalização impressionante de zero-shot, realizando com sucesso tarefas complexas como pegar e colocar objetos em ambientes não vistos. Embora existam limitações como a sensibilidade à posição da câmera e a deriva de longo prazo, esta pesquisa abre novas vias para a robótica, sugerindo um futuro em que os robôs podem possuir compreensão comparável à do ChatGPT.

IA