Framework d'apprentissage par renforcement haute performance pour robots humanoïdes
Un framework d'apprentissage par renforcement haute performance optimisé pour entraîner la locomotion, la manipulation et le déploiement en monde réel de robots humanoïdes est à l'horizon. Doté d'une grande polyvalence, il s'attaque à des tâches allant de la marche et de la danse aux tâches ménagères et même à la cuisine. Le prochain K-VLA, tirant parti de données robotiques à grande échelle et d'une nouvelle architecture de réseau, promet le robot le plus capable et le plus habile à ce jour. Il est exécutable localement et s'intègre à d'autres VLA comme Pi0.5 et Gr00t.
Lire plus