Sapiens:人类视觉模型的基础
2024-08-28
Sapiens是一系列用于人类视觉任务的模型,包括二维姿态估计、身体部位分割、深度估计和表面法线预测。这些模型在超过3亿张人类图像上进行了预训练,只需微调即可轻松适应不同的任务。Sapiens在各种人类视觉基准测试中始终优于现有模型,并在Humans-5K(姿态)、Humans-2K(部位分割)、Hi4D(深度)和THuman2(法线)等方面取得了显著的性能提升。
52
未分类
姿态估计