Meta FAIR 公开了六项新的研究成果,包括图像到文本和文本到音乐生成模型、多标记预测模型以及检测AI生成语音的技术。其中,Meta Chameleon模型可以结合文本和图像作为输入和输出,Multi-Token Prediction模型通过预测多个未来单词来提高效率,JASCO模型可以接受和弦或节拍等输入来生成音乐,AudioSeal技术可以检测AI生成的语音。此外,Meta还发布了PRISM数据集,用于评估LLM的社会人口统计学和偏好,并分享了在衡量和改进文本到图像生成系统地理差异方面的研究成果。