Sesame AI Lança Modelo de Fala Conversacional de 1 Bilhão de Parâmetros

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Sesame AI Lança Modelo de Fala Conversacional de 1 Bilhão de Parâmetros

2025-03-18

Os Laboratórios Sesame AI lançaram o CSM (Conversational Speech Model), um modelo de geração de fala de 1 bilhão de parâmetros baseado na arquitetura Llama. O CSM gera códigos de áudio RVQ a partir de entradas de texto e áudio, e seu checkpoint está disponível no Hugging Face. Também são fornecidos uma demonstração interativa de voz e um espaço Hugging Face para testar a geração de áudio. Embora seja capaz de produzir vozes variadas, o CSM não foi ajustado para vozes específicas e tem suporte multilíngue limitado. A Sesame AI enfatiza seu uso apenas para fins de pesquisa e educacionais, proibindo a personificação, desinformação e atividades ilegais.

(github.com)

IA geração de fala

Ex-assistente da DOGE viola política do Tesouro ao vazar banco de dados não criptografado

Lista impressionante de multinímias: de tríades a sêxtuplos