可以听到图像的声音：一种特殊频谱图，可以被视为图像并作为声音播放

可以听到图像的声音：一种特殊频谱图，可以被视为图像并作为声音播放 (github.com)

原文: GitHub - IFICL/images-that-sound: Official repo for Images that sound: a special spectrogram that can be seen as images and played as sound generated by diffusions

这篇论文介绍了一种名为“可以听到图像的声音”的新技术，它是一种特殊的频谱图，可以被视为图像并作为声音播放。该技术利用预训练的图像潜在扩散模型 Stable Diffusion v1.5 和预训练的音频潜在扩散模型 Auffusion，并提供三种方法来生成图像：多模态去噪、印记和 SDS。

38

声音合成

上一篇: 无人机飞行101-面向初学者的互动教程

下一篇: 禁止支付赎金的呼声越来越高

评论已经关闭！

返回首页