AAIELA:基于人工智能的语音图像编辑工具

2024-07-01

该项目介绍了一款名为AAIELA的AI图像编辑工具,用户可以通过语音指令修改图像。它结合了目标检测、语音转文本、大型语言模型和文本到图像修复等开源AI模型,实现了将语音指令转换为图像编辑操作的功能。项目还列举了未来研究方向,如语义理解、多目标掩码生成、视觉语言模型集成等,以及计划实现的功能,如集成ControlNet、Mediapipe Face Mesh、超分辨率模型、交互式掩码编辑等。

36
未分类