
Audio Muse
Audio Muse是一个由AI驱动的在线音频工具平台,提供多功能音频处理和AI音乐生成服务。用户可以轻松选择不同音乐风格,快速创作专属音频内容。平台包括AI音乐生成器、音频增强器及强大的音频编辑器,支持音频格式转换和音轨编辑。此外,Audio Muse 具备歌曲关键信息和BPM查找器,有助于用户更好地理解音乐属性。平台的噪声降低功能确保...
AutoStudio 是由中山大学深圳校区和联想研究院开发的先进的多轮交互图像生成AI工具。通过结合大型语言模型和稳定扩散技术,AutoStudio 能够在用户多次交互中生成一致且高质量的图像序列。无论是漫画创作、角色设计还是广告营销,AutoStudio 都能保持图像风格和主题的一致性,极大地提升了创作效率和效果。
它是一个无需训练的多智能体框架,采用了基于大型语言模型(LLMs)的三个智能体来处理交互,同时结合了基于稳定扩散(SD)的智能体来生成高质量图像。
具体来说,AutoStudio 由以下部分组成:
此外,AutoStudio 还引入了 Parallel-UNet 来取代绘制器中的原始 UNet,它采用了两个并行的交叉注意力模块来利用主题感知特征。同时,还引入了主题初始化生成方法,以更好地保留小主题。