Fish Speech Fish Speech 是一个开源的文本转语音(TTS)解决方案,基于 VQ-GAN、Llama 和 VITS 技术开发。它提供多语言支持,包括中文、日语和英语,能够生成高质量的语音合成。这个工具特别适合游戏配音等场景,允许用户自定义和训练专属的语音模型。
WaifuXL 一款专注于动漫风格图像和GIF的AI图像放大工具。它使用最新的超分辨率模型(如 Real-ESRGAN),能够将图像和 GIF 的分辨率提高多达16倍,同时优化细节和色彩,显著减少像素化现象。
Idea-2-3D Idea-2-3D 是一个3D 内容生成框架,能够从多模态输入(如文本、图像和 3D 模型)中生成高质量的 3D 模型。该框架由三个基于大型多模态模型(LMM)的智能代理组成,分别负责生成提示、选择模型和反馈反映。通过这些代理的协作和批评循环,Idea-2-3D 能够自动生成与输入高度一致的 3D 模型。
WUI.AI WUI.AI是一款人工智能视频编辑工具,专为视频创作者、播客制作者和社交媒体营销人员设计。该平台通过强大的 AI 技术,将长格式视频转化为适合 TikTok、Instagram、YouTube Shorts 等平台的短视频,帮助用户快速、高效地创作引人注目的内容。
Eggnog AI Eggnog AI 是一个专注于创建具有一致角色的AI视频平台。它被称为“AI生成内容的YouTube”,通过简单的拖放操作,允许用户创建、观看和重混具有独特面孔和服装的角色视频,并与全球创作者社区分享和重混内容。这种技术的应用不仅提高了视频制作的效率,也降低了进入视频制作领域的门槛,使得更多非专业人士能够轻松创作视频内容。