新Idea-2-3D Idea-2-3D 是一个3D 内容生成框架,能够从多模态输入(如文本、图像和 3D 模型)中生成高质量的 3D 模型。该框架由三个基于大型多模态模型(LMM)的智能代理组成,分别负责生成提示、选择模型和反馈反映。通过这些代理的协作和批评循环,Idea-2-3D 能够自动生成与输入高度一致的 3D 模型。
新Imagen 3 Imagen 3是Google DeepMind开发的最新文生图大模型。它能够根据文本提示生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。这个模型支持多种视觉风格,从照片般逼真到油画质感,甚至黏土动画场景。Imagen 3还改进了对自然语言提示的理解,简化了生成所需图像的过程,并采用了最新的安全和责任技术,包括隐私保护和内容安...
新Google Gemini Google Gemini是由谷歌推出的一款人工智能多模态大模型,于2023年12月6日发布。这个模型具有强大的功能,能够同时识别文本、图像、音频、视频和代码五种类型的信息。它还能理解并生成主流编程语言的高质量代码,如Python、Java、C++,并且进行了全面的安全性评估。
新Amuse AI Amuse AI 是由 AMD 和 Tensor Stack 合作开发的 AI 图像生成工具。它专为 AMD 硬件优化,支持在 Windows PC 上生成高质量图像。利用 Stable Diffusion 模型,Amuse AI 能够从文本描述生成高质量图像,并通过草图转图像功能将用户的草图和文本提示转化为图像。
新Kapwing Kapwing是一个在线视频编辑和内容创作平台,提供直观的时间轴工具、AI 助手、团队协作、模板和多平台适配功能。用户可以轻松剪辑、合成视频,添加字幕和音频处理,适用于 YouTube、TikTok、Instagram 等多种社交媒体平台,是内容创作者和团队协作的理想选择。
新Audio Muse Audio Muse是一个由AI驱动的在线音频工具平台,提供多功能音频处理和AI音乐生成服务。用户可以轻松选择不同音乐风格,快速创作专属音频内容。平台包括AI音乐生成器、音频增强器及强大的音频编辑器,支持音频格式转换和音轨编辑。此外,Audio Muse 具备歌曲关键信息和BPM查找器,有助于用户更好地理解音乐属性。平台的噪声降低功能确保...
新Linly-Dubbing Linly-Dubbing 是一个开源的智能视频多语言AI配音和翻译工具,它融合了YouDub-webui的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成Linly-Talker的数字人对口型技术,为用户带来更加自然的多语言视频体验。