Playground AI Playground AI是一个免费AI绘画和编辑平台,支持在线使用Stable Diffusion和DALL·E2模型,包括文生图、图生图、二次编辑、超像素等各种功能。免费用户单日可以创作1000张图像!
Speakatoo Speakatoo 是一个逼真的AI语音生成器,可以将书面文本转换为自然的语音。用户可以输入文本,选择多种语音选项,并下载生成的音频文件(mp3 或 wav 格式)。支持超过 130 种语言和 850 多种独特的语音。
BuboGPT BuboGPT是字节跳动推出的一种先进的大型语言模型(LLM),它具有将文本、图像和音频等多模态输入进行整合的能力,并且具备将回复与视觉对象进行对接的独特功能,可以执行跨模态交互并做到对多模态的细粒度理解。这显示出BuboGPT在对齐或未对齐的任意图像音频数据理解方面有着出色的对话能力。
V-Express V-Express是由南京大学和腾讯AI实验室共同开发的一项技术,旨在通过参考图像、音频和一系列V-Kps图像来生成说话的头像视频。这项技术可以根据不同的信号,如声音、姿势、图像参考等来控制视频内容,确保即使是弱信号也能有效地影响最终生成的视频,使视频生成更加逼真和多样化。
Loopy AI Loopy是一个端到端音频驱动的视频生成模型,专注于生成逼真的头像动画。利用先进的 AI 技术和时间模块设计,Loopy 能够从音频中提取自然的运动模式,并生成高质量的动画效果。支持多种视觉和音频风格,适用于虚拟主播、动画制作等应用场景。
Fish Audio Fish Audio 是领先的文本转语音 (TTS) 技术平台,开发了基于 VQ-GAN、Llama 和 VITS 的开源模型 Fish Speech。该模型经过大量数据训练,能够生成高质量、自然流畅的语音,支持中文、日语和英语。Fish Audio 致力于为用户提供逼真的语音合成解决方案,广泛应用于内容创作、教育、娱乐等领域。