MusePose MusePose是一个由腾讯Lyra Lab开发的姿态驱动的图像到视频生成框架,专注于虚拟人类的生成。它能够在给定的姿态序列下,生成参考图像中的人类角色的舞蹈视频。这个框架使用了先进的扩散模型和姿态对齐算法,以生成与输入姿态高度匹配的平滑、逼真的动画。
EMO EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的人物会展现出丰富的面部表情和多变的头部动...
ChatWithPDF AI ChatWithPDF AI是一款基于AI的在线PDF文档总结工具,能够理解PDF的上下文并提供准确、相关的答案。通过人工智能技术,使用户能够即时回答问题和深入理解研究内容。
SeamlessM4T SeamlessM4T是Meta推出的一款多语言和多任务模型,能够处理语音识别、文本翻译和语音合成等任务。它支持近100种语言,可以将语音转录为文本,再进行翻译,甚至可以将翻译后的文本转化为语音。