
SeamlessM4T
SeamlessM4T是Meta推出的一款多语言和多任务模型,能够处理语音识别、文本翻译和语音合成等任务。它支持近100种语言,可以将语音转录为文本,再进行翻译,甚至可以将翻译后的文本转化为语音。
Google Vids是Google Workspace中最新推出的一款AI视频制作工具,专为简化和加强视频创建和编辑流程而设计。它能够根据用户描述生成初步故事板,利用AI技术编辑视频内容,选择适合的场景、图片和音乐,自动生成视频初稿,提供预录制的旁白功能,以及支持文本到语音的转换等。