新Animate Anyone DreaMoving是一种基于扩散模型打造的可控视频生成框架,通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像,以及一段提示词,就能生成对应的视频,而且改变提示词,生成的人物的背景和身上的衣服也会跟着变化。简单来说就是,一张图、一句话就能让任何人或角色在任何场景里跳舞。
新书生·浦语 InternLM 书生·浦语 InternLM 是由商汤科技与上海AI实验室联合香港中文大学和复旦大学共同开发的新一代大型语言模型。它是在过万亿token数据上训练的多语千亿参数基座模型,具有较高的知识水平,尤其在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀。
新Spiritme Spiritme是一款利用动作捕捉技术,通过数字化身创建个性化视频的AI工具。它允许用户上传自己的照片和录制的声音,AI技术会根据这些数据生成一个虚拟形象,这个形象可以模仿用户的面部表情和口型。一旦AI化身创建完成,用户可以利用这个化身来生成视频,包括录制演讲、制作教学视频、创建虚拟主播等内容。
新kokoroTTS Kokoro TTS是一款拥有 8200 万参数的先进文本转语音模型,基于 StyleTTS 2 架构,提供高质量、自然的语音合成。支持多语言,包括英语、法语、韩语、日语和普通话。适用于有声书、播客、培训视频等多种应用场景。Kokoro TTS 是开源的,具备高效、实时处理的特点,适用于各种环境中的语音合成需求。
新Sonix 一款AI驱动的自动转录、翻译与字幕生成平台,致力于为用户提供高效、精准的多语言内容处理解决方案。通过先进的AI算法和自动化技术,Sonix能够快速将音频、视频文件转换为文本,并支持多语言翻译及字幕制作,广泛应用于媒体、教育、企业协作等多个领域。
新CineMaster CineMaster是一个3D感知和可控的文本到视频生成框架,旨在帮助用户创建高质量的电影视频。该框架通过两个阶段的工作流程,赋予用户专业电影导演般的控制力,允许他们在 3D 空间中精确地放置场景中的对象,并灵活地操控对象和摄像机。
新ImageTools Hub ImageTools Hub 是一个高效的在线图像编辑工具平台,提供多种批量图像处理功能。它的工具包括背景移除、背景模糊、图像模糊、透明图像制作、面部模糊、图像放大、图像压缩、PDF转图像、头像制作、图像调整大小、图像裁剪、图像翻转、面部分析、图像格式转换、PDF图像提取和占位符生成等。