MuseV MuseV是一个由腾讯音乐娱乐旗下的天琴实验室推出的基于SD扩散模型的高保真虚拟人视频生成框架。支持文生视频、图生视频、视频生视频等多种生成方式,能够保持角色一致性,且不受视频长度限制。这意味着用户可以通过MuseV轻松地将文本、图像或现有视频转换成高质量的虚拟人视频,无需担心角色形象的不统一或视频时长的限制。 01,3200 AI大模型AI工具合集# ai数字人视频# AI数字人视频生成# MuseV
Ferret-UI Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态AI大语言模型。它专为增强对移动端用户界面(UI)屏幕的理解而设计,具备引用、定位和推理功能。这个模型能够理解手机屏幕上的内容并执行任务,专注于移动端和用户交互。 01,3150 AI大模型AI工具合集# Ferret-UI# 智能UI交互助手# 智能UI设计助手
扣子空间 字节跳动推出的自动化AI平台,主打"一句话完成任务"功能。用户无需填写专业提示词、选择模板、模型或配置工具插件,提交任务后系统自动执行并返回结果。在扣子空间中,你可以与各类AI Agent协同工作。 01,3100 AI大模型AI工具合集# AI智能体协同平台# 智能协同办公平台
Face Adapter Face Adapter 是一种专门为预训练的扩散模型设计的适配器,主要用于面部重演和面部交换任务。它能够实现高精度和高保真度的面部编辑,提供精细的个体识别和属性控制功能。 01,3000 AI大模型AI工具合集# AI换脸模型# Face Adapter# 面部交换
ReSyncer ReSyncer 是由清华大学、百度和南洋理工大学 S-Lab 实验室联合开发的多功能 AI 框架,专注于视频合成技术。它能够生成与音频高度同步的逼真口型视频,支持个性化调整、视频驱动口型同步、说话风格迁移和人脸交换。ReSyncer 在创建虚拟主持人、电影配音和多语言内容制作等领域具有广泛应用前景。 01,2950 AI大模型AI工具合集# ReSyncer# 人脸交换技术# 视频口型同步
天壤小白大模型 天壤小白是基于语言大模型的AI应用开放平台,无需代码开发,即可快速、灵活地搭建个性化的AI应用。通过提示词工程、语义搜索、向量数据库等各类AI工具组件,破解幻觉难题,为开发者和企业提供一站式的大模型应用服务。覆盖知识管理、市场销售、客户服务、内容生成、辅助决策、多语言翻译等多个场景。 01,2850 AI大模型AI工具合集# Embedding# SQL生成# 商业分析
CatVTON CatVTON是一款基于扩散模型的虚拟试穿技术工具,旨在提供高效、低资源需求的虚拟试穿体验。通过在空间维度上简单地拼接服装和人物图像来实现不同类别服装的虚拟试穿,该方法有效地降低了模型复杂度和计算成本,同时保持了高质量的虚拟试衣效果,特别适用于电商平台、时尚设计、个人造型顾问、增强现实应用和虚拟时装秀等场景。 01,2850 AI大模型AI工具合集# AI虚拟试衣# AI虚拟试衣工具# CatVTON
MuseTalk MuseTalk是由腾讯推出的一个实时的高质量音频驱动唇形同步模型,能够根据输入的音频信号自动调整数字人物的面部图像,使其唇形与音频内容高度同步,支持多种语言,并实现每秒30帧以上的实时处理速度。这意味着观众可以看到数字人物的口型与声音完美匹配的效果。 01,2750 AI大模型AI工具合集# Lyra实验室MuseTalk# MuseTalk实时同步# 开源唇形同步模型
FlashVideo FlashVideo是一个由字节跳动和香港大学联合开发的高效高分辨率视频生成框架,特别适用于文本到视频的生成。通过创新的两阶段框架设计和流匹配技术,FlashVideo 能在短时间内生成 1080p 高清视频,优化视频流畅性,并减少计算成本。 01,2500 AI大模型AI工具合集# AI视频生成框架# 动态视频生成框架# 视频生成框架
盘古大模型 盘古大模型 3.0 是一个面向行业的AI大模型系列,包含自然语言、视觉、多模态、预测、科学计算大模型等五个基础大模型,可以为用户提供知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。 01,2300 AI大模型AI工具合集# AI模型训练# AI预测模型# 千亿参数AI模型
魔搭ModelScope社区 ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单! 01,2250 AI大模型AI工具合集# AI模型社区# 机器学习模型# 魔搭AI社区
神力霓裳 神力霓裳是阿里大文娱发布的自研影视妆造大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型,辅助造型师进行创意设计。它主要服务于古装剧,包含造型设计、妆发设计和纹样设计三大功能。 01,2250 AI大模型AI工具合集# 古装剧服饰设计# 影视妆造大模型# 影视造型设计工具
MusiConGen MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制,显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的,主要用于生成各种风格的音乐片段。 01,2250 AI大模型AI工具合集# AI音乐创作# MusiConGen# MusiConGen AI音乐生成框架
Hibiki Hibiki是一个Kyutai Labs开发的一个用于流式语音翻译(也称为同步翻译)的模型。与离线翻译不同,离线翻译需要等待源语句结束后才开始翻译,而 Hibiki 能够实时积累足够的上下文,以逐块生成正确的翻译。用户在讲话时,Hibiki 会在目标语言中生成自然的语音,并提供文本翻译。 01,2150 AI大模型AI工具合集# Hibiki# 实时语音翻译模型# 语音翻译模型
FireRedASR FireRedASR是一款由FireRedTeam开发的开源工业级自动语音识别(ASR)模型,支持普通话、中文方言和英语。它在公开的普通话 ASR 基准测试中取得了新的最优结果,并且在歌词识别方面表现出色。 01,2100 AI大模型AI工具合集# FireRedASR下载# 开源语音识别工具# 自动语音识别模型
千影QianYing 千影 QianYing 是一款由巨人网络 AI Lab 推出的有声游戏生成大模型,包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。通过先进的人工智能技术,千影 QianYing 能够自动生成高质量、有声的游戏视频。YingGame 通过自定义角色、动作控制和物理模拟,创造互动性强的游戏内容;YingSoun... 01,2050 AI大模型AI工具合集# AI游戏创作工具# YingGame大模型# 千影QianYing
Codex大模型 Codex大模型是一个基于GPT技术的强大编程语言模型,具备自动生成代码、文档、测试用例等功能。它能够理解和处理复杂的编程问题,提高开发效率,是编程领域的重要创新。 01,1750 AI大模型AI工具合集# 编程大模型# 编程语言大模型哪个好用# 编程语言模型
天谱乐 天谱乐是唱鸭旗下的AI音乐品牌,为用户提供个性化、智能化的音乐创作体验。它支持文本、图片和视频生成音乐,让创作变得简单便捷。利用先进的多模态理解与生成技术,天谱乐能够生成与图片和视频情感高度契合的音乐,并提供发行级的歌曲创作服务。无论是专业音乐人还是普通爱好者,天谱乐都能帮助您高效创作出独一无二的音乐作品。 01,1750 AI大模型AI工具合集# AI音乐创作平台# 在线AI音乐创作平台# 天谱乐
InspireMusic InspireMusic 是由阿里巴巴通义实验室推出的开源音乐生成框架,集成了多项音频领域的前沿研究成果,为开发者和研究者提供全面的音乐创作、风格转换和音效合成解决方案。该框架依托多模态大模型技术,支持通过文本描述或音频输入进行智能化创作,并提供完善的模型调优工具链。 01,1750 AI大模型AI工具合集# 开源音乐生成模型# 音乐生成模型
Llama 2 Llama 2是Meta AI推出的新一代大型语言模型(LLM),参数规模从70亿到700亿不等。它是为对话场景而优化的,称为Llama 2-Chat,能够在多数基准上超越开源的对话模型,并且在人类评估的有用性和安全性上,可能是闭源模型的合适替代品。 01,1700 AI大模型AI工具合集# Llama 2# Llama 2大模型# Llama 2模型
光语大模型 光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型,融合视觉与语言处理技术,拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色,通过灰盒可信技术确保输出的稳定性和可靠性,有效解决幻觉问题,提升推理精度和可信度。 01,1700 AI大模型AI工具合集# 光语大模型
讯飞开放平台 讯飞开放平台是一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。 01,1550 AI大模型AI工具合集# android讯飞语音# 科大讯飞语音技术# 讯飞开放平台
Adobe Firefly Image2 Adobe Firefly Image 2 是Adobe推出的一款生成式人工智能模型,建立在Firefly图像模型的基础上,专为设计师和创作者提供更强大、更智能的图像生成能力。它通过简单的文字描述,可以生成高质量的图像、文字效果和鲜艳的调色板。 01,1500 AI大模型AI工具合集# Adobe Firefly Image 2# AI 图像生成# ai绘画一键生成绘画
DeepSeek DeepSeek(深度求索) 是一款当前非常火爆的开源大型语言模型,因其性能媲美世界顶尖的闭源模型如 ChatGPT 和 Claude 而备受瞩目。该模型在极低成本的情况下完成训练,为用户提供了高效、精准的语言理解和生成能力。 01,1450 AI大模型AI工具合集# DeepSeek# 开源语言模型
V-Express V-Express是由南京大学和腾讯AI实验室共同开发的一项技术,旨在通过参考图像、音频和一系列V-Kps图像来生成说话的头像视频。这项技术可以根据不同的信号,如声音、姿势、图像参考等来控制视频内容,确保即使是弱信号也能有效地影响最终生成的视频,使视频生成更加逼真和多样化。 01,1300 AI大模型AI工具合集# AI视频合成# V-Express视频生成# 动态视频生成工具
心辰Lingo语音大模型 心辰Lingo语音大模型是由西湖心辰(杭州)科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能,能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令,还能深度理解用户的情感和意图。 01,1200 AI大模型AI工具合集# 心辰Lingo语音大模型# 语音AI解决方案# 语音生成模型
MiracleVision奇想智能 MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型。它具备高度的美学导向和图像处理能力,并能广泛应用于多个行业,以提高工作流效率。该模型不仅提供了简单易用的AI视觉创作工具,使用户能够快速进行图像的创作和编辑,还支持多种图像类型和视频效果的生成。 01,1150 AI大模型AI工具合集# AI视觉大模型# AI视觉技术# MiracleVision奇想智能
百度智能云客悦 百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP(自然语言处理)、ASR(自动语音识别)、TTS(语音合成)等人工智能技术,提供公有云服务并支持同时面向多名用户,自动发起外呼通话的智能化产品。 01,1100 AI大模型AI工具合集# 智能IVR系统# 智能外呼平台# 智能客服平台
Evidently Al Evidently Al 是一个开源的机器学习模型监测和测试平台,它可以帮助您分析和改进您的模型性能。它可以让您轻松地创建交互式的可视化报告,展示您的模型在验证和预测期间的表现,以及数据漂移的情况。 01,1050 AI大模型AI工具合集# Evidently Al 机器学习模型优化# Evidently Al 模型监控工具
JoyGen JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成,旨在实现精确的嘴唇-音频同步和高视觉质量。 01,1050 AI大模型AI工具合集# 3D说话人脸生成# JoyGen# 音频驱动3D说话人脸视频模型