AI大模型

共 157 篇网址

商量拟人大模型

商量拟人大模型是商汤科技推出的一款AI拟人大模型，它支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能，可实现行业领先的角色对话、人设及剧情推动能力。该模型广泛应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。

02,3650

AI大模型 AI工具合集 # AI情感陪伴 # AI拟人大模型 # AI角色扮演游戏

CodeGemma

CodeGemma是一个由Google基于Gemma模型开发的开源代码模型系列。它专为代码生成和理解而设计，提供了强大的代码自动补全和生成功能。CodeGemma支持多种编程语言，适用于软件开发、编程教育和跨语言开发项目。它的主要功能包括智能代码补全、代码生成、代码理解、多语言支持、代码优化建议以及错误检测与修正，旨在提高开发者的编码效率...

02,9300

AI大模型 AI工具合集 # AI代码助手 # AI代码生成 # AI代码生成工具

Ferret-UI

Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态AI大语言模型。它专为增强对移动端用户界面（UI）屏幕的理解而设计，具备引用、定位和推理功能。这个模型能够理解手机屏幕上的内容并执行任务，专注于移动端和用户交互。

03,2850

AI大模型 AI工具合集 # Ferret-UI # 智能UI交互助手 # 智能UI设计助手

华知大模型

华知大模型是由同方知网与华为合作开发的中华知识大模型。它是一个专注于知识服务与科研行业的全栈自主可控的大模型，旨在覆盖政企文教等多个行业场景，并提供30多项通用能力体系。华知大模型的核心特色能力包括智能写作、学术搜问、AI伴读、标准智能问答、机构业务知识智能问答以及图书馆读者智能服务系统等。

02,5150

AI大模型 AI工具合集 # AI伴读工具 # 中华知识大模型 # 华知大模型

Imagen 3

Imagen 3是Google DeepMind开发的最新文生图大模型。它能够根据文本提示生成高质量、高分辨率的图像，具有更好的细节和丰富的光照效果。这个模型支持多种视觉风格，从照片般逼真到油画质感，甚至黏土动画场景。Imagen 3还改进了对自然语言提示的理解，简化了生成所需图像的过程，并采用了最新的安全和责任技术，包括隐私保护和内容安...

02,4650

AI大模型 AI工具合集 # Imagen 3 图像生成工具 # Imagen 3 文生图模型 # Imagen 3文本到图像

讯飞星火大模型

讯飞星火大模型是科大讯飞发布的一个基于深度学习的自然语言处理模型，以中文为核心，具备跨领域多任务上的类人理解和生成能力。注册免费领取1500万Tokens，该模型对标ChatGPT，并在多个领域表现出色。

02,7450

AI大模型 AI工具合集 # 大语言模型API # 知识增强大模型 # 认知智能大模型

Veo

Veo 是 Google DeepMind 开发的一种先进的视频生成模型。它能够生成1080p高分辨率、长时长的高质量视频。Veo 支持多种电影和视觉风格，能够准确捕捉文本提示的细微差别，并提供创意控制。这个模型旨在使视频制作更易于访问，并在叙事、教育等领域开启新的可能性。

02,7500

AI大模型 AI工具合集 # AI长视频生成工具 # Veo视频生成 # 高分辨率视频AI

腾讯混元DiT

腾讯混元DiT是一个基于Diffusion transformer的文本到图像生成模型，也是业内首个中文原生的DiT架构文生图开源模型。该模型具有中英文细粒度理解能力，能够与用户进行多轮对话，根据上下文生成并完善图像。

03,0650

AI大模型 AI工具合集 # AI广告创意工具 # 中文原生Diffusion Transformer模型 # 中文文生图模型

Lumiere

Lumiere是谷歌发布的一个文本到视频扩散模型，于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频，通过训练海量文本和视频数据，可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用，如图像到视频、视频修复和风格化生成。

03,6500

AI大模型 AI工具合集 # AI 视频生成 # AI 视频生成工具 # Google Lumiere视频模型

甲骨文AI协同平台-殷契文渊

殷契文渊是一个甲骨文AI协同平台，它提供了丰富的甲骨文资料库，包括图片、释文、研究论文等。利用人工智能技术，帮助用户更高效地进行甲骨文的自动识别和解读。

02,7950

AI大模型 AI工具合集 # AI甲骨文字识别 # 殷契文渊 # 殷契文渊 AI协同平台

Video-LLaVA

Video-LLaVA是由北京大学ChatLaw课题组开发的一款视频问答模型。它基于Transformer架构，能够处理视频和问题，通过自注意力机制来捕捉二者之间的关联信息，并可以回答有关其内容的问题，它准确地描述了这些媒体中的视觉效果。这个模型通过在大量视频数据上进行预训练，使得它能够理解丰富的视频特征和问题语义，进而在视频问答任务上取...

03,5600

AI大模型 AI工具合集 # AI视频分析 # Video-LLaVA模型 # 视频摘要生成

快手可图大模型KOLORS

可图大模型KOLORS是一款快手自研的文生图大模型，支持文生图和图生图两类功能，已上线20余种AI图像玩法。

02,1250

AI大模型 AI工具合集 # AI形象定制 # AI文生图工具 # 快手KOLORS教程

Seed-TTS

Seed-TTS是由字节跳动开发的一系列大规模自回归文本到语音（TTS）模型。它能够生成高度自然、与人类语音几乎无法区分的语音。这个模型特别擅长学习语音上下文、说话人相似度和自然度等方面的特征，从而产生质量极高的语音输出。

03,0900

AI大模型 AI工具合集 # Seed-TTS语音合成 # 字节跳动文本到语音 # 字节跳动语音大模型

可灵大模型

可灵大模型是快手AI团队自研的一款视频生成大模型，采用类似Sora的技术路线，能够生成符合物理规律的大幅度运动视频，模拟真实世界的特性。支持生成长达2分钟的30fps的超长视频，分辨率高达1080p，且支持多种宽高比。2024年6月，快手正式推出了可灵大模型，并在快影App开放邀测体验。

03,4450

AI大模型 AI工具合集 # 1080P高清视频生成 # AI视频生成器 # ai视频生成工具有哪些

Qwen2

Qwen2是由阿里云通义千问团队开源的新一代大语言模型。这个系列包括了不同规模的解码器语言模型，从0.5B到72B不等，涵盖了中文和英文以及其他27种语言的高质量数据。Qwen2的设计旨在提高模型在自然语言理解、代码编写、数学解题和多语言处理方面的能力。

02,7700

AI大模型 AI工具合集 # Qwen2大语言模型

MuseTalk

MuseTalk是由腾讯推出的一个实时的高质量音频驱动唇形同步模型，能够根据输入的音频信号自动调整数字人物的面部图像，使其唇形与音频内容高度同步，支持多种语言，并实现每秒30帧以上的实时处理速度。这意味着观众可以看到数字人物的口型与声音完美匹配的效果。

02,7850

AI大模型 AI工具合集 # Lyra实验室MuseTalk # MuseTalk实时同步 # 开源唇形同步模型

阿里云百炼

阿里云百炼是基于通义大模型、行业大模型以及三方大模型的一站式大模型开发平台。面向企业客户和个人开发者，提供完整的模型服务工具和全链路应用开发套件，预置丰富的能力插件，提供API及SDK等便捷的集成方式，高效完成大模型应用构建。

02,4050

AI大模型 AI工具合集 # AI大模型开发平台 # AI应用开发平台 # AI模型部署平台

InstructAvatar

InstructAvatar是一个先进的AI框架，它使用自然语言界面来控制2D头像的情绪和面部动作。这个系统允许用户通过文本指令来精细控制头像的表情和运动，从而生成具有情感表现力的视频。

03,1850

AI大模型 AI工具合集 # 2D头像动作同步 # AI动态头像设计 # AI头像互动

V-Express

V-Express是由南京大学和腾讯AI实验室共同开发的一项技术，旨在通过参考图像、音频和一系列V-Kps图像来生成说话的头像视频。这项技术可以根据不同的信号，如声音、姿势、图像参考等来控制视频内容，确保即使是弱信号也能有效地影响最终生成的视频，使视频生成更加逼真和多样化。

02,9550

AI大模型 AI工具合集 # AI视频合成 # V-Express视频生成 # 动态视频生成工具

孟子生成式大模型

孟子生成式大模型（孟子 GPT）是由澜舟科技研发的一款功能强大的生成式可控大语言模型。它能够通过多轮对话，帮助用户在特定场景中完成各种工作任务，包括内容生成、语言理解、知识问答、推理、代码理解和生成、金融任务等。

02,5100

AI大模型 AI工具合集 # AI语言模型平台 # 孟子 GPT # 孟子生成式大模型

书生通用大模型

书生通用大模型是由上海人工智能实验室与商汤科技联合发布的大型预训练模型。它包括多个基础模型，如书生·多模态、书生·浦语和书生·天际等。这些模型旨在支持科研创新和产业应用，提供一个全链条开源的研发与应用平台。

02,4350

AI大模型 AI工具合集 # 书生通用大模型

Magic Clothing

Magic Clothing是一个专注于控制性的服装驱动图像合成的项目，它是OOTDiffusion模型的一个分支版本，旨在通过服装来控制图像的生成。

02,4450

AI大模型 AI工具合集 # Garment-Driven Image Synthesis # Magic Clothing # 控制性服装驱动图像合成

Gen-3 Alpha

Gen-3 Alpha是Runway公司开发的一款先进的AI视频生成模型。它能够根据用户的输入（如文本描述、图像或视频片段）创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。

02,1250

AI大模型 AI工具合集 # AI视频创作工具 # AI视频编辑控制 # Gen-3 Alpha AI视频生成

Hallo

Hallo是一个百度开源的AI对口型人脸视频生成框架，用户只需提供一段音频和所选人像，它利用人工智能技术，让图片中的人物能够根据语音的变化做出相应的面部表情和嘴唇动作。

02,2000

AI大模型 AI工具合集 # ai对口型人脸视频生成框架 # Hallo人脸视频生成技术

神力霓裳

神力霓裳是阿里大文娱发布的自研影视妆造大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型，辅助造型师进行创意设计。它主要服务于古装剧，包含造型设计、妆发设计和纹样设计三大功能。

02,7350

AI大模型 AI工具合集 # 古装剧服饰设计 # 影视妆造大模型 # 影视造型设计工具

ClotheDreamer

ClotheDreamer 是一种基于 3D 高斯方法的工具，用于从文本提示生成可穿戴的、可生产的 3D 服装资产。由上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出。它采用了一种名为 Disentangled Clothe Gaussian Splatting (DCGS) 的新型表示方法，使得服装和人体模型可以分别优化。

02,9250

AI大模型 AI工具合集 # 3D 服装生成 # 3D服装模型 # ClotheDreamer

星火大模型

讯飞星火大模型是由科大讯飞推出的新一代认知智能大模型，可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力。

02,9950

AI大模型 AI工具合集 # 国内大模型公司 # 星火大模型 # 科大讯飞大语言模型

Hyper-SD

Hyper-SD 是字节跳动推出的一种先进图像生成框架，结合了轨迹分段一致性蒸馏（TSCD）和人类反馈学习（RLHF），显著提升了扩散模型在少步骤推理下的图像生成性能。通过 Hyper-SD，用户可以在 1 到 8 步的推理过程中生成高质量的图像，极大地提高了生成速度和效率。

02,4050

AI大模型 AI工具合集 # Hyper-SD # Hyper-SD 图像生成 # 字节跳动 Hyper-SD

Idea-2-3D

Idea-2-3D 是一个3D 内容生成框架，能够从多模态输入（如文本、图像和 3D 模型）中生成高质量的 3D 模型。该框架由三个基于大型多模态模型（LMM）的智能代理组成，分别负责生成提示、选择模型和反馈反映。通过这些代理的协作和批评循环，Idea-2-3D 能够自动生成与输入高度一致的 3D 模型。

02,2500

AI大模型 AI工具合集 # Idea-2-3D # Idea-2-3D生成框架 # 智能3D模型生成

FunAudioLLM

FunAudioLLM 是由阿里巴巴通义团队开发的旨在增强人类与大型语言模型（LLMs）之间的自然语音交互的框架。其核心包括两个创新模型：SenseVoice 和 CosyVoice。SenseVoice 提供高精度的多语言语音识别、情绪识别和音频事件检测，支持超过 50 种语言，并具有极低的延迟。CosyVoice 则专注于自然语音生成...

02,7050

AI大模型 AI工具合集 # ai音频生成模型 # CosyVoice大模型 # FunAudioLLM