AI大模型

共 157 篇网址

JoyGen

JoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成，旨在实现精确的嘴唇-音频同步和高视觉质量。

02,8650

AI大模型 AI工具合集 # 3D说话人脸生成 # JoyGen # 音频驱动3D说话人脸视频模型

Llama 2

Llama 2是Meta AI推出的新一代大型语言模型（LLM），参数规模从70亿到700亿不等。它是为对话场景而优化的，称为Llama 2-Chat，能够在多数基准上超越开源的对话模型，并且在人类评估的有用性和安全性上，可能是闭源模型的合适替代品。

02,8600

AI大模型 AI工具合集 # Llama 2 # Llama 2大模型 # Llama 2模型

GPT-4

GPT-4是OpenAI开发的最新一代大型语言模型。它能够接受文本和图像输入，生成类似人类的文本输出。它还能处理长达2.5万字的内容，是ChatGPT的8倍以上，使其在生成文本、延伸对话或分析文件方面更加强大。GPT-4还具备分析图像的能力，能够识别图片中的元素并生成相关的文本。

02,8500

AI大模型 AI工具合集 # chatgpt-4 # GPT-4 # GPT-4多模态

魔搭ModelScope社区

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！

02,8250

AI大模型 AI工具合集 # AI模型社区 # 机器学习模型 # 魔搭AI社区

Monica bots

Monica Bots是一款基于先进AI模型（如 GPT-4、Claude、Gemini 等）的多功能AI助手，能助力用户快速创建和部署智能助手（Bots）的平台，Monica Bots支持跨平台使用，包括浏览器插件（Chrome、Edge、Safari）、桌面端（Windows、macOS）和移动端（iOS、Android）。它集成了聊...

02,8150

AI大模型 AI工具合集 # Monica Bots # 无需编程创建智能体 # 智能体构建平台

甲骨文AI协同平台-殷契文渊

殷契文渊是一个甲骨文AI协同平台，它提供了丰富的甲骨文资料库，包括图片、释文、研究论文等。利用人工智能技术，帮助用户更高效地进行甲骨文的自动识别和解读。

02,7950

AI大模型 AI工具合集 # AI甲骨文字识别 # 殷契文渊 # 殷契文渊 AI协同平台

MiracleVision奇想智能

MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型。它具备高度的美学导向和图像处理能力，并能广泛应用于多个行业，以提高工作流效率。该模型不仅提供了简单易用的AI视觉创作工具，使用户能够快速进行图像的创作和编辑，还支持多种图像类型和视频效果的生成。

02,7900

AI大模型 AI工具合集 # AI视觉大模型 # AI视觉技术 # MiracleVision奇想智能

MuseTalk

MuseTalk是由腾讯推出的一个实时的高质量音频驱动唇形同步模型，能够根据输入的音频信号自动调整数字人物的面部图像，使其唇形与音频内容高度同步，支持多种语言，并实现每秒30帧以上的实时处理速度。这意味着观众可以看到数字人物的口型与声音完美匹配的效果。

02,7850

AI大模型 AI工具合集 # Lyra实验室MuseTalk # MuseTalk实时同步 # 开源唇形同步模型

Tora

Tora 是阿里团队推出的一个视频生成模型，能够根据轨迹、图像、文本或其组合，快速生成精确运动控制的视频。它支持多种输入方式，如轨迹、文本和图像，并能生成高分辨率、运动可控的视频。

02,7800

AI大模型 AI工具合集 # AI视频生成工具 # 文本驱动视频生成 # 生成式AI视频工具

天谱乐

天谱乐是唱鸭旗下的AI音乐品牌，为用户提供个性化、智能化的音乐创作体验。它支持文本、图片和视频生成音乐，让创作变得简单便捷。利用先进的多模态理解与生成技术，天谱乐能够生成与图片和视频情感高度契合的音乐，并提供发行级的歌曲创作服务。无论是专业音乐人还是普通爱好者，天谱乐都能帮助您高效创作出独一无二的音乐作品。

02,7750

AI大模型 AI工具合集 # AI音乐创作平台 # 在线AI音乐创作平台 # 天谱乐

Qwen2

Qwen2是由阿里云通义千问团队开源的新一代大语言模型。这个系列包括了不同规模的解码器语言模型，从0.5B到72B不等，涵盖了中文和英文以及其他27种语言的高质量数据。Qwen2的设计旨在提高模型在自然语言理解、代码编写、数学解题和多语言处理方面的能力。

02,7700

AI大模型 AI工具合集 # Qwen2大语言模型

Phantom

Phantom是一款由字节跳动开源的 AI 视频生成框架，支持通过文本和图像输入生成主题一致、高保真的视频内容。采用跨模态对齐技术，确保人物身份、外观、动作在整个视频中保持统一，适用于虚拟人、电商广告、动画创作等多种场景

02,7700

AI大模型 AI工具合集 # AI文本生成视频 # Phantom # StepPhantom开源框架

Veo

Veo 是 Google DeepMind 开发的一种先进的视频生成模型。它能够生成1080p高分辨率、长时长的高质量视频。Veo 支持多种电影和视觉风格，能够准确捕捉文本提示的细微差别，并提供创意控制。这个模型旨在使视频制作更易于访问，并在叙事、教育等领域开启新的可能性。

02,7500

AI大模型 AI工具合集 # AI长视频生成工具 # Veo视频生成 # 高分辨率视频AI

DeepSeek

DeepSeek（深度求索）是一款当前非常火爆的开源大型语言模型，因其性能媲美世界顶尖的闭源模型如 ChatGPT 和 Claude 而备受瞩目。该模型在极低成本的情况下完成训练，为用户提供了高效、精准的语言理解和生成能力。

02,7500

AI大模型 AI工具合集 # DeepSeek # 开源语言模型

紫东太初

紫东太初大模型是中国科学院自动化研究所和武汉人工智能研究院推出的新一代大模型。它从三模态走向全模态，支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务。这个大模型具备更强的认知、理解、创作能力，为用户带来全新的互动体验。

02,7400

AI大模型 AI工具合集 # 中科院大模型 # 全模态AI大模型 # 紫东太初

Evidently Al

Evidently Al 是一个开源的机器学习模型监测和测试平台，它可以帮助您分析和改进您的模型性能。它可以让您轻松地创建交互式的可视化报告，展示您的模型在验证和预测期间的表现，以及数据漂移的情况。

02,7350

AI大模型 AI工具合集 # Evidently Al 机器学习模型优化 # Evidently Al 模型监控工具

神力霓裳

神力霓裳是阿里大文娱发布的自研影视妆造大模型。这个模型可以根据要求快速生成影视级的各朝代服饰造型，辅助造型师进行创意设计。它主要服务于古装剧，包含造型设计、妆发设计和纹样设计三大功能。

02,7350

AI大模型 AI工具合集 # 古装剧服饰设计 # 影视妆造大模型 # 影视造型设计工具

百度智能云客悦

百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP（自然语言处理）、ASR（自动语音识别）、TTS（语音合成）等人工智能技术，提供公有云服务并支持同时面向多名用户，自动发起外呼通话的智能化产品。

02,7200

AI大模型 AI工具合集 # 智能IVR系统 # 智能外呼平台 # 智能客服平台

MusiConGen

MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制，显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。

02,7200

AI大模型 AI工具合集 # AI音乐创作 # MusiConGen # MusiConGen AI音乐生成框架

YuE

YuE是由香港科技大学开发的开源音乐生成模型，专注于从给定的歌词生成完整的音乐音频。YuE 支持多种音乐风格和语言，能够生成高质量的声乐和伴奏部分，适用于各种音乐创作需求。通过 YuE，用户可以轻松生成长达 5 分钟的完整歌曲，实现创意音乐制作。

02,7200

AI大模型 AI工具合集 # AI音乐创作工具 # YuE # 全曲音乐生成

Codex大模型

Codex大模型是一个基于GPT技术的强大编程语言模型，具备自动生成代码、文档、测试用例等功能。它能够理解和处理复杂的编程问题，提高开发效率，是编程领域的重要创新。

02,7150

AI大模型 AI工具合集 # 编程大模型 # 编程语言大模型哪个好用 # 编程语言模型

FunAudioLLM

FunAudioLLM 是由阿里巴巴通义团队开发的旨在增强人类与大型语言模型（LLMs）之间的自然语音交互的框架。其核心包括两个创新模型：SenseVoice 和 CosyVoice。SenseVoice 提供高精度的多语言语音识别、情绪识别和音频事件检测，支持超过 50 种语言，并具有极低的延迟。CosyVoice 则专注于自然语音生成...

02,7050

AI大模型 AI工具合集 # ai音频生成模型 # CosyVoice大模型 # FunAudioLLM

讯飞星火大模型

讯飞星火大模型是科大讯飞发布的一个基于深度学习的自然语言处理模型，以中文为核心，具备跨领域多任务上的类人理解和生成能力。注册免费领取1500万Tokens，该模型对标ChatGPT，并在多个领域表现出色。

02,7000

AI大模型 AI工具合集 # 大语言模型API # 知识增强大模型 # 认知智能大模型

千影QianYing

千影 QianYing 是一款由巨人网络 AI Lab 推出的有声游戏生成大模型，包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。通过先进的人工智能技术，千影 QianYing 能够自动生成高质量、有声的游戏视频。YingGame 通过自定义角色、动作控制和物理模拟，创造互动性强的游戏内容；YingSoun...

02,6950

AI大模型 AI工具合集 # AI游戏创作工具 # YingGame大模型 # 千影QianYing

Mini-Gemini

Mini-Gemini是一个简单而有效的框架，用于增强多模态视觉语言模型（VLMs），由中国香港中文大学和 SmartMore 的研究人员共同推出。Mini-Gemini支持一系列密集和MoE大型语言模型（LLMs），从2B到34B。为了增强视觉token，该框架建议在不增加视觉token数量的情况下，利用额外的视觉编码器进行高分辨率细化...

02,6900

AI大模型 AI工具合集 # Mini-Gemini # Mini-Gemini框架 # 多模态视觉语言模型

心辰Lingo语音大模型

心辰Lingo语音大模型是由西湖心辰（杭州）科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能，能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令，还能深度理解用户的情感和意图。

02,6900

AI大模型 AI工具合集 # 心辰Lingo语音大模型 # 语音AI解决方案 # 语音生成模型

VideoCrafter2

VideoCrafter2是腾讯推出的一个先进的视频生成模型，它借助深度学习技术，致力于提高视频的视觉质量、动态效果以及概念组合，能够根据用户提供的文本描述生成高质量、流畅的视频作品。

02,6750

AI大模型 AI工具合集 # VideoCrafter2 # VideoCrafter2 图像到视频转换 # VideoCrafter2 文本到视频转换

NineF AI

NineF AI 是一站式免费主流 AI 大模型集成平台，集成了 GPT、Claude、Llama 等全球顶尖 AI 模型，提供多角度智能解答，助您提升工作效率和决策准确性。界面简洁直观，支持图片和文档上传，满足各类创作和研究需求，是激发创新灵感的理想人工智能助手。

02,6450

AI大模型 AI工具合集 # AI 大模型集成平台 # NineF AI

Step-Video-T2V

Step-Video-T2V 是由阶跃星辰与吉利汽车集团联合开源的一款先进文本生成视频（Text-to-Video）模型。这款模型在 2025 年 2 月 18 日正式发布，具备强大的多模态生成能力，支持中文和英文输入，适用于广告、影视制作、教育等多个场景。

02,6450

AI大模型 AI工具合集 # Step-Video-T2V开源模型 # Text-to-Video模型 # 多模态视频生成模型

Aidge

Aidge基于阿里巴巴国际数字商业集团的大语言模型和多模态大模型，结合对全球商业的深度洞察，为客户提供全面的国际电商AI云服务。Aidge 聚焦商业场景，让客户的全球经营效果更好，成本更低。Aidge 作为国际电商领域专业前沿且经验丰富的AI服务提供方，拥有极强的多语言能力、本地化能力和营销设计能力，帮助企业客户降低语言和文化门槛，解决中...

02,6400

AI大模型 AI工具合集 # Aidge # 全球电商运营 # 国际电商AI解决方案