AI大模型

共 157 篇网址

GPT-4o mini

GPT-4o Mini 是 OpenAI 最新推出的小型智能模型，专为高性能和低成本的人工智能解决方案而设计。它支持文本、视觉、音频等多模态输入输出，响应速度极快，适用于实时应用场景。

02,3950

AI大模型 AI工具合集 # GPT-4o mini # GPT-4o mini模型 # OpenAI 小型模型

沃研Turbo大模型

沃研Turbo是由沃恩智慧公司专为大学生打造的科研大模型。它集成了多项科研辅助功能，包括期刊推荐、文献摘要、论文精读、翻译润色、创新点评估、个性化论文推荐和AI降重。通过多模态AIGC技术，沃研Turbo能够快速响应科研需求，提升科研效率。用户只需在网页上上传论文、文本或链接，即可享受便捷的科研辅助服务。沃研Turbo致力于简化科研过程...

02,4500

AI大模型 AI工具合集 # 沃研Turbo大模型 # 沃研Turbo科研大模型 # 科研大模型

HoloDreamer

HoloDreamer是一款文本驱动的3D场景生成框架，通过用户的文本描述生成沉浸式且视角一致的完整3D场景。它由风格化全景生成和增强型全景重建两个核心模块组成，该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化，然后利用3D高斯散射（3D-GS）技术快速重建3D场景，从而实现视角一致和完全封闭的3D场景生成。HoloDreame...

02,9400

AI大模型 AI工具合集 # 3D场景生成 # 3D场景生成工具 # AI生成3D

MusiConGen

MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制，显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的，主要用于生成各种风格的音乐片段。

02,6800

AI大模型 AI工具合集 # AI音乐创作 # MusiConGen # MusiConGen AI音乐生成框架

Aiuni AI

Aiuni AI 是一款基于 Unique3D 开源技术的在线 AI 图片转 3D 模型生成建模工具，它能够在 30 秒内将单张图片转换为高质量的 3D 模型。用户通过简单的图片上传和点击生成，用户即可获得 360 度无死角的 3D 模型，确保每个角度都具有一致性和高质量的细节。

02,5750

AI大模型 AI工具合集 # 3D 建模工具 # 3D 模型生成 # Aiuni AI

UniVG

UniVG是百度推出的一种统一模态视频生成系统。它能够处理多种输入模态，如文本和图像，并生成与输入语义高度一致的视频。UniVG采用了多条件交叉注意力技术和偏置高斯噪声方法，以提高生成视频的质量和保留原始内容。

03,2900

AI大模型 AI工具合集 # UniVG视频生成 # UniVG视频生成系统 # 文本图像视频生成

Tora

Tora 是阿里团队推出的一个视频生成模型，能够根据轨迹、图像、文本或其组合，快速生成精确运动控制的视频。它支持多种输入方式，如轨迹、文本和图像，并能生成高分辨率、运动可控的视频。

02,7800

AI大模型 AI工具合集 # AI视频生成工具 # 文本驱动视频生成 # 生成式AI视频工具

PuLID

PuLID是由字节跳动的团队开源的一种个性化文本到图像生成技术，通过对比对齐和快速采样方法，能够在无需调整模型的情况下轻松生成个性化写真。该技术能够保持高身份(ID)保真度，同时最大限度地减少对原始图像风格和背景的干扰，支持用户通过文本提示轻松编辑图像，生成逼真且个性化的图像结果。

02,2950

AI大模型 AI工具合集 # PuLID # 高保真图像生成

FaceChain

FaceChain 是一款基于深度学习的工具，专注于生成个人数字形象。用户只需上传一张照片，FaceChain 即可在 10 秒内生成多种风格的个人写真。该工具支持自定义风格模型训练，兼容 ControlNet 和 LoRA 模型，广泛应用于虚拟现实、游戏设计和数字营销等领域。通过 FaceChain，用户可以轻松创建高度真实且可控的个人...

02,0600

AI大模型 AI工具合集 # AI写真工具 # FaceChain # 在线AI写真工具

Face Adapter

Face Adapter 是一种专门为预训练的扩散模型设计的适配器，主要用于面部重演和面部交换任务。它能够实现高精度和高保真度的面部编辑，提供精细的个体识别和属性控制功能。

02,9300

AI大模型 AI工具合集 # AI换脸模型 # Face Adapter # 面部交换

琴乐大模型

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型。它可以通过输入中英文关键词、描述性语句或音频，能够直接生成立体声音频或多轨乐谱。

01,8550

AI大模型 AI工具合集 # AI音乐创作大模型 # 腾讯琴乐大模型 # 自动作曲工具

ReSyncer

ReSyncer 是由清华大学、百度和南洋理工大学 S-Lab 实验室联合开发的多功能 AI 框架，专注于视频合成技术。它能够生成与音频高度同步的逼真口型视频，支持个性化调整、视频驱动口型同步、说话风格迁移和人脸交换。ReSyncer 在创建虚拟主持人、电影配音和多语言内容制作等领域具有广泛应用前景。

02,8650

AI大模型 AI工具合集 # ReSyncer # 人脸交换技术 # 视频口型同步

SEED-Story

SEED-Story是一个腾讯开源的基于大型语言模型（MLLM）的多模态长篇故事生成模型，它能够根据用户提供的图片和文本生成连贯的叙事文本和风格一致的图片。无论是小说创作、剧本编写还是视觉故事，SEED-Story都能提供高质量、多模态的内容，助力创意产业的发展。

02,9550

AI大模型 AI工具合集 # 叙事文本图片生成 # 多模态故事生成 # 多模态长篇故事生成模型

SeamlessM4T

SeamlessM4T是Meta推出的一款多语言和多任务模型，能够处理语音识别、文本翻译和语音合成等任务。它支持近100种语言，可以将语音转录为文本，再进行翻译，甚至可以将翻译后的文本转化为语音。

03,2550

AI大模型 AI工具合集 # SeamlessM4T模型 # 多语言翻译模型 # 文本到语音转换

ReHiFace-S

ReHiFace-S是由硅基智能推出的开源实时高保真换脸算法，专注于实时视频中的高保真换脸技术。该算法支持零样本推理、超分辨率和色彩转换，适用于NVIDIA GTX 1080Ti及以上显卡。ReHiFace-S不仅提供高精度的面部特征和表情还原，还支持ONNX和实时摄像头模式，极大地简化了大规模数字人生成的过程。

02,8850

AI大模型 AI工具合集 # ReHiFace-S开源项目 # 实时换脸算法 # 硅基智能换脸

IMYAI智能助手

IMYAI智能助手是一款功能强大、简单易用的AI服务平台,集成了GPT4、Claude、Midjourney、Stable Diffusion等先进技术。无论您是需要写作灵感、绘画创意,还是寻求办公助理、生活规划,IMYAI都能提供专业、高效的解决方案。

02,9700

AI大模型 AI工具合集 # IMYAI智能助手 # 多模态AI大语言模型 # 多模态AI模型

MotionGen

MotionGen 是由元象科技推出的创新 3D 动作生成模型。通过结合大模型、物理仿真和强化学习等前沿算法，简化 3D 动画制作过程。用户只需输入简单的文本指令，即可快速生成逼真、流畅且复杂的 3D 动作。无论是动画、游戏、电影还是虚拟现实行业，MotionGen 都能显著提高创作效率，降低制作成本。

03,5150

AI大模型 AI工具合集 # 3D 动画制作工具 # 3D动作生成模型 # MotionGen 3D 动作生成

NineF AI

NineF AI 是一站式免费主流 AI 大模型集成平台，集成了 GPT、Claude、Llama 等全球顶尖 AI 模型，提供多角度智能解答，助您提升工作效率和决策准确性。界面简洁直观，支持图片和文档上传，满足各类创作和研究需求，是激发创新灵感的理想人工智能助手。

02,6450

AI大模型 AI工具合集 # AI 大模型集成平台 # NineF AI

CatVTON

CatVTON是一款基于扩散模型的虚拟试穿技术工具，旨在提供高效、低资源需求的虚拟试穿体验。通过在空间维度上简单地拼接服装和人物图像来实现不同类别服装的虚拟试穿，该方法有效地降低了模型复杂度和计算成本，同时保持了高质量的虚拟试衣效果，特别适用于电商平台、时尚设计、个人造型顾问、增强现实应用和虚拟时装秀等场景。

03,1250

AI大模型 AI工具合集 # AI虚拟试衣 # AI虚拟试衣工具 # CatVTON

心辰Lingo语音大模型

心辰Lingo语音大模型是由西湖心辰（杭州）科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能，能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令，还能深度理解用户的情感和意图。

02,6650

AI大模型 AI工具合集 # 心辰Lingo语音大模型 # 语音AI解决方案 # 语音生成模型

GPT智库

GPT智库是一款强大的人工智能大模型综合应用，提供互联网境外访问绿色通道、汇聚了全球顶尖的人工智能大模型和学术资源。它具备智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能，为科研院所、新闻媒体、高校和政府部门提供安全、合规、可控的全球一流人工智能服务。

03,1050

AI大模型 AI工具合集 # GPT智库 # 大模型应用平台

Aidge

Aidge基于阿里巴巴国际数字商业集团的大语言模型和多模态大模型，结合对全球商业的深度洞察，为客户提供全面的国际电商AI云服务。Aidge 聚焦商业场景，让客户的全球经营效果更好，成本更低。Aidge 作为国际电商领域专业前沿且经验丰富的AI服务提供方，拥有极强的多语言能力、本地化能力和营销设计能力，帮助企业客户降低语言和文化门槛，解决中...

02,6250

AI大模型 AI工具合集 # Aidge # 全球电商运营 # 国际电商AI解决方案

SeedEdit

SeedEdit是一种由字节跳动（ByteDance）豆包团队推出的智能图像编辑模型。它通过自然语言指令简化了图像编辑过程，用户只需输入简单的描述语句，就能实现图像的调整、美化、转换等操作。

03,0950

AI大模型 AI工具合集 # SeedEdit # 图像编辑AI技术 # 智能图像编辑工具

腾讯混元3D

腾讯混元3D，全称为 Hunyuan3D-1.0，是腾讯推出的首个同时支持文生和图生的3D开源模型，专门解决现有3D生成模型在生成速度和泛化能力方面的不足。该模型采用了基于Diffusion 技术的架构，能够同时支持文本生成和图像生成3D资产。

02,0150

AI大模型 AI工具合集 # 3D开源模型 # Hunyuan3D-1.0 # 快速3D资产生成

RMBG-2.0

RMBG-2.0是由BRIA AI 开发的开源图像背景移除模型，通过先进的卷积神经网络（CNN）实现高精度的前景与背景分离。该模型在经过精心挑选的数据集（包括一般图像、电子商务、游戏和广告内容）上进行了训练，专为大规模企业内容创建的商业用例设计，其准确性、效率和多功能性可以媲美领先的 Source Available 型号。

02,5750

AI大模型 AI工具合集 # BRIA AI RMBG-2.0 # RMBG-2.0 # 开源背景移除模型

LTX Video

LTX Video是由 Lightricks公司推出的首个REAL-TIME AI视频生成开源模型。它基于 DiT (Diverse Image Transformer) 架构，能够实时生成高质量的视频。LTX Video 能够以 24 FPS 和 768x512 分辨率生成视频，生成速度比观看速度还要快。

03,4600

AI大模型 AI工具合集 # LTX Video # 开源视频工具

智谱清流

智谱清流是智谱AI推出的企业级AI智能体开发平台，旨在帮助企业快速构建和部署AI应用，实现业务流程的智能化升级。该平台基于智谱全模型矩阵和先进的大模型技术（如GLM系列），提供了一整套工具和服务，支持多种集成方式，满足不同企业的智能化需求。

03,2800

AI大模型 AI工具合集 # 企业级AI平台 # 大模型应用 # 智谱清流

光语大模型

光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型，融合视觉与语言处理技术，拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色，通过灰盒可信技术确保输出的稳定性和可靠性，有效解决幻觉问题，提升推理精度和可信度。

02,9550

AI大模型 AI工具合集 # 光语大模型

光语金帆

光语金帆是由无限光年公司推出的金融大模型，结合了顶尖的人工智能技术和人才资源，旨在构建超越客户期望的人工智能生成内容（AIGC）产品组合，推动金融行业生产力和用户交互体验的全面提升，实现金融服务的智能化、公平化和普惠化。

02,6100

AI大模型 AI工具合集 # AI财报点评 # 光语金帆 # 智能投研工具

星流图像大模型

星流图像大模型由 LiblibAI 发布的一款自研图像大模型，名为 Star-3 Alpha。该模型基于业界领先的 F.1 基础算法架构训练而成，辅以全球最大的 LORA 增强模型库及不断进化的 AI 图像控制能力。在图像精准度、色彩表现力、美学捕捉的细腻表达等方面实现了显著的飞跃，成为新的业界标杆。

02,6300

AI大模型 AI工具合集 # AI去除背景 # AI生图 # Star-3 Alpha