SDXL-Lightning SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型,能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。 01,8250 AI大模型AI工具合集# SDXL-Lightning# SDXL-Lightning模型# 图像生成模型优化
IMYAI智能助手 IMYAI智能助手是一款功能强大、简单易用的AI服务平台,集成了GPT4、Claude、Midjourney、Stable Diffusion等先进技术。无论您是需要写作灵感、绘画创意,还是寻求办公助理、生活规划,IMYAI都能提供专业、高效的解决方案。 01,8100 AI大模型AI工具合集# IMYAI智能助手# 多模态AI大语言模型# 多模态AI模型
Evidently Al Evidently Al 是一个开源的机器学习模型监测和测试平台,它可以帮助您分析和改进您的模型性能。它可以让您轻松地创建交互式的可视化报告,展示您的模型在验证和预测期间的表现,以及数据漂移的情况。 01,8000 AI大模型AI工具合集# Evidently Al 机器学习模型优化# Evidently Al 模型监控工具
CodeGemma CodeGemma是一个由Google基于Gemma模型开发的开源代码模型系列。它专为代码生成和理解而设计,提供了强大的代码自动补全和生成功能。CodeGemma支持多种编程语言,适用于软件开发、编程教育和跨语言开发项目。它的主要功能包括智能代码补全、代码生成、代码理解、多语言支持、代码优化建议以及错误检测与修正,旨在提高开发者的编码效率... 01,8000 AI大模型AI工具合集# AI代码助手# AI代码生成# AI代码生成工具
讯飞开放平台 讯飞开放平台是一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。 01,7950 AI大模型AI工具合集# android讯飞语音# 科大讯飞语音技术# 讯飞开放平台
光语大模型 光语大模型是无限光年公司推出的一款结合大语言模型与符号推理的 AI 大模型,融合视觉与语言处理技术,拥有 10 亿视觉模型参数和 130 亿语言模型参数。该模型在金融、医疗等垂直领域表现出色,通过灰盒可信技术确保输出的稳定性和可靠性,有效解决幻觉问题,提升推理精度和可信度。 01,7950 AI大模型AI工具合集# 光语大模型
SEED-Story SEED-Story是一个腾讯开源的基于大型语言模型(MLLM)的多模态长篇故事生成模型,它能够根据用户提供的图片和文本生成连贯的叙事文本和风格一致的图片。无论是小说创作、剧本编写还是视觉故事,SEED-Story都能提供高质量、多模态的内容,助力创意产业的发展。 01,7900 AI大模型AI工具合集# 叙事文本图片生成# 多模态故事生成# 多模态长篇故事生成模型
Llama 2 Llama 2是Meta AI推出的新一代大型语言模型(LLM),参数规模从70亿到700亿不等。它是为对话场景而优化的,称为Llama 2-Chat,能够在多数基准上超越开源的对话模型,并且在人类评估的有用性和安全性上,可能是闭源模型的合适替代品。 01,7850 AI大模型AI工具合集# Llama 2# Llama 2大模型# Llama 2模型
MusiConGen MusiConGen是一种基于Transformer的文本到音乐生成模型。它通过引入时间条件机制,显著提升了对音乐节奏和和弦的控制能力。该模型是在预训练的MusicGen-melody框架基础上进行微调的,主要用于生成各种风格的音乐片段。 01,7750 AI大模型AI工具合集# AI音乐创作# MusiConGen# MusiConGen AI音乐生成框架
讯飞星火大模型 讯飞星火大模型是科大讯飞发布的一个基于深度学习的自然语言处理模型,以中文为核心,具备跨领域多任务上的类人理解和生成能力。注册免费领取1500万Tokens,该模型对标ChatGPT,并在多个领域表现出色。 01,7600 AI大模型AI工具合集# 大语言模型API# 知识增强大模型# 认知智能大模型
RMBG-2.0 RMBG-2.0是由BRIA AI 开发的开源图像背景移除模型,通过先进的卷积神经网络(CNN)实现高精度的前景与背景分离。该模型在经过精心挑选的数据集(包括一般图像、电子商务、游戏和广告内容)上进行了训练,专为大规模企业内容创建的商业用例设计,其准确性、效率和多功能性可以媲美领先的 Source Available 型号。 01,7550 AI大模型AI工具合集# BRIA AI RMBG-2.0# RMBG-2.0# 开源背景移除模型
GPT-4 GPT-4是OpenAI开发的最新一代大型语言模型。它能够接受文本和图像输入,生成类似人类的文本输出。它还能处理长达2.5万字的内容,是ChatGPT的8倍以上,使其在生成文本、延伸对话或分析文件方面更加强大。GPT-4还具备分析图像的能力,能够识别图片中的元素并生成相关的文本。 01,7450 AI大模型AI工具合集# chatgpt-4# GPT-4# GPT-4多模态
天谱乐 天谱乐是唱鸭旗下的AI音乐品牌,为用户提供个性化、智能化的音乐创作体验。它支持文本、图片和视频生成音乐,让创作变得简单便捷。利用先进的多模态理解与生成技术,天谱乐能够生成与图片和视频情感高度契合的音乐,并提供发行级的歌曲创作服务。无论是专业音乐人还是普通爱好者,天谱乐都能帮助您高效创作出独一无二的音乐作品。 01,7400 AI大模型AI工具合集# AI音乐创作平台# 在线AI音乐创作平台# 天谱乐
Loopy AI Loopy是一个端到端音频驱动的视频生成模型,专注于生成逼真的头像动画。利用先进的 AI 技术和时间模块设计,Loopy 能够从音频中提取自然的运动模式,并生成高质量的动画效果。支持多种视觉和音频风格,适用于虚拟主播、动画制作等应用场景。 01,7400 AI大模型AI工具合集# Loopy AI# 音频驱动头像动画
Claude Claude是Anthropic公司发布的一款大型语言模型(LLM)。能够检测和回避潜在的陷阱,如逻辑错误、不恰当的内容、重复性和无聊等。具有高级推理、视觉分析、代码生成、多语言处理、多模态等能力,可以生成文本、翻译语言、编写不同类型的创意内容,并以信息丰富的方式回答问题。 01,7350 AI大模型AI工具合集# Claude.ai# LLM大语言模型# 大语言模型应用
HelloMeme HelloMeme 是一个专注于生成高保真图像和视频内容的开源AI 项目,特别是表情克隆技术。通过采用最新的 SD1.5 架构和空间编织注意力扩散模型,HelloMeme 可以轻松将一张图片的表情迁移到另一张图片或视频上,生成效果超越同类工具如 Liveportrait。HelloMeme 支持 ComfyUI 界面操作,非常适用于 AI... 01,7250 AI大模型AI工具合集# HelloMeme# HelloMeme AI# 表情克隆技术
腾讯混元大模型 腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。 01,7200 AI大模型AI工具合集# AIGC智能创作# 多模态# 腾讯AIGC
VideoCrafter2 VideoCrafter2是腾讯推出的一个先进的视频生成模型,它借助深度学习技术,致力于提高视频的视觉质量、动态效果以及概念组合,能够根据用户提供的文本描述生成高质量、流畅的视频作品。 01,7200 AI大模型AI工具合集# VideoCrafter2# VideoCrafter2 图像到视频转换# VideoCrafter2 文本到视频转换
孟子生成式大模型 孟子生成式大模型(孟子 GPT)是由澜舟科技研发的一款功能强大的生成式可控大语言模型。它能够通过多轮对话,帮助用户在特定场景中完成各种工作任务,包括内容生成、语言理解、知识问答、推理、代码理解和生成、金融任务等。 01,7050 AI大模型AI工具合集# AI语言模型平台# 孟子 GPT# 孟子生成式大模型
百度智能云客悦 百度智能云客悦是百度推出的智能客服平台。其旗下的智能外呼平台是一款集合NLP(自然语言处理)、ASR(自动语音识别)、TTS(语音合成)等人工智能技术,提供公有云服务并支持同时面向多名用户,自动发起外呼通话的智能化产品。 01,6900 AI大模型AI工具合集# 智能IVR系统# 智能外呼平台# 智能客服平台
Aidge Aidge基于阿里巴巴国际数字商业集团的大语言模型和多模态大模型,结合对全球商业的深度洞察,为客户提供全面的国际电商AI云服务。Aidge 聚焦商业场景,让客户的全球经营效果更好,成本更低。Aidge 作为国际电商领域专业前沿且经验丰富的AI服务提供方,拥有极强的多语言能力、本地化能力和营销设计能力,帮助企业客户降低语言和文化门槛,解决中... 01,6900 AI大模型AI工具合集# Aidge# 全球电商运营# 国际电商AI解决方案
Codex大模型 Codex大模型是一个基于GPT技术的强大编程语言模型,具备自动生成代码、文档、测试用例等功能。它能够理解和处理复杂的编程问题,提高开发效率,是编程领域的重要创新。 01,6750 AI大模型AI工具合集# 编程大模型# 编程语言大模型哪个好用# 编程语言模型
FunAudioLLM FunAudioLLM 是由阿里巴巴通义团队开发的旨在增强人类与大型语言模型(LLMs)之间的自然语音交互的框架。其核心包括两个创新模型:SenseVoice 和 CosyVoice。SenseVoice 提供高精度的多语言语音识别、情绪识别和音频事件检测,支持超过 50 种语言,并具有极低的延迟。CosyVoice 则专注于自然语音生成... 01,6750 AI大模型AI工具合集# ai音频生成模型# CosyVoice大模型# FunAudioLLM
Aiuni AI Aiuni AI 是一款基于 Unique3D 开源技术的在线 AI 图片转 3D 模型生成建模工具,它能够在 30 秒内将单张图片转换为高质量的 3D 模型。用户通过简单的图片上传和点击生成,用户即可获得 360 度无死角的 3D 模型,确保每个角度都具有一致性和高质量的细节。 01,6750 AI大模型AI工具合集# 3D 建模工具# 3D 模型生成# Aiuni AI
Veo Veo 是 Google DeepMind 开发的一种先进的视频生成模型。它能够生成1080p高分辨率、长时长的高质量视频。Veo 支持多种电影和视觉风格,能够准确捕捉文本提示的细微差别,并提供创意控制。这个模型旨在使视频制作更易于访问,并在叙事、教育等领域开启新的可能性。 01,6700 AI大模型AI工具合集# AI长视频生成工具# Veo视频生成# 高分辨率视频AI
心辰Lingo语音大模型 心辰Lingo语音大模型是由西湖心辰(杭州)科技有限公司开发的端到端语音大模型。该模型具备原生语音理解、多种语音风格表达、语音模态超级压缩、实时打断和控制、深度情感理解等功能,能够以超拟人化的方式进行互动。这个模型不仅能快速响应复杂指令,还能深度理解用户的情感和意图。 01,6700 AI大模型AI工具合集# 心辰Lingo语音大模型# 语音AI解决方案# 语音生成模型
Qwen2 Qwen2是由阿里云通义千问团队开源的新一代大语言模型。这个系列包括了不同规模的解码器语言模型,从0.5B到72B不等,涵盖了中文和英文以及其他27种语言的高质量数据。Qwen2的设计旨在提高模型在自然语言理解、代码编写、数学解题和多语言处理方面的能力。 01,6450 AI大模型AI工具合集# Qwen2大语言模型
Phantom Phantom是一款由字节跳动开源的 AI 视频生成框架,支持通过文本和图像输入生成主题一致、高保真的视频内容。采用跨模态对齐技术,确保人物身份、外观、动作在整个视频中保持统一,适用于虚拟人、电商广告、动画创作等多种场景 01,6450 AI大模型AI工具合集# AI文本生成视频# Phantom# StepPhantom开源框架
紫东太初 紫东太初大模型是中国科学院自动化研究所和武汉人工智能研究院推出的新一代大模型。它从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务。这个大模型具备更强的认知、理解、创作能力,为用户带来全新的互动体验。 01,6350 AI大模型AI工具合集# 中科院大模型# 全模态AI大模型# 紫东太初
YuE YuE是由香港科技大学开发的开源音乐生成模型,专注于从给定的歌词生成完整的音乐音频。YuE 支持多种音乐风格和语言,能够生成高质量的声乐和伴奏部分,适用于各种音乐创作需求。通过 YuE,用户可以轻松生成长达 5 分钟的完整歌曲,实现创意音乐制作。 01,6300 AI大模型AI工具合集# AI音乐创作工具# YuE# 全曲音乐生成