视界一粟YiSu

5个月前发布 2,095 0 0

视界一粟YiSu是由极佳科技联合清华大学自动化系研发的一款中国首个超长时长、高性价比、端侧可用的Sora级视频生成大模型。不仅擅长生成视频，还能执行文本到视频转换、图像到视频合成等多种视频编辑任务。

收录时间：

2025-07-06

打开网站手机查看

AI工具合集 AI视频工具 # Sora级视频生成 # 端侧可用视频模型 # 视界一粟YiSu # 视频生成大模型 # 超长时长视频模型

视界一粟YiSu

视界一粟YiSu

技术路线

自研技术：基于团队自研的视频生成大模型技术，融合了LLM和扩散模型的自研架构，结合多种技术路线的优势，在多模态融合、训练效率、推理效率、模型效果等方面达到极致的优化。

应用场景

1、长视频生成：

超长时长：YiSu模型原生支持16秒的超长时长，并能生成至1分钟以上的视频。这一特性使得它在需要长时间连续内容的场景下具有显著优势。
高性价比：相比传统视频生成技术，YiSu模型成本更低、速度更快，适合大规模的长视频生成需求。

2、视频编辑与合成：

多功能性：YiSu模型不仅擅长生成视频，还能执行文本到视频转换、图像到视频合成等多种视频编辑任务。
超大运动与表现力：模型生成的视频具有超大运动和超强表现力，能够满足各种复杂场景下的视频编辑需求。

3、物理世界模拟：

懂物理世界：YiSu模型能够理解和模拟物理世界的动态环境，这对于自动驾驶、通用机器人等物理世界通用智能领域具有重要意义。
驱动通用智能：通过视频生成技术，YiSu模型有望加速通用智能的发展，为自动驾驶、机器人等领域提供强大的数据支持。

4、娱乐与消费领域：

AI-Native和视频-Native应用：极佳科技正在基于YiSu模型打造“AI-Native”和“视频-Native”的爆款应用，以满足广大用户在娱乐、消费等方面的需求。
丰富用户体验：通过YiSu模型生成的高质量视频内容，能够为用户带来更加丰富、多样的娱乐和消费体验。

5、教育与培训：

虚拟场景模拟：YiSu模型能够生成逼真的虚拟场景，为教育和培训领域提供有效的模拟工具。
个性化学习：结合AI技术，YiSu模型可以根据学生的学习进度和兴趣生成个性化的学习视频，提高学习效果。

6 、广告与营销：

快速生成广告素材：YiSu模型能够快速生成高质量的广告视频素材，满足广告行业的快速响应需求。
创意生成：模型还能根据广告主的需求生成创意性的广告内容，提升广告的吸引力和效果。

数据统计

相关导航

腾讯APIJSON

腾讯APIJSON是一个开源的零代码、全功能、强安全API架构，旨在通过零代码的方式实现后端接口和文档的自动化，同时允许前端完全定制返回的 JSON 数据和结构。它大幅简化了开发流程，提升了前后端协作效率，适合中小型项目、创业项目以及低代码/零代码开发场景。

雅美度

雅美度AI图文自动转短视频是一款批量快速将文章、图片、音乐转为短视频，并支持橫屏或竖屏.全自动添加(字幕,配音讲解,相关素材)，不需要你手动添加和查找素材，你只需要提供txt文案和图片、音乐，剩下的软件来帮你实现.

Mini-Gemini

Mini-Gemini是一个简单而有效的框架，用于增强多模态视觉语言模型（VLMs），由中国香港中文大学和 SmartMore 的研究人员共同推出。Mini-Gemini支持一系列密集和MoE大型语言模型（LLMs），从2B到34B。为了增强视觉token，该框架建议在不增加视觉token数量的情况下，利用额外的视觉编码器进行高分辨率细化...

琴乐大模型

琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型。它可以通过输入中英文关键词、描述性语句或音频，能够直接生成立体声音频或多轨乐谱。

DreamTuner

DreamTuner是由字节跳动开发的一款人工智能图像生成工具。这是一种从单个图像生成主体驱动的新通用方法，可以创建令人震惊的一致主体身份。你只需要提供一张图片，DreamTuner就能帮你生成与这张图片在主题和风格上一致的新图像。这个工具特别适用于需要根据特定主题或条件创建个性化图像的场景。

疯狂翻译师

疯狂翻译师是一款强大的移动端翻译软件，为用户提供稳定而实时的翻译服务。它支持屏幕翻译、照片翻译、文本翻译、文档翻译和视频翻译，帮助用户在不同语言环境下实现高效、准确的沟通。满足用户多样化的翻译需求

Pebblely宝贝丽

Pebblely宝贝丽是一个基于人工智能的电商作图工具，它可以在几秒钟内将普通的产品图片转化为精美的场景图，适用于电商和社交媒体等营销渠道。

GPT智库

GPT智库是一款强大的人工智能大模型综合应用，提供互联网境外访问绿色通道、汇聚了全球顶尖的人工智能大模型和学术资源。它具备智能对话、文生图、图生图、音频翻译、图像分析和全球学术资料搜索等多种功能，为科研院所、新闻媒体、高校和政府部门提供安全、合规、可控的全球一流人工智能服务。

暂无评论

暂无评论...