星流图像大模型 星流图像大模型由 LiblibAI 发布的一款自研图像大模型,名为 Star-3 Alpha。该模型基于业界领先的 F.1 基础算法架构训练而成,辅以全球最大的 LORA 增强模型库及不断进化的 AI 图像控制能力。在图像精准度、色彩表现力、美学捕捉的细腻表达等方面实现了显著的飞跃,成为新的业界标杆。
Online Vocal Remover Online Vocal Remover是Notta公司旗下的一个免费的人声和背景音乐分离在线处理工具。用户只需上传音乐或影片文件,该工具即可使用AI技术自动将唱歌声音与人声伴奏进行分离,从而得到干净的伴奏或仅保留人声。
简单听记 简单听记是百度网盘推出的一款AI语音转文字工具,旨在快速将音频文件转换为文字。它支持多种音频格式,并提供多种预设模板,适用于会议记录、电话录音等多种场景。简单听记具备实时转录和自动化处理的能力,能够智能区分发言人,剔除口语词,保持内容连贯性。用户可以通过简单听记生成规范的会议纪要,提高工作效率。
CogVideo CogVideo是目前最大的通用领域文本到视频生成预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。