趣丸千音是什么?
趣丸千音(All Voice Lab)是趣丸科技推出的AI语音创作平台。以自研的MaskGCT语音大模型为核心,提供一站式智能语音解决方案。集成文本转语音、视频翻译、声音克隆等多元能力,支持多语种多音色互换,帮助全球用户高效创作,告别语言障碍。
主要功能
- 文本转语音:能把文字变成非常生动的说话声音,像真人一样说出来的,能把文字里的感情表达出来。有6种语言(中、英、法、德、日、韩),后面越来越多。而且声音库是超100多种音色。你可以选不同的语言,不同男女风格的声音,还能克隆自己的声音来创作。
- 声音克隆:基于自研 MaskGCT 2.0 算法,3s 音频样例就能搞定,对应语气口吻和情绪波动细节都能完美还原。克隆声线还可做到支持跨语言无缝切换(用中文声线去输出法语语音,既保持原语气习惯又能够准确读出法语发音规则)的跨国项目。
- 变声器:一键改善自己录音噪音嘈杂刺耳低质量,精准校准语音语调节奏情感韵律感等等,让录音达到播客广告配音级别的好声音,特别适用播客或商业配音场景;
技术架构
1.MaskGCT模型
- 由趣丸科技和港中文(深圳)共同研发,在掩码生成及语音表征解耦编码的基础上,语音相似度、质稳定性等均为全球 SOTA;支持包括中英日法德韩共 6 种以上的语言生成,可调节语速和音调,语音 MOS 分数为 4.5/5(高于 ElevenLabs 等国外产品)。
2.多语种数据集与训练:采用最大规模的优质多语种语音数据库「Emilia」进行训练,支持超自然风格转换及跨语言生成,实现全球语言输出。
应用场景
- 有声书制作:可以把文本快速变成有声书,让读者能听到生动的故事。
- 视频配音:对视频进行专业的配音,提供多种不同的语言,适合视频的本地化。
- 播客制作:可以提升播客的音频质量,提供多种声音风格。
- 教育与培训:能生成清晰流畅的教学音频,满足不同语言和风格的需求。
使用方法
一、注册与登录
打开趣丸千音官网,注册并完成登录。
二、核心功能使用
1. 文本转语音(TTS)
步骤:
- 点击【文本转语音】模块,输入或粘贴文本内容。
- 选择语言与音色:从中、英、日、韩等多种语言中进行选择,筛选沉稳男声/甜美女声/感情型等等,也可直接点击 专属克隆音色 。
- 调整参数(可选)::调节语速、语调、音量、情感等,指定输出格式(MP3/WAV 等)、时长。
- 生成语音:点击【合成】,等待数秒即可下载高质量音频文件。
2. 声音克隆
步骤:
- 进入【声音克隆】模块,上传一段干净、清晰的录音样本(需≥1分钟)。
- 选择目标语言(如将中文声音克隆为英语或日语)。
- 系统自动分析声音特点,生成克隆音色(等几分钟到几个小时不等,看文件时长)。
- 验证克隆效果,满意后保存至【我的声音库】,后续可直接用于文本转语音。
3. 视频翻译与配音
步骤:
- 上传需要本地化的视频文件(支持MP4/AVI等格式)。
- 选择目标语言,系统自动生成配音脚本并匹配对应音色。
- 调整配音情感或语速,预览效果后合成。
- 下载带配音的视频文件,自动同步字幕(可选)。