
新Spark-TTS
Spark-TTS是SparkAudio团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具,无需额外的生成模型,直接从LLM预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。
音刻(Inkr)是一款基于 AI 的多语言音视频转录工具,支持极速转录、说话人识别与智能笔记生成,适用于会议记录、采访整理、字幕制作等场景。FLASH 模式转录速度提升 8 倍,支持100+语言,助你高效捕捉每一段语音内容。
音刻(Inkr)是一款基于AI的多语言音视频转录工具,支持极速转录、说话人识别与智能笔记生成,帮您快速整理您的会记/采访/课堂等语音内容。 平台采用 FLASH 模式,几秒内就可转完一整段音频/视频,而且比传统的工具软件快了 8 倍!可以识别 100+ 类语言与格式类型,并通过询问小助理迅速得到所需的关键信息并快速批量导出会议纪要和提纲等。能够帮您克服噪音干扰精准录音且可以逐字节校准;适用于各类媒体作品创作、教育培训或企业管理等场景。
方案 | 价格 | 适用人群 | 主要功能亮点 |
---|---|---|---|
永久免费 | 免费(每日限 3 次) | 轻度使用者、入门体验 | – 每天最多转录 3 次,每次最长 35 分钟,文件限制:2 小时 / 150MB,含水印下载,最近 3 次编辑记录,受限访问 AI 小助理 |
基础版 | $5.99 / 月 | 常规使用者 | – 批量上传与导出,无水印下载,完整编辑历史,更高额度与转录时长 |
专业版 | $9.99 / 月 | 内容创作者、职场用户 | – 单文件支持 10 小时 / 5GB,无限访问 AI 小助理,高速 FLASH 转录,多语言翻译、润色、智能编辑等高级功能 |
精英版 | $25.99 / 月 | 高频使用者、专业团队 | – 提供更高额度,更快转录速度,更多 AI 功能,优先技术支持与服务 |
1. 访问官网并注册登录:打开音刻官网,可直接使用邮箱注册或第三方账号登录。
2. 上传音频或视频文件:点击「上传」或将文件拖入页面,支持 MP3、MP4、WAV 等主流格式。 免费用户每次最多 35 分钟,文件大小不超过 2 小时或 150MB。
3. 设置语言与转录模式,选择音频语言(支持 100+ 种)与转录模式:
4. 启动转录并等待结果:点击「开始转录」,系统将自动处理音频。FLASH 模式通常几秒内完成。
5. 查看与编辑转录内容:转录完成后可逐词校准、修改文本,支持说话人识别与时间轴定位。
6. 使用 AI 小助理与音刻笔记(可选)
7. 导出与保存:支持导出为 TXT、DOCX、SRT 等格式,便于制作字幕或归档。Pro 用户可无水印下载并保存完整编辑历史。