pyvideotrans

5个月前发布 1,985 0 0

pyvideotrans是一个开源的视频翻译配音工具(开源协议GPL-v3),可将一种语言发音的视频,翻译为另一种语言发音的视频,并嵌入该语言字幕。它利用了先进的语音识别、机器翻译和语音合成技术,实现了视频的自动翻译和配音功能。

收录时间:
2025-07-06
pyvideotranspyvideotrans

pyvideotrans的主要功能特点

1.自动视频翻译

集成faster-whisper模型/并支持自定义huggingface模型,同时集成批量语音转字幕、批量字幕翻译、批量配音小工具。

2.多种配音和翻译渠道

配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS

翻译:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|腾讯|本地模型

3.可完全离线

翻译渠道替换为本地模型,配音渠道替换为clone-voice,即可实现完全本地离线视频翻译。

4.免费+开源

代码GitHub公开可审查,免费无功能限制,无隐藏收费。开源协议GPL-v3。

pyvideotrans的原理及转换流程

将原始视频先使用 ffmpeg 分离出音频文件和无声的mp4,然后利用 openai-whisper/faster-whisper模型识别出音频中的人声,并保存为srt字幕,接着将srt字幕翻译为目标语言并保存为srt字幕文件,再将翻译结果合成为配音音频文件。接着将配音音频文件、字幕srt文件、原无声mp4合并为一个视频文件,即完成翻译。

pyvideotrans的使用视频教程

视频播放器

00:00
00:00
08:43
使用上 / 下箭头键来增高或降低音量。

数据统计

相关导航

讯飞星辰MaaS平台

讯飞星辰MaaS平台

科大讯飞面向开发者打造的智能化模型精调服务平台,构建起贯穿 “数据 - 模型 - 服务” 全链路的工程化解决方案。平台提供数据增强处理、模型精调优化、效果量化评估及一键部署的的端到端开发能力;同时兼容主流开源模型生态,支持第三方模型托管。基于自研分布式训练架构与智能算力调度系统,结合 LoRA 等高效参数优化技术,平台实现大模型定制化开发...

暂无评论

none
暂无评论...