pyvideotrans

5个月前发布 1,985 0 0

pyvideotrans是一个开源的视频翻译配音工具(开源协议GPL-v3)，可将一种语言发音的视频，翻译为另一种语言发音的视频，并嵌入该语言字幕。它利用了先进的语音识别、机器翻译和语音合成技术，实现了视频的自动翻译和配音功能。

收录时间：

2025-07-06

打开网站手机查看

AI工具合集 AI视频工具 # pyvideotrans # 自动视频翻译 # 视频翻译和配音工具

pyvideotrans

pyvideotrans

pyvideotrans的主要功能特点

1.自动视频翻译

集成faster-whisper模型/并支持自定义huggingface模型，同时集成批量语音转字幕、批量字幕翻译、批量配音小工具。

2.多种配音和翻译渠道

配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS

翻译:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|腾讯|本地模型

3.可完全离线

翻译渠道替换为本地模型,配音渠道替换为clone-voice,即可实现完全本地离线视频翻译。

4.免费+开源

代码GitHub公开可审查，免费无功能限制，无隐藏收费。开源协议GPL-v3。

pyvideotrans的原理及转换流程

将原始视频先使用 ffmpeg 分离出音频文件和无声的mp4，然后利用 openai-whisper/faster-whisper模型识别出音频中的人声，并保存为srt字幕，接着将srt字幕翻译为目标语言并保存为srt字幕文件，再将翻译结果合成为配音音频文件。接着将配音音频文件、字幕srt文件、原无声mp4合并为一个视频文件，即完成翻译。

pyvideotrans的使用视频教程

视频播放器

00:00

00:00

08:43

使用上 / 下箭头键来增高或降低音量。

数据统计

相关导航

M2UGen

M2UGen是一个由腾讯和新加坡国立大学共同研发的多模态音乐生成模型，它具备音乐生成、理解和编辑的能力。具体来说，M2UGen可以接收文字、图片、视频或音频作为输入，然后生成与之相匹配的音乐。

讯飞星辰MaaS平台

科大讯飞面向开发者打造的智能化模型精调服务平台，构建起贯穿 “数据 - 模型 - 服务” 全链路的工程化解决方案。平台提供数据增强处理、模型精调优化、效果量化评估及一键部署的的端到端开发能力；同时兼容主流开源模型生态，支持第三方模型托管。基于自研分布式训练架构与智能算力调度系统，结合 LoRA 等高效参数优化技术，平台实现大模型定制化开发...

restorePhotos.io-在线AI老照片修复工具

restorePhotos.io是一个基于人脸修复的在线照片修复工具。它使用AI人工智能技术来修复照片中模糊的人脸部分，可以帮助用户恢复和增强老旧模糊的面部照片。

Meshy

Meshy是一款基于人工智能技术的3D模型生成和优化工具。它可以帮助用户快速地将文本和图像转化为高质量的3D模型，并支持多种生成模式，如文本转3D、图像转3D等。

小以思

小以思是一款在线AI写作创作平台，致力于提供高效便捷的AI写作服务。通过小以思，您可以轻松生成高质量的文章、作文、报告、方案、心得体会、文案、总结和诗歌等内容。

Movavi Picverse

Movavi Picverse是一款功能强大的在线AI图像编辑器，专为摄影师和图片编辑爱好者设计。您可以轻松调整照片参数、应用独特滤镜和特效、编辑人像照片、添加文字和贴纸，以及享受批量处理等高级功能。配备AI自动优化功能，助您快速修复老照片并去除不需要的背景元素。

疯狂翻译师

疯狂翻译师是一款强大的移动端翻译软件，为用户提供稳定而实时的翻译服务。它支持屏幕翻译、照片翻译、文本翻译、文档翻译和视频翻译，帮助用户在不同语言环境下实现高效、准确的沟通。满足用户多样化的翻译需求

免费AI求职工具

免费AI求职工具是一个提供AI工具的平台，基于 ChatGPT API 开发的 AI 求职工具，从简历到面试，让找工作变十倍轻松。能够为我们提供从简历到面试的各种有效信息，简历修改、领英个人简介生成、常见面试题目回答生成、自我介绍生成、推荐信生成、求职信生成、离职信生成、求职约喝咖啡邀请信生成等。

暂无评论

暂无评论...