English | 简体中文
一个基于VOSK语音识别和机器翻译的实时字幕翻译工具,支持将音频实时转录为目标语言字幕并进行翻译显示。
- 🎙️ 实时音频转录与翻译
- 🌐 多翻译引擎支持(Google/DeepL/Ollama)
- 📊 主界面显示历史翻译内容
- 🖥️ 实时字幕框
- 🎚️ 支持扬声器/麦克风
- 🔧 多语言配置文件支持
- 📚 查阅VOSK官网模型目录确认你需要的语言是否够识别(或者训练你自己的模型)
- ⚙️ 可在设置中设置仅当文本结束时翻译,减少资源消耗并且获得更加准确结果
- 前往 Releases页面 下载最新版本压缩包
- 解压到任意目录
- 双击运行
Realtimecaptiontranslate.exe
- Release版包括一个小型英文识别模型,可直接识别英文并翻译,若要识别其他语言,请从VOSK官网下载对应模型,放在任意文件夹,在设置中设置模型路径即可
# 克隆仓库
git clone https://github.com/your-repo/real-time-caption-translation.git
cd real-time-caption-translation
# 安装依赖
pip install -r requirements.txt
# 启动程序
python Run.py
引擎 | 必需参数 | 注意事项 |
---|---|---|
无 | 支持100+语言,免费使用 | |
DeepL | API密钥 | 需注册获取DeepL密钥 |
Ollama | 本地服务地址 | 需要先安装并启动Ollama服务 |
DeepSeek | API密钥 | 需DeepSeek密钥 DeepSeek密钥 |
OpenAI | 平台url,模型名称,API密钥 | 支持使用openai sdk的模型平台,阅读平台使用文档,获取平台对应url,模型名称,API密钥 |