Skip to content

A real-time caption translation tool based on VOSK speech recognition and machine translation, which supports transcribing audio into target language subtitles in real time and displaying the translated content.

License

Notifications You must be signed in to change notification settings

tuzibr/Real_time_caption_translate

Repository files navigation

English | 简体中文

实时字幕翻译

App Icon

一个基于VOSK语音识别和机器翻译的实时字幕翻译工具,支持将音频实时转录为目标语言字幕并进行翻译显示。

✨ 特性

  • 🎙️ 实时音频转录与翻译
  • 🌐 多翻译引擎支持(Google/DeepL/Ollama)
  • 📊 主界面显示历史翻译内容
  • 🖥️ 实时字幕框
  • 🎚️ 支持扬声器/麦克风
  • 🔧 多语言配置文件支持
  • 📚 查阅VOSK官网模型目录确认你需要的语言是否够识别(或者训练你自己的模型)
  • ⚙️ 可在设置中设置仅当文本结束时翻译,减少资源消耗并且获得更加准确结果

📥 安装方法

方法一:直接使用Release版本

  1. 前往 Releases页面 下载最新版本压缩包
  2. 解压到任意目录
  3. 双击运行 Realtimecaptiontranslate.exe
  4. Release版包括一个小型英文识别模型,可直接识别英文并翻译,若要识别其他语言,请从VOSK官网下载对应模型,放在任意文件夹,在设置中设置模型路径即可

方法二:从源代码运行

# 克隆仓库
git clone https://github.com/your-repo/real-time-caption-translation.git
cd real-time-caption-translation

# 安装依赖
pip install -r requirements.txt

# 启动程序
python Run.py

⚙️ 配置说明

翻译引擎配置

引擎 必需参数 注意事项
Google 支持100+语言,免费使用
DeepL API密钥 需注册获取DeepL密钥
Ollama 本地服务地址 需要先安装并启动Ollama服务
DeepSeek API密钥 需DeepSeek密钥 DeepSeek密钥
OpenAI 平台url,模型名称,API密钥 支持使用openai sdk的模型平台,阅读平台使用文档,获取平台对应url,模型名称,API密钥

About

A real-time caption translation tool based on VOSK speech recognition and machine translation, which supports transcribing audio into target language subtitles in real time and displaying the translated content.

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages