d.va

D.Va拥有一部强大的机甲，它具有两台全自动的近距离聚变机炮、可以使机甲飞跃敌人或障碍物的推进器、还有可以抵御来自正面的远程攻击的防御矩阵

—— From OverWatch

项目简介

D.VA 是一个基于大模型优化的端到端多人TTS引擎，专注于播客节目创作。项目的目标是让AI辅助创作变得简单而有趣。

dva.mp4

音频示例

ai_podcast.webm

提示：如果无法在线播放，请点击下载

项目配置

1. 模型下载

从Hugging Face下载预训练模型:

cd models/
git lfs install
git clone https://huggingface.co/echonoshy/d.va

2. 第三方库

apt install ffmpeg rubberband-cli

3. pip库

pip install -r requirements.txt

项目启动

在.env 文件中增加硅基流动deepseek api-key, 字段名为：SILICONFLOW_API_KEY

python webui.py  # 启动web界面

应用场景

构建一个可以每日更新语音版新闻的助手，然后自动推送到播客和小红书涨粉。

实现路径

每日获取不同领域的专业新闻
讲新闻分解成新闻稿
新闻稿变成语音稿件（带片头片尾曲，时长不超过4分钟）
自动推送到小红书和播客

新特性TODO:

[ ] 1. 增加声音克隆功能
[ ] 2. 增加自定义音色
[x] 3. 解决tts api访问较慢问题
[ ] 4. 增加其他场景功能（待定）

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
assets		assets
data		data
datasets		datasets
language		language
models		models
modules		modules
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
launch.py		launch.py
packages.txt		packages.txt
pipeline.py		pipeline.py
requirements.txt		requirements.txt
webui.py		webui.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

d.va

项目简介

音频示例

项目配置

1. 模型下载

2. 第三方库

3. pip库

项目启动

应用场景

实现路径

新特性TODO:

About

Releases

Packages

Languages

License

echonoshy/d.va

Folders and files

Latest commit

History

Repository files navigation

d.va

项目简介

音频示例

项目配置

1. 模型下载

2. 第三方库

3. pip库

项目启动

应用场景

实现路径

新特性TODO:

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages