D.Va拥有一部强大的机甲,它具有两台全自动的近距离聚变机炮、可以使机甲飞跃敌人或障碍物的推进器、 还有可以抵御来自正面的远程攻击的防御矩阵
—— From OverWatch
D.VA 是一个基于大模型优化的端到端多人TTS引擎,专注于播客节目创作。项目的目标是让AI辅助创作变得简单而有趣。
dva.mp4
ai_podcast.webm
提示:如果无法在线播放,请点击下载
从Hugging Face下载预训练模型:
cd models/
git lfs install
git clone https://huggingface.co/echonoshy/d.va
apt install ffmpeg rubberband-cli
pip install -r requirements.txt
在.env 文件中增加硅基流动deepseek api-key, 字段名为:SILICONFLOW_API_KEY
python webui.py # 启动web界面
构建一个可以每日更新语音版新闻的助手,然后自动推送到播客和小红书涨粉。
- 每日获取不同领域的专业新闻
- 讲新闻分解成新闻稿
- 新闻稿变成语音稿件 (带片头片尾曲,时长不超过4分钟)
- 自动推送到小红书和播客
[ ] 1. 增加声音克隆功能
[ ] 2. 增加自定义音色
[x] 3. 解决tts api访问较慢问题
[ ] 4. 增加其他场景功能(待定)