Skip to content

MidraLab/arxiv-sound-bot

Repository files navigation

ArXiv Sound Bot

ArXivから音声処理・3Dモデル生成・モーション生成に関する論文を取得し、Discordに通知するボット

📌 既存ユーザーの方へ: シングルカテゴリー版からの移行はMIGRATION_GUIDE.mdを参照してください。

機能

  • 複数カテゴリの論文を監視
    • 音声処理(音声合成・認識・感情分析)
    • 3Dモデル生成(NeRF、Gaussian Splatting等)
    • モーション生成(アニメーション、人体動作)
  • 各カテゴリごとに異なるDiscordチャンネルに通知
  • 論文要約を日本語に翻訳(Gemini API使用)

セットアップ

# 依存関係のインストール
uv sync

# 環境変数の設定
cp .env.example .env
# .envファイルを編集して必要な情報を設定

環境変数

  • GEMINI_API_KEY: Google Gemini APIキー(必須)
  • DISCORD_WEBHOOK_SOUND: 音声処理論文用のWebhook URL
  • DISCORD_WEBHOOK_3D: 3Dモデル生成論文用のWebhook URL
  • DISCORD_WEBHOOK_MOTION: モーション生成論文用のWebhook URL

実行

uv run python source/fetch_arxiv_papers.py

設定

config.jsonで以下を設定可能:

  • 各カテゴリの検索クエリ
  • 最大取得論文数
  • チェック対象日数
  • 待機時間

定期実行

GitHub Actions(推奨)

GitHub Actionsで自動実行する場合は、リポジトリのSecretsに以下を設定:

  • GEMINI_API_KEY
  • DISCORD_WEBHOOK_SOUND
  • DISCORD_WEBHOOK_3D
  • DISCORD_WEBHOOK_MOTION

詳細はGITHUB_ACTIONS_SETUP.mdを参照。

ローカルcron

0 9 * * * cd /path/to/arxiv-sound-bot && uv run python source/fetch_arxiv_papers.py

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages