ArXivから音声処理・3Dモデル生成・モーション生成に関する論文を取得し、Discordに通知するボット
📌 既存ユーザーの方へ: シングルカテゴリー版からの移行はMIGRATION_GUIDE.mdを参照してください。
- 複数カテゴリの論文を監視
- 音声処理(音声合成・認識・感情分析)
- 3Dモデル生成(NeRF、Gaussian Splatting等)
- モーション生成(アニメーション、人体動作)
- 各カテゴリごとに異なるDiscordチャンネルに通知
- 論文要約を日本語に翻訳(Gemini API使用)
# 依存関係のインストール
uv sync
# 環境変数の設定
cp .env.example .env
# .envファイルを編集して必要な情報を設定
GEMINI_API_KEY
: Google Gemini APIキー(必須)DISCORD_WEBHOOK_SOUND
: 音声処理論文用のWebhook URLDISCORD_WEBHOOK_3D
: 3Dモデル生成論文用のWebhook URLDISCORD_WEBHOOK_MOTION
: モーション生成論文用のWebhook URL
uv run python source/fetch_arxiv_papers.py
config.json
で以下を設定可能:
- 各カテゴリの検索クエリ
- 最大取得論文数
- チェック対象日数
- 待機時間
GitHub Actionsで自動実行する場合は、リポジトリのSecretsに以下を設定:
GEMINI_API_KEY
DISCORD_WEBHOOK_SOUND
DISCORD_WEBHOOK_3D
DISCORD_WEBHOOK_MOTION
詳細はGITHUB_ACTIONS_SETUP.mdを参照。
0 9 * * * cd /path/to/arxiv-sound-bot && uv run python source/fetch_arxiv_papers.py