このプロジェクトは、arXivの論文とRSSフィードからPodcastを生成します。arXivの検索結果とRSSフィードからPodcastを生成するように設計されています。ArXivやRSS提供先に負担がかからない範囲でご利用ください。
Pipfile
を参照ください。
.env_sample
を参考に.env
にGOOGLE_API
を設定してください。
Podcastの音声合成には、VOICEVOX1を使いました。VOICEVOX CORE2を使ってAPIサーバーを立ち上げました。Windowsを使っている場合は、Windows版を実行すればおそらく問題なく動作するはずです。 音声合成APIのエンドポイントは環境変数VICEVOX_API_URL
で指定します。
- GPUを使用するバージョン:
docker pull voicevox/voicevox_engine:nvidia-ubuntu20.04-latest
docker run --rm --gpus all -p '127.0.0.1:50021:50021' voicevox/voicevox_engine:nvidia-ubuntu20.04-latest
.env
ファイルにVICEVOX_API_URL
, SPEACKER1_CHARACTOR_ID
, SPEACKER2_CHARACTOR_ID
を設定してください。
.env
ファイルの例:
VICEVOX_API_URL=http://localhost:50021
SPEACKER1_CHARACTOR_ID=46
SPEACKER2_CHARACTOR_ID=8
GOOGLE_API=YOUR_GOOGLE_API_KEY
app/podcast.py
を変更してください:
# 検索クエリを設定
input_search_query = "RAG Retrieval Augmented Generation"
category = "cat:cs"
python app/podcast.py
これによりpodcast.wav
が生成されます。
app/rss_podcast.py
を変更し、url
変数を目的のRSSフィードに変更してください。
python app/rss_podcast.py
プログラムのurl
変数を目的のRSSフィードに変更してください。
- VOICEVOXは無料で使える中品質なテキスト読み上げ・歌声合成ソフトウェアです。
- https://voicevox.hiroshiba.jp/
- https://voicevox.hiroshiba.jp/term/