UTAU音源の原音をNNSVSで学習できるようにする。
- Windows10
- Python3.8
- utaupy 開発版
- WSL1 (Ubuntu 20.04)
- UTAU音源の各音階を moresampler で原音設定しなおす。(設定:日本語VCV、連番なし、エイリアスへのprefix追加なし)
- oto_estimation_checker で原音設定ミスを検出する。手動チェックでもよい。
- setParam を使って原音設定ミスを直す。オーバーラップが子音開始位置、先行発声が母音開始位置となるようにする。
- 原音設定ファイルの右ブランクを正にする。setParamで一括変換するか、force_otoini_cutoff_negative を使う。
- 01_genon2db.py を実行して、dataフォルダ内にlabファイルを生成し、wavファイルをコピーする。ついでにustも生成される。
- 多音階音源の場合、各収録音階に対して1の作業を実施する。
- 02_place_files.py を実行して、 acoustic、duration、timelag モデルの学習用フォルダに各種学習ファイルを配置する。
- 03_generate_train_list.py を実行して、曲名リストのファイルを作る。(dev, eval, utt_list とか)
- config.yaml を必要に応じて書き換える。
- run.sh のステージ1以降を実行する。