Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

整理: モック版 TTS の後処理を共通化 #1417

Merged
merged 2 commits into from
Jun 22, 2024

Conversation

tarepan
Copy link
Contributor

@tarepan tarepan commented Jun 22, 2024

内容

概要: モック版 TTS の後処理を共通化してリファクタリング

モック版の音声合成は MockTTSEngine.synthesize_wave() にて実装されている。ここではコアの代わりに pyopenjtalk.tts() が実合成を担っており、コアとの sampling rate 差などを吸収している。
少し前のリファクタリングによって synthesize_wave() 内の後処理(例: リサンプリング、音量調整)は raw_wave_to_output_wave() 関数へまとめられた。モック版ではこれを利用していなかったが、MockTTSEngine.forward() をコア呼び出しと見立てればそのまま raw_wave_to_output_wave() を利用できる。
これにより製品版とモック版の差異を小さくし、またモック版の機能を充実させることができる。

このような背景から、モック版 TTS の後処理を共通化するリファクタリングを提案します。

その際、.forward() の docstring が過剰である(コードとして表現すべき内容を docstring で示している)ことがわかったため、.forward() のリファクタリングを同時におこなった。

関連 Issue

無し

@tarepan tarepan requested a review from a team as a code owner June 22, 2024 07:27
@tarepan tarepan requested review from Hiroshiba and removed request for a team June 22, 2024 07:27
Copy link
Member

@Hiroshiba Hiroshiba left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

LGTM!!

voicevox_engine/dev/tts_engine/mock.py Outdated Show resolved Hide resolved
@Hiroshiba Hiroshiba merged commit 1ee81b6 into VOICEVOX:master Jun 22, 2024
4 checks passed
@tarepan tarepan deleted the refactor/mock_engine_alignment branch June 23, 2024 02:17
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants