- できること
- はじめに
- ClariNetとは
- Autoregressive WaveNet
- Student Gaussian IAF
- Text-to-Wave Model
- さいごに
できること
この記事では、次のことができるようになります。
- Parallel WaveNetを使ったメルスペクトログラムボコーダーの学習
この記事では、次のことができるようになります。
こんにちは、@dhgrsです。以前こんな記事を書きました。
www.monthly-hack.com
本記事は、このプロジェクトの前処理編です。
こんにちは、dhgrsです。3月に研究室の先生の退官パーティがあったのですが、現役時代に代が被っていない先輩(つまりほぼ初対面の先輩)に「声優統計コーパス使った音声合成楽しみにしているよ」と言われてびっくりしました。詳しくお話を聞いてみるとどうやら声優統計コーパスを作成した声優統計学会というサークルの関係者だったようで、改めて色々なことをやっている人がいる面白い研究室だったなと思ったりしていました。
そのあと声優統計コーパスを使ったVQ-VAEを結構試したのですが、話者の違いはまだしも、感情付与がかなり難しいようで思うような成果がでなかったです。もっと粘って色々試してみてもいいのですが、費用対効果も悪いので、別の方向で声優統計コーパスを使ってみることにしました。本記事では、声優統計コーパスが音声合成屋の視点から見てどういうデータセットかの簡単なまとめと、今後僕がやろうとしていることを紹介します。
この記事では、次のことができるようになります。