Research

トップページ   研究   感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究

医療機器医用材料部門人間情報処理学分野

感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究

合成音声の品質はDeep Neural Networks(DNN)により飛躍的に性能が向上したものの、感情を高品質に表現できるまでには至っていない。本研究では,人間が発声した音声のように聞こえるものの、言語情報ではなく感情情報を伝えられる方式を提案した。提案方式は、DNNによる音声信号生成アルゴリズム(WaveNet)が、韻律特徴とスペクトル特徴とを同時にモデル化できる点に着目している。学習に用いる感情音声データ量を減らすために2つのステップからなる。第1ステップで大規模な音声コーパスを用いて人間の声らしさの音響特徴を学習し、第2ステップで少量の感情音声を用いて感情表現を再学習する。主観評価実験では、提案方式による合成音声は人に感情を伝えることができ,人間の声のような音と判断されることが示された。

研究室データ

医療機器医用材料部門 人間情報処理学分野
教授 阿部 匡伸
助教 原 直
講師 相田 敏明