株式会社エーアイ(本社:東京都文京区、代表取締役社長:廣飯 伸一、証券コード:4388、以下、エーアイ)は、音声合成品質の向上を目指し継続しておりました研究開発の成果として、新しい音声合成技術を活用したエンジン「AITalkⓇ6」を発表いたします。
AITalk6ではAITalk5で搭載した「DNN音声合成方式」の検証や新たな学習を積み重ね、品質改善を行った結果、より自然性の向上した音声合成を実現しました。
AITalk6ではAITalk5で搭載した「DNN音声合成方式」の検証や新たな学習を積み重ね、品質改善を行った結果、より自然性の向上した音声合成を実現しました。
-
主な改善ポイント
①音声生成法の変更(ボコーダーからニューラルボコーダーへ)
信号処理による音声生成法(ボコーダ)をニューラルネットワークによる音声生成法(ニューラルボコーダ)に変更する事により、より自然で肉声感のある音声を合成できるようになりました。
②ニューラルネットワークの構造変更
AITalk5では、軽量で高速な処理を実現するため音声特徴量を生成するニューラルネットワークは簡素な構造を採用していました。
今回AITalk6で採用したニューラルネットワークは、韻律モデルと音響モデルを統合し、音素や時間フレームの情報を短期や長期で考慮する構造を採用することで、従来よりも自然な音声に近い音声特徴量を生成できるようになりました。
実際の変化につきましては、以下より音声をご確認下さい。
エーアイ、進化した新世代DNN音声合成エンジン「AITalk6」を発表。品質が向上し、自然で豊かな表現が可能に。 | トピックス | 音声合成ソフトは株式会社エーアイ
株式会社 エーアイ(AI)の「AITalk®(エーアイトーク)」は、従来の機械音ではなく、人の声で合成する技術、コーパスベース音声合成方式を採用し、感情表現にも対応。より人間らしく自然な音声で自由に音声合成をすることが可能な、高品質音声合成エンジンです。
-
AITalk6の製品展開について
今後、以下の製品・サービスに順次展開してまいります。
・A.I.VOICE
・AITalkSDK
・AITalkServer
・AICloudサービス
・Editor製品