タグ:音声波形
-
10万時間のデータを学習し、10億パラメータを持つ音声合成モデル「BASE TTS」を構築 米Amazon
米Amazonは、テキストデータを読み上げるための音声合成技術、「text-to-speech(TTS)」の分野で、新しいモデルを発表した。この技術を同社は「BASE TTS:Big Adaptive Streamabl…詳細を見る -
米マイクロソフト、3秒で声を真似できる音声合成AI「VALL-E」を発表
米マイクロソフトは2023年1月5日、3秒の音声データから話し手の声を学習し、その声でテキストを読み上げることができる言語モデル「VALL-E」をgithubで発表した。 従来の音声合成では、音素からメルスペクトロ…詳細を見る