音声波形 - fabcross for エンジニア

タグ：音声波形

10万時間のデータを学習し、10億パラメータを持つ音声合成モデル「BASE TTS」を構築　米Amazon

米Amazonは、テキストデータを読み上げるための音声合成技術、「text-to-speech（TTS）」の分野で、新しいモデルを発表した。この技術を同社は「BASE TTS：Big Adaptive Streamabl…
詳細を見る
- Tweet
米マイクロソフト、3秒で声を真似できる音声合成AI「VALL-E」を発表

米マイクロソフトは2023年1月5日、3秒の音声データから話し手の声を学習し、その声でテキストを読み上げることができる言語モデル「VALL-E」をgithubで発表した。従来の音声合成では、音素からメルスペクトロ…
詳細を見る
- Tweet

トップページに戻る

おすすめ記事

最近の投稿

アーカイブ

fabcross

meitec

next

メルマガ登録

ページ上部へ戻る

Copyright © fabcross for エンジニア All rights reserved.