物理リザバー・コンピューティングによる高精度音声認識を実証――強誘電体トランジスタを用いたAI計算の新方式を開発 東大

東京大学は2022年6月13日、強誘電体トランジスタを用いた物理リザバー・コンピューティングによる機械学習方式で、95%以上の高精度での音声認識に成功したと発表した。

AI計算の効率向上や低消費電力化のために、AI計算のハードウェア化やエネルギー効率向上が求められている。高いエネルギー効率で学習可能で、時系列データ処理を得意とする物理リザバー・コンピューティングが注目されているが、これまで実用性の高いデバイスや高効率な計算方法が確立されていなかった。

物理リザバー・コンピューティングは、リカレントニューラルネットワークの特殊モデルとして発展した時系列情報処理に適した機械学習の1つであるリザバー・コンピューティングにおいて、ソフトウェアによるニューラルネットワークで構成されるリザバー部を、高次元の非線形ダイナミクスを持つ材料やデバイスなどのハードウェアで置き換えたものだ。

今回の研究では、酸化ハフニウム系強誘電体材料を用いた強誘電体トランジスタ(FeFET)を用いて、並列データ処理による物理リザバー・コンピューティングの新たな方法を開発した。FeFETはゲート絶縁体に強誘電体を取り入れて、論理演算と不揮発性メモリーの両方の機能を備えた素子だ。

HZO/Si FeFETの素子構造(左)と電流-ゲート電圧特性(右)(ゲート絶縁膜として、HZO膜を用いることで、MOSFETの電気特性にHZO膜中の電気分極の効果が表れる)

従来の方法とは異なった、FeFETのドレイン電流、ソース電流、基板電流の3つの電流成分の時間応答を組み合わせて学習/推論する方式を採用。応答を計測する時間刻みの最適化や時系列アナログ入力信号の適用、異なる周波数チャンネルの組み合わせによる多数決方式の採用などによって、音声認識の精度が大幅に向上することを実験的に示した。0から9までの数字の音声認識で、ソフトウェアでのリザバー計算と同等の95.5%の認識精度を実現した。

音声数字認識タスクのためのFeFETリザバー・コンピューティングと認識精度向上のためのアプローチの概念図(音声データは、コクログラムと言われる多くの周波数チャネルに分割された時系列データに変換できる)

今回の研究結果は、特にエッジコンピューティングなどに適した、学習負荷が軽く時系列情報処理が得意な物理リザバーコンピューティングの実用化への方向性を具体的に示すものとなる。また、これによりAIハードウェアシステム技術の発展が期待されるという。

関連リンク

プレスリリース

関連記事

アーカイブ

fabcross
meitec
next
メルマガ登録
ページ上部へ戻る