Categories
モデル

RNN

概要

 再帰型ニューラルネットワーク(Recurrent Neural Networks、RNN)は、シーケンシャルなデータや時系列データを処理するためのニューラルネットワークの一種です。従前のCNNのような深層学習では、画像データなどを入力としており、入力値のデータサイズは固定でした。しかし、音声認識や翻訳などを扱う問題では、入力データのサイズを固定することは出来ません。短い文章もあれば、長い文章が入力となりえます。入力が可変のものを扱えるようになったモデルがRNNの特徴となります。

 入力のデータサイズを可変にすることが可能になったのは、RNNが、過去の情報を保持しながら現在の入力を処理する仕組みを持っているからです。RNNは、一般的なフィードフォワード型のニューラルネットワークとは異なり、ループ構造を持っています。このループ構造により、RNNは前のステップでの計算結果を次のステップに伝達し、過去の情報を記憶しながら新しい入力を処理します。

 この特性により、RNNはシーケンシャルなデータに対して柔軟に対応できます。文章のようなテキストデータ、音声、時間変動するデータ、さらには株価や天気の予測などの時系列データを扱うのに適しています。