世界一わかりやすいLSTMに関する補論


The Easiest Explanation of LSTM.


LSTM(Long Short-Term Memory)とはニューラルネットワーク、すなわち人間の脳のニューロンを数学的に単純化したモデルに基づいて作られたAIモデルの一種であり、時間を軸にした処理をテーマに取り開発されたアルゴリズムです。このLSTMは、「必要な情報だけに絞って長期的に記憶する」と言うコンセプトで作られており、時系列データへの高い適応能力を発揮します。つまり、データをシーケンスとして取り込んで、その予測や生成にも応用できるのです。

従来のRNN(Recurrent Neural Network)は、LSTMと同じように、時系列データを上手く取り扱えるものの、長い過去の情報を忘れてしまう「勾配消失問題」という課題がありました。具体的に言うと、RNNは回帰型のニューラルネットワークで、内部にループ構造を持っているのが特徴です。その特徴故の問題がこの「勾配消失問題」なわけですが、LSTMは、このRNNの欠点を長期記憶を可能にすることで改善しています。もちろん、メリットだけではありません。

LSTMは、回帰型ニューラルネットワークと違い、入力ゲート・忘却ゲート・出力ゲートから構成される機構を導入することでこの「勾配消失問題」を緩和していて、長期的な依存関係の保持を可能にしているのですが、その一方で、構造が複雑であるため、計算量やパラメータ数が増大するという欠点があります。さらには、弾き出す計算のための時間も膨大になるということもデメリットです。

LSTMは中長期的な予測や生成に適している形を取っており、需要予測・株価予測・経営予測などに使われる応用AIの技術でもあります。もちろん、ゲーム分野にも使えるでしょう。人間らしさのあるゲームAIの実装(模倣学習)にも使えるでしょうし、プレイヤーの行動予測・チート検知にも使えるでしょう。また、ローグライクゲームにおけるダンジョン生成や、RPGにおけるストーリーの自動生成にも使えるはずです。

このように、LSTMの持つ可能性はとても広いです。その真価が認めらえるまでには15年という長い時間がかかった技術ですが、汎用性が高く、応用局面は多種多様であることはご理解いただけたと思います。そして、恐らく、ゲヲログでは単なる株価の予測にこれを直接的に使用することはないでしょう。あくまでテキストの生成後、間接的に何か未来予知へのキーを紐解きたい…これがゲヲログの総意です。きっとLSTMは、その未来への扉を開く一つの重要ファクターになることでしょう。