Pytorch 怎么實現(xiàn)LSTM時間序列預測？

退役魔法少女 2021-08-07 10:55:44 瀏覽數(shù) (4842)

反饋

LSTM是一種RNN模型的優(yōu)化方案，它可以解決普通的RNN對于長期依賴問題效果比較差的問題。今天我們就以時間序列預測為案例，來介紹一下pyrotch怎么實現(xiàn)LSTM吧。

開發(fā)環(huán)境說明：

Python 35

Pytorch 0.2

CPU/GPU均可

1、LSTM簡介

人類在進行學習時，往往不總是零開始，學習物理你會有數(shù)學基礎、學習英語你會有中文基礎等等。

于是對于機器而言，神經(jīng)網(wǎng)絡的學習亦可不再從零開始，于是出現(xiàn)了Transfer Learning，就是把一個領(lǐng)域已訓練好的網(wǎng)絡用于初始化另一個領(lǐng)域的任務，例如會下棋的神經(jīng)網(wǎng)絡可以用于打德州撲克。

我們這講的是另一種不從零開始學習的神經(jīng)網(wǎng)絡——循環(huán)神經(jīng)網(wǎng)絡（Recurrent Neural Network, RNN），它的每一次迭代都是基于上一次的學習結(jié)果，不斷循環(huán)以得到對于整體序列的學習，區(qū)別于傳統(tǒng)的MLP神經(jīng)網(wǎng)絡，這種神經(jīng)網(wǎng)絡模型存在環(huán)型結(jié)構(gòu)，

具體下所示：

RNN神經(jīng)結(jié)構(gòu)

上圖是RNN的基本單元，通過不斷循環(huán)迭代展開模型如下所示，圖中ht是神經(jīng)網(wǎng)絡的在t時刻的輸出，xt是t時刻的輸入數(shù)據(jù)。

這種循環(huán)結(jié)構(gòu)對時間序列數(shù)據(jù)能夠很好地建模，例如語音識別、語言建模、機器翻譯等領(lǐng)域。

梯度鏈式法

但是普通的RNN對于長期依賴問題效果比較差，當序列本身比較長時，由于神經(jīng)網(wǎng)絡模型的訓練是采用backward進行，在梯度鏈式法則中容易出現(xiàn)梯度消失和梯度爆炸的問題，需要進一步改進RNN的模型結(jié)構(gòu)。

針對Simple RNN存在的問題，LSTM網(wǎng)絡模型被提出，LSTM的核心是修改了增添了Cell State，即加入了LSTM CELL，通過輸入門、輸出門、遺忘門把上一時刻的hidden state和cell state傳給下一個狀態(tài)。

如下所示：

LSTM法

遺忘門：ft = sigma(Wf*[ht-1, xt] + bf)

輸入門：it = sigma(Wi*[ht-1, xt] + bi)

cell state initial: C't = tanh(Wc*[ht-1, xt] +bc)

cell state: Ct = ft*Ct-1+ itC't

輸出門：ot = sigma(Wo*[ht-1, xt] + bo)

模型輸出：ht = ot*tanh(Ct)

LSTM有很多種變型結(jié)構(gòu)，實際工程化過程中用的比較多的是peephole，就是計算每個門的時候增添了cell state的信息，有興趣的童鞋可以專研專研。

上一部分簡單地介紹了LSTM的模型結(jié)構(gòu)，下邊將具體介紹使用LSTM模型進行時間序列預測的具體過程。

2、數(shù)據(jù)準備

對于時間序列，本文選取正弦波序列，事先產(chǎn)生一定數(shù)量的序列數(shù)據(jù)，然后截取前部分作為訓練數(shù)據(jù)訓練LSTM模型，后部分作為真實值與模型預測結(jié)果進行比較。正弦波的產(chǎn)生過程如下:

SeriesGen(N)方法用于產(chǎn)生長度為N的正弦波數(shù)值序列；

trainDataGen(seq,k)用于產(chǎn)生訓練或測試數(shù)據(jù)，返回數(shù)據(jù)結(jié)構(gòu)為輸入輸出數(shù)據(jù)。seq為序列數(shù)據(jù)，k為LSTM模型循環(huán)的長度，使用1~k的數(shù)據(jù)預測2~k+1的數(shù)據(jù)。

數(shù)據(jù)準備

3、模型構(gòu)建

Pytorch的nn模塊提供了LSTM方法，具體接口使用說明可以參見Pytorch的接口使用說明書。此處調(diào)用nn.LSTM構(gòu)建LSTM神經(jīng)網(wǎng)絡，模型另增加了線性變化的全連接層Linear()，但并未加入激活函數(shù)。由于是單個數(shù)值的預測，這里input_size和output_size都為1.

模型構(gòu)建