内容简介:时间序列是对某一个或者一组变量 x(t) 进行观察测量,将在一系列时刻 t1,t2,⋯,tn 所得到的离散数字组成的序列集合。时间序列预测的机器学习的一种常见应用,例如预测股票和金融产品价格走势, 温度,天气的走势等等传统的统计学时间序列预测的一些方法包括:
时间序列是对某一个或者一组变量 x(t) 进行观察测量,将在一系列时刻 t1,t2,⋯,tn 所得到的离散数字组成的序列集合。
时间序列预测的机器学习的一种常见应用,例如预测股票和金融产品价格走势, 温度,天气的走势等等
传统的统计学时间序列预测的一些方法包括:
但是这些传统的基于统计的方法用起来并不方便,你可能需要利用ACF/PACF找到一些时序数据的规律然后设置超参数来进行时序数据的分析。
facebook开源的 prophet 是另一个选择,利用prophet来进行时许数据的分析比较简单,但是本质上,prophet是基于另一盒开源工具 pystan ,仍然是基于统计来进行时序数据的分析。
利用深度神经网络,例如LSTM,我们也可以很方便的进行时序数据的分析,那么我们就看看如可利用TensorflowJS来进行时序数据的分析吧。
数据导入
我们要分析的 数据集 是一组模拟的航空旅客的数据信息,如下图:
这组数据可以看成一个线性模型和一个震荡模型(正余弦)的叠加,我们看看LSTM能不能学习出这个规律。
async function loadData(path) { return await d3.csv(path); } const airPassagnerData = await loadData( "https://cdn.jsdelivr.net/gh/gangtao/datasets@master/csv/air_passengers.csv" );
数据准备
在数据准备阶段,我们要为我们的LSTM模型准备训练数据。
首先我们对数据进行做一个标准化操作:
// Normalize data with value change let changeData = []; for (let i = 1; i < airPassagnerData.length; i++) { const item = {}; item.date = airPassagnerData[i].Date; const val = parseInt(airPassagnerData[i].Number); const val0 = parseInt(airPassagnerData[i - 1].Number); item.value = val / val0 - 1; changeData.push(item); }
也就是把绝对数据变成涨跌的百分比,标准化后的数据都在 -1 和 +1之间,反映了数据相对于前一个时间点的涨跌。
然后就是就是准备训练数据了,在准备训练数据之前,我们要理解一下LSTM的输入数据的形状:
LSTM需要一个三维的数据输入,分别对应Batch(数据是一批一批进入神经网络训练),Input是输入数据的size和Timestep,时间。所以我们在构造训练数据的时候,需要针对时间维度创建训练数据。
const STEP_SIZE = 3; const STEP_NUM = 24; const STEP_OFFSET = 1; const TARGET_SIZE = 12; function buildX(data, stepSize, stepNum, stepOffset) { let xData = []; for (let n = 0; n < stepNum; n += 1) { const startIndex = n * stepOffset; const endIndex = startIndex + stepSize; const item = data.slice(startIndex, endIndex).map(obj => obj.value); xData.push(item); } return xData; } function makeTrainData(data, stepSize, stepNum, stepOffset, targetSize) { const trainData = { x: [], y: [] }; const length = data.length; const xLength = stepSize + stepOffset * (stepNum - 1); const yLength = targetSize; const stopIndex = length - xLength - yLength; for (let i = 0; i < stopIndex; i += 1) { const x = data.slice(i, i + xLength); const y = data.slice(i + xLength + 1, i + xLength + 1 + yLength); const xData = buildX(x, stepSize, stepNum, stepOffset); const yData = y; trainData.x.push(xData.map(item => item)); trainData.y.push(yData.map(item => item.value)); } return trainData; } const trainData = makeTrainData( changeData, STEP_SIZE, STEP_NUM, STEP_OFFSET, TARGET_SIZE );
这里我们利用滑动时间窗口的方法来构建训练数据,用到了以下几个参数:
- STEP_SIZE
这个是数据窗口的大小,3表示每一个数据包含三个值,数据input维度就是3 - STEP_NUM
这个是一共要走多少步,24表示走24步,那个Time维度就是24 - STEP_OFFSET
这个offset决定了时间窗口向前移动的时候,每次走多少个时间单位,我这里取1,也就是每次走一步,这样第一个数据和第二个数据其实存在两个重复值。 - TARGET_SIZE
这个是我要预测的时间长度,12表示预测12个月的数据。
模型构建
模型的构建代码如下:
function buildModel() { const model = tf.sequential(); //lstm input layer const hidden1 = tf.layers.lstm({ units: LSTM_UNITS, inputShape: [STEP_NUM, STEP_SIZE], returnSequences: true }); model.add(hidden1); //2nd lstm layer const output = tf.layers.lstm({ units: TARGET_SIZE, returnSequences: false }); model.add(output); model.add( tf.layers.dense({ units: TARGET_SIZE }) ); model.add(tf.layers.activation({ activation: "tanh" })); //compile const rmsprop = tf.train.rmsprop(0.005); model.compile({ optimizer: rmsprop, loss: tf.losses.meanSquaredError }); return model; }
我们的网络一共有两个LSTM层,一个Dense层和一个激活层。优化器我们选择了 rmsprop ,损失函数是mse,因为我们其实一个回归模型。
利用TensorflowJS提供的模型导出功能,我们可以导出训练好的模型,并利用 Netron (一个神经网络可视化工具,支持各种神经网络)来查看我们的模型。
const saveResults = await model.save('downloads://model-name');
我第一次用Netron的时候,TensorflowJS导出的JSON模型有错误,我给作者提了一个 Issue ,当天修复,赞一个!
模型训练
训练数据和模型都准备好了,下一步我们就开始训练了。
async function trainBatch(data, model) { const metrics = ["loss", "val_loss", "acc", "val_acc"]; const container = { name: "show.fitCallbacks", tab: "Training", styles: { height: "1000px" } }; const callbacks = tfvis.show.fitCallbacks(container, metrics); console.log("training start!"); tfvis.visor(); const epochs = config.epochs; const results = []; const xs = tf.tensor3d(data.x); const ys = tf.tensor2d(data.y); const history = await model.fit(xs, ys, { batchSize: config.batchSize, epochs: config.epochs, validationSplit: 0.2, callbacks: callbacks }); console.log("training complete!"); return history; } const trainData = makeTrainData( changeData, STEP_SIZE, STEP_NUM, STEP_OFFSET, TARGET_SIZE ); const model = buildModel(); model.summary();
为了监控训练的过程,我们使用了 tfvis ,它在DOM中提供了一个可视化的框架,可以很方便的监控训练过程。
我们发现,从开始到第30的迭代,损失指标有明显的下降,这正是我们希望看到的,30个迭代后,损失下降的不明显。
预测
最后我们可以预测了,注意预测的时候,我们需要把标准化的涨跌数据还原为实际的值。
async function predict(model, input) { const prediction = await model.predict(tf.tensor([input])).data(); return prediction; } const inputStart = changeData.length - X_LEN; const inputEnd = changeData.length; const input = changeData.slice(inputStart, inputEnd); const predictInput = buildX(input, STEP_SIZE, STEP_NUM, STEP_OFFSET); const prediction = await predict(model, predictInput); // re-constructe predicted value based on change const base = airPassagnerData[airPassagnerData.length-1]; const baseDate = moment(new Date(base.Date)); const baseValue = parseInt(base.Number); let predictionValue = []; let val = baseValue; for( let i = 0; i < prediction.length; i+=1) { const item = {}; const date = baseDate.add(1, 'months'); item.time = moment(date).format('YYYY-MM-DD'); item.value = val + val * prediction[i]; item.isPrediction = "Yes"; predictionValue.push(item); val = item.value; } console.log(predictionValue); let airPassagnerDataWithPrediction = []; chartData.forEach(item => { item.isPrediction = "No"; airPassagnerDataWithPrediction.push(item); }) predictionValue.forEach(item => { airPassagnerDataWithPrediction.push(item); })
上图是训练了一个迭代后的结果。
上图是10个迭代后的结果。
上图是我训练30个迭代后的结果,感觉LSTM很好的学习到了趋势和震荡。有兴趣的同学可以去跑我在Codepen上的 代码 。或者我的 gist
总结
本文提供了一个使用LSTM来预测时间序列的例子。有一些经验分享给大家:
- 对于输入数据,一开始是的size是1,但是训练的效果很差,为了有好的训练效果,把Size增加到3,结果很不错。
- LSTM会有梯度消失的问题,如果选择合适的网络结构,参数需要有相当的经验和尝试。
- 在本文的问题中,复杂和更深的网络并不能带来效果的明显提升。
- 我们利用窗口滑动获取训练数据的过程和卷积操作很想,据说利用CNN也可以达到不错的效果,有兴趣的同学可以试一下。
参考
- 如何理解自相关和偏自相关图
- 知乎话题:时间序列建模问题,如何准确的建立时间序列模型?
- 金融时间序列分析入门【一】 【二】 【三】 【四】
- 时间序列分析----结合ARMA的卡尔曼滤波算法
- Understanding Input and Output shapes in LSTM | Keras
- Time Series Forecasting with the Long Short-Term Memory Network in Python
- Understand the Difference Between Return Sequences and Return States for LSTMs in Keras
- Deep Learning Model View Netron
- tfjs-model-view
- Time Series Prediction with LSTM Recurrent Neural Networks in Python with Keras
- https://How to Develop LSTM Models for Time Series Forecasting
- TIME SERIES PREDICTION USING LSTM DEEP NEURAL NETWORKS
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Game Engine Architecture, Second Edition
Jason Gregory / A K Peters/CRC Press / 2014-8-15 / USD 69.95
A 2010 CHOICE outstanding academic title, this updated book covers the theory and practice of game engine software development. It explains practical concepts and techniques used by real game studios,......一起来看看 《Game Engine Architecture, Second Edition》 这本书的介绍吧!