基于ELM和LSSVM的客流量预测模型

  作者:张克申 安俊峰 孙二杰 赵帅 芦潇 卢萌萌 时间:2018-07-26来源:电子产品世界

编者按:涉及一种基于滚动式地铁人流量混合预测方法,采用的是双预测算法,双预测通道的模式;双预测方法指的是预测用到了ELM神经网络和LSSVM两种算法混合组成。双预测通道指的是采用两个不同的滚动序列基数进行预测。最后根据不同方式确定权重大小,并且得到混合预测数据模型。

作者 张克申1 安俊峰1 孙二杰1 赵帅1 芦潇1 卢萌萌2  1.济南轨道交通集团有限公司(山东 济南 250000)2.山东劳动职业技术学院(山东 济南 250000)

  张克申(1973),男,工程师,研究方向:自动化。

摘要:涉及一种基于滚动式地铁人流量混合预测方法,采用的是双预测算法,双预测通道的模式;双预测方法指的是预测用到了ELM神经网络和LSSVM两种算法混合组成。双预测通道指的是采用两个不同的滚动序列基数进行预测。最后根据不同方式确定权重大小,并且得到混合预测数据模型。

0 引言

  地铁中,客流量分析是一个很重要的领域,客流量的多少直接影响到安全,城市的经济发展等重要因素。地铁的客流量多少对乘客的出行有很大的警示作用。

  AFC(自动售检票)系统可以获得很大的客流量信息,可以进行设置,获得每分钟、每小时、每天、每月、每季度、每年的数据信息,并且可以按照车站每类整理,形成庞大的数据信息,信息量的充足和庞大足够支撑大家去进行分析和预测,并且因为数据量的充足和庞大,可以对感兴趣数据进行分类整合,组成想要的数据信息进行研究。

  收集大量的客流量数据后,以每半年或者每年为单位作为数据统计,有效地去预测未来五年或者未来十年,甚至未来二十年的数据,对于地铁线路的规划,市政建设的布局都有着指导性的作用。

  并且现有的预测算法都是针对于已知的数据进行分析和预测,进而研究一种预测方法去预测未知数据是有必要的。目前存在的预测方法是用已知的数据做研究,即知道数输入数据和输出数据,进行研究和挖掘,但是往往未来的的输入数据是未知的,那么带来预测很大的不方便,但是预测有着很重要的作用。因此针对未知数据的预测是个有力的应用。

  本文提出一种基于滚动式地铁人流量混合预测方法,并且将数据传递给AFC系统,由AFC系统来完成相关的预警信号。

1 原理简介

1.1 ELM神经网络

  ELM是一个神经网络的形式,结构由输入层、隐含层和输出层构成,具有局部记忆模块和局部反馈连接的前向形式的神经网络。具有训练速度快,误差不大,不容易陷入到局部最优值的特点。

  其中带有m个隐含层节点的ELM的网络结构式(1)所示:

  其中pi、qi是学习参数,ni是连接第i个隐含层节点与输出层之间的权重,表示的是当输入是X的时候,第i个隐含层节点的输出数值。

1.2 LSSVM介绍

  LS-SVM和SVM有很重要的联系和区别,下面有所比较。

  (1)优化问题的构造

  SVM目标函数采用了误差因子的一次项,LS-SVM采用了误差因子的二次项,同时约束条件的先定下,SVM采用不等式约束,LS-SVM采用等式约束形式。

  (2)优化问题的求解

  SVM求解QP问题中,变量维数和训练样本的个数是一样的,而LS-SVM方法借助求解线性方程组达到了最终的决策函数,在某些方面上降低了求解难度,提高速度。

  (3)解的稀疏性

  SVM中,需要解决QP问题,目标条件是达到全局最优解,并且,大部分的Lagrange乘子均为0。在LS-SVM方法中,目标函数采取了误差平方项,约束条件是等式,通过一定的处理方式,把SVM的QP问题转化成线性问题,因此Lagrange乘子与误差项成比例关系,但是LS-SVM方法通过对最终求解得到的Lagrange乘子进行排序,同样的情形下,可以实现解的稀疏性。

2 具体实施过程

2.1 整体构架

  本文主要涉及双通道、双预测模型,如图1所示,主要包括以下步骤:

  (1)从AFC(地铁中的自动售票系统)获得整理出人流量数据。

  (2)双通道预测的过程,具体操作如下:

  (a)比如采样频率为1,组成序列为A,滚动序列 [A1,A2,A3,..An],预测第(n+1)个数据,然后用预测的结果A(n+1)与原来的序列[A1,A2,A3,..An]组成新的序列[A1,A2,A3,..An,A(n+1)],用新的序列预测第(n+2)个数据。以此类推,得到一个通道的预测数据,此种方式记成通道1。

  (b)开始选择的滚动序列基数是[A2,A3,……An]一共(n-1)个数据,预测第(n+1)个数据,然后用预测的结果A(n+1)与原来的序列[A2,A3,..An]组成新的序列[A2,A3,..An,A(n+1)],用新的序列预测第(n+2)个数据。以此类推,得到一个通道的预测数据,此种方式记成通道2。

  值得一提的是,上述的(a)、(b)步骤中选择的基数不一定是[A1,A2,A3,..An]、[A2,A3,..An]等这样的数列,也可以采用别的[A2,A3,..An]、[A3,..An]等形式。

  (3)进行决策获得未来预测数据的过程,具体操作如下:

  通过上述步骤(2)的(a)、(b)两个步骤,我们可以得到针对通道1 通道2的两个预测数据序列。在这里,通道1的预测数据记成[A(n+1),A(n+2)……A(n+m)],通道2的预测数据记成[Ab(n+1),Ab(n+2)……Ab(n+m)];与上述的两个通道的序列求加权平均作为最后的预测结果,即(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)]),其中w1和w2是ELM神经网络和LSSVM的权重。

2.2 通道预测模型和确定

  假设滚动序列 [A1,A2,A3,..An]预测第(n+1)个数据,用ELM得到的结果是AA(n+1),svm预测得到的是AB(n+1),取加权平均数作为第(n+1)个数据的预测结果,记A(n+1)=(AA(n+1)+ AB(n+1))/2),然后用预测的结果A(n+1)与原来的序列[A1,A2,A3,..An]组成新的序列[A1,A2,A3,..An,A(n+1)],用新的序列预测第n+2个数据;用ELM得到的结果是AA(n+2),LSSVM预测得到的是AB(n+2)。那么取加权平均数作为第(n+2)个数据的预测结果,记A(n+2)=(AA(n+2)+ AB(n+2))/2),以此类推。

  假设滚动序列 [A2,A3,..An]预测第(n+1)个数据,用ELM得到的结果是AA(n+1),LSSVM预测得到的是AB(n+1),那么取加权平均数作为第(n+1)个数据的预测结果,记A(n+1)=(AA(n+1)+ AB(n+1))/2),然后用预测的结果A(n+1)与原来的序列[A2,A3,..An]组成新的序列[A2,A3,..An,A(n+1)],用新的序列预测第(n+2)个数据;用ELM得到的结果是AA(n+2),LSSVM预测得到的是AB(n+2),取加权平均数作为第(n+2)个数据的预测结果,记A(n+2)=(AA(n+2)+ AB(n+2))/2),以此类推。

  通过上述两个步骤,我们可以得到针对通道1 通道2得到的两个预测数据序列,在这里通道1的预测数据记成[A(n+1),A(n+2)……A(n+m)];通道2的预测数据记成[Ab(n+1),Ab(n+2)……Ab(n+m)];与上述的两个通道的序列求加权平均作为最后的预测结果,也就是(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+ w2*[A(n+1),A(n+2)……A(n+m)])。其中,w1和w2是ELM神经网络和LSSVM的权重,其中本文按照2.3的方法,得出的权重w1=0.49,w2=0.51。

2.3 关于权重的确立方法

  (1)标准差法确定权重:

  本文确定权重的步骤如下:

  (1)选取i个数据做训练,得到真实值和预测值,其中ELM的预测值看成E1,E2,…Ei,LSSVM的预测值看成l1,l2,…li,真实值为R1,R2,…Ri;

  (2)按照公式(2),确定ELM和LSSVM的权重w1,w2;

  (3)按照公式(4),确定ELM和LSSVM的权重w3,w4;

  (4)计算混合模型的误差平方和,按照公式(5):

(5)

  其中按照w1,w2两种权重得的混合模型的误差平方和是f1,按照w3,w4两个权重得到混合模型的误差平方和是f2。

  (5)比较上述步骤f1、f2,如果f1f2,那么最后权重选择w3、w4。

2.4 预测结果

  图3、图4、图5是本文经过编程预测得到的数据结果,分别是通道1、通道2及最终决策的预测结果。

3 结论

  采用本文方案与现有技术相比,具有以下的优点和积极效果:

  (1)有AFC系统提供相应的客流量数据信息,然后有预测方案进行双通道预测,预测得到的信息传递给AFC系统,并且如果客流量达到很大的高峰时候,进而进行相关的预警信息,由AFC系统提前告知乘客,或许有相关的拥挤预报,请乘客提前选择交通方式。

  (2)本文采用网络的数据流量进行数据整合和挖掘,对于现有的数据进行整理,然后用这些数据进行对于未来未知的数据进行预测,是一个相当可观的使用方法。

  (3)应用本文方案可以对五年、十年乃至二十年的城市地铁的人流量进行预测,提前做好规划,对于地铁设计和城市布置有着很重要的预测和导向作用。

  本文所涉及的方法不是针对现在有的数据进行试验,而是对未来不知道的数据进行预测和分析,同样适用于相关的金融市场,比如股票未来的走势预测、基金的预测、未来人类的寿命预测等具有很大的参考价值和实际意义。

  参考文献:

[1]Zhao Z, Chen Z, Chen Y, et al. A Class Incremental Extreme Learning Machine for Activity Recognition[J]. Cognitive Computation, 2014:1-9.

  [2]Bueno-Crespo A, Garcia-Laencina P J, Sancho-Gomez J L. Neural architecture design based on extreme learning machine [J]. Neural Networks, 2013,48:1924 Sunday H, Silver D, Gagvani N, et al. Skeleton based shape matching and retrieval[C].Shape Modeling International, 2003,IEEE, 2003:130-139

  [3]熊南,刘百芬.基于自适应粒子群优化LSSVM的网络流量在线预测[J].计算机应用与软件,2013,30(9):21-24.

  [4]叶美盈,汪晓东,张浩然.基于在线最小二乘支持向量机回归的混沌时间序列预测[J].物理学报,2005,54(6):2568-2573.

  [5]张文金,许爱军.混沌理论和LSSVM相结合的网络流量预测[J].计算机工程与应用,2013,49(15):101-104.

  [6]Huang G B,Siew C K. Extreme learning machine with randomly assigned RBF kernels[J]. International Journal of Information Technology,2005,11(1):16-24.

  [7]李彬,李贻斌.基于ELM 学习算法的混沌时间序列预测[J],天津大学学报, 2011,44(8):701-704.

  [8]李海波,郑秀萍,柴天佑.浮选工艺指标KPCA-ELM 软测量模型及应用[J].化工学报,2012,33(1):4-8.

  [9]周传世,刘永清.变权重组合预测模型的研究[J].预测,1995,(4),47-48.

  [10]王志勇,陈昊鹏.基于组合神经网络模型的函数逼近方法[J].计算机应用与软件,2008(7),137-139.

  本文来源于必威娱乐平台 2018年第8期第64页,欢迎您写论文时引用,并注明出处。

关键词: ELM LSSVM 滚动 权重 混合 201808

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版