一种交通流量预测方法
技术领域
本发明涉及道路交通监测领域,尤其涉及一种交通流量预测方法。
背景技术
交通流量预测有多种方法,传统方法包括历史平均值算法,整合移动平均自回归模型(ARIMA)算法等。最近由于机器学习的崛起,存在着利用长短时记忆机制(LSTM)和其变体扩散卷积循环神经网络(DCRNN)等新型算法。对于传统算法,大多只考虑交通流量采集点本身的流量信息作为参考给出预测,对于新型的机器学习算法,由于其需要大量的计算资源和计算时间,且一般机器学习算法预测长度较短,如1小时,不能满足交通预测对于快速长时高效的要求。
发明内容
本发明目的是解决现有技术中预测精度不高,数据处理速度较慢的问题,提出一种交通流量预测方法。
本发明提出的一种交通流量预测方法,包括以下步骤:S1、获取交通流量的数据集;S2、对数据集中不同的流量采集点p,计算任意两个流量采集点之间的相关系数,并生成相关系数矩阵
优选地,所述交通流量预测方法还包括步骤S7、对数据集中的各流量采集点进行验证以剔除流量采集点中的噪声点。
优选地,步骤S2中所述相关系数矩阵
其中,
根据各流量采集点的历史流量平均值计算各流量采集点之间的Pearson相关系数;
将获得的所有Pearson相关系数组成相关系数矩阵
优选地,所述背景信息包括以下因素之一:所述背景信息为节假日/工作日因素作用下的时间段;所述背景信息为节假日/工作日以及天气信息因素共同作用下的时间段。
优选地,所述参考点点集RP为与流量采集点p的相关系数大于8的相关流量采集点,且参考点点集RP中相关流量采集点的个数小于等于10。
优选地,步骤S5中获取参考采集点权重的方法包括:由流量采集点p和参考点点集RP构造扩展点集
优选地,步骤S6中获得流量采集点p的交通流量预测值的方法包括:根据背景信息,获取扩展点集
优选地,步骤S7中剔除噪声点的方法包括:将流量采集点p的交通流量预测值vp以及其历史平均预测值均与实际交通流量值相比较,通过平均绝对误差MAE判断流量采集点p是否为噪声点;若流量采集点p的交通流量预测值vp的平均绝对误差MAE较小,则标记该流量采集点为区域划分背景预测点;否则,将该流量采集点认为噪声点。
优选地,对数据集中的各流量采集点进行验证时,所选取的时间维长度与流量采集点p进行交通流量预测所选取的时间维长度不同。
优选地,所述时间维长度为N个以5分钟为一个时间区段的时长,验证时所选取的时间维长度小于进行交通流量预测时所选取的时间维长度。
本发明的有益效果包括:在预测流量采集点的流量时,通过关联流量采集点周围相关节点的流量信息并结合交通流量的历史平均值方法,本发明的交通流量预测方法相较于只考虑流量采集点本身流量信息的现有预测方法,其预测精度相对较高,且不需要大量消耗计算资源,计算速度显著提高。
附图说明
图1是本发明一种交通流量预测方法的流程图。
具体实施方式
下面结合具体实施方式并对照附图对本发明做进一步详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
参照以下附图,将描述非限制性和非排他性的实施例,其中相同的附图标记表示相同的部件,除非另外特别说明。
本实施例提出一种交通流量预测方法,包括以下步骤:
S1、获取交通流量的数据集。
数据集中包括了数个月的交通流量状况,本实施例选取的时间段为2019年2月1日至2019年4月30日,数据采集点为101个,以每5分钟为一个时间区段t,在该时间段采集点累计通过的车流量,将各个采集点的流量记录并汇总生成数据集。对于该数据集,在一些实施例中,选取的时间段中的时间区段t的个数为L(也即为时间维长度),即L=12*24*(28+31+30)=25632,可以将数据集根据时长分为训练集、验证集和测试集,如训练集的时间维长度为L*0.7,验证集的时间维长度为L*0.1,测试集的时间维长度为L*0.2,在此不做限定;不同的时间维长度为N个以5分钟为一个时间区段的不同时长,N=0,1···n。
S2、对数据集中不同的流量采集点p,计算任意两个流量采集点之间的相关系数,并生成相关系数矩阵
用
根据各流量采集点的历史流量平均值计算各流量采集点之间的Pearson相关系数。
将获得的所有Pearson相关系数组成相关系数矩阵
S3、根据相关系数获得与流量采集点p相关的参考点点集RP。
其中,参考点点集RP为与流量采集点p的相关系数大于8的相关流量采集点,且参考点点集RP中相关流量采集点的个数小于等于10。
S4、以背景信息为依据,分别获取流量采集点p和参考点点集RP的历史平均预测值。
其中,背景信息包括以下因素之一:(a)背景信息为节假日/工作日因素作用下的时间段;(b)背景信息为节假日/工作日以及天气信息因素共同作用下的时间段。具体地如:对于(a),以周为单位,一个时间区段为5分钟,每日共存在288个时间区段,计作I=[00:00-00:05,00:05-00:10,...,23:55-0:00],每周7天计作DI=[周一,周二,···,周日],对于某一周天s∈DI,对于某时间区段t∈I,将数据集中所有在s周天t时间段的交通流量拿出来求其平均值,形成流量采集点p的历史平均预测值
S5、获取流量采集点p的参考采集点权重
对于每个流量采集点,取与其相关系数大于0.8且个数不超过10个的其他流量采集点作为参考采集点,可得到一系列点集,形成流量采集点的参考点点集RP={q1,q2···qk}。由流量采集点p和参考点点集Rp构造扩展点集
S6、将参考点点集RP的历史平均预测值、流量采集点p的历史平均预测值和流量采集点的参考采集点权重
根据背景信息,获取扩展点集
上述交通流量预测方法,将相关系数矩阵与流量采集点的流量历史平均值相融合,并根据不同的背景信息,采取不同时期的历史平均值的复合作为历史平均预测值。由于融合了与流量采集点相关的其他节点的流量信息,所以预测精度相较传统算法有所提高。而且由于采用平均值计算所以并不大量消耗计算资源,计算速度相较于机器学习算法有明显优势。
在本实施例中,为了提高预测准确度,交通流量预测方法还包括步骤S7、对数据集中的各流量采集点进行验证以剔除流量采集点中的噪声点。
由数据集生成时间维度上的验证集;将流量采集点p的交通流量预测值vp以及其历史平均预测值均与实际交通流量值相比较,通过平均绝对误差MAE判断流量采集点p是否为噪声点;若流量采集点p的交通流量预测值vp的平均绝对误差MAE较小,则标记该流量采集点为区域划分背景预测点;否则,将该流量采集点认为噪声点。通过上述验证,可以去除掉在进行区域划分时划分进去的噪声点。
其中,对数据集中的各流量采集点进行验证时,所选取的时间维长度与流量采集点p进行交通流量预测所选取的时间维长度不同;验证时所选取的时间维长度小于进行交通流量预测时所选取的时间维长度。
本实施例的一次实际实验数据如下:
某10个采集点采用新方法的预测效果提升值
在本实施例中,采用交通流量预测方法与采用历史平均预测法获得的预测结果相比,预测精度相对于传统方法提高2%~13%,且不消耗计算资源;更能反应路口的区域特征和在不同背景下的流量特征;一般机器学习算法预测长度为1小时,本发明提供的预测方法的预测时长可达数天至数月。有利于交通道路规划及根据不同地区流量预期值,交通管理部门可合理规划交通管理人员的上岗时间和上岗位置。
本领域技术人员将认识到,对以上描述做出众多变通是可能的,所以实施例和附图仅是用来描述一个或多个特定实施方式。
尽管已经描述和叙述了被看作本发明的示范实施例,本领域技术人员将会明白,可以对其做出各种改变和替换,而不会脱离本发明的精神。另外,可以做出许多修改以将特定情况适配到本发明的教义,而不会脱离在此描述的本发明中心概念。所以,本发明不受限于在此披露的特定实施例,但本发明可能还包括属于本发明范围的所有实施例及其等同物。