一种公交到站时间预测方法
文献发布时间:2024-04-18 19:58:30
技术领域
本发明属于公交到站时间预测技术领域,具体涉及一种公交到站时间预测方法。
背景技术
机动车保有量的不断增加,在给人们带来方便的同时也伴随着出现了一系列交通问题。同时,汽车排放尾气还会产生大量污染环境的物质,尤其是在当今“碳中和碳达峰”的时代背景下,抑制机动车保有量的增长,大力发展公共交通,提高公交出行比例显得尤为重要。但是一直以来公交使用率却没有得到很大的提高,原因是公交延误较严重,等待公交的时间较长。因此,有必要提升公交到站时间预测的准确性来吸引更多的公交出行。
现有技术利用LSTM神经网络预测公交的到站时间,然而训练LSTM神经网络的过程中,需要人工进行调参,对于一些复杂的模型参数组合和配置问题,人工调整参数往往难以达到最优效果,导致预测效果不佳。
发明内容
为了克服上述现有技术存在的不足,本发明提供了一种公交到站时间预测方法。
为了实现上述目的,本发明提供如下技术方案:
一种公交到站时间预测方法,包括:
获取公交班次、对应公交班次在各个站点之间的运行距离以及对应的行走时间作为公交到站GPS数据集,将公交到站GPS数据集分为训练集和测试集;
通过海鸥算法对LSTM神经网络的模型参数进行调优,并通过公交到站GPS数据集对调优后的LSTM神经网络进行训练,获得能够预测公交到站时间的LSTM神经网络;
将实时公交到站GPS数据输入能够预测公交到站时间的LSTM神经网络中,获得公交到站时间;
其中,所述通过海鸥算法对LSTM神经网络的模型参数进行调优,具体包括:
随机生成一组LSTM神经网络的初始模型参数;
将LSTM神经网络的初始模型参数作为海鸥算法中海鸥的位置参数;
将每一只海鸥的位置参数作为LSTM神经网络的模型参数输入LSTM神经网络中;
将训练集输入LSTM神经网络对LSTM神经网络进行训练,当LSTM神经网络输出的结果与预期值的均方差M1最小时,得到第一LSTM神经网络;将测试集输入第一LSTM神经网络中,求出第一LSTM神经网络的输出值与期望值的均方差M2;将M2作为海鸥算法中海鸥的适应度;
如果海鸥中最小的适应度大于阈值,调整海鸥的位置参数,直到海鸥中最小的适应度小于阈值;将海鸥中最小的适应度所对应的海鸥的位置参数作为LSTM神经网络的最优模型参数。
进一步,所述将LSTM神经网络的初始模型参数作为海鸥算法中海鸥的位置参数包括:
将初始模型参数中,LSTM神经网络的学习率作为不与相邻海鸥冲突的新位置;
将初始模型参数中,LSTM神经网络的迭代次数作为最佳海鸥位置所在的方向;
将初始模型参数中,LSTM神经网络的第一隐藏层的节点数作为海鸥与最佳海鸥之间的距离;
将初始模型参数中,LSTM神经网络的第二隐藏层的节点数作为海鸥的最优位置。
进一步,所述调整海鸥的位置参数;包括:
根据海鸥的适应度P
计算其余海鸥的位置
其中,k表示当前迭代次数;f
计算海鸥新的攻击位置
r
其中,r是海鸥进行攻击行为时螺旋飞行的半径;θ为[0,2π]区间内的随机角度值;u和v是常数;e是自然对数的底数;a是常数,取值为2;r
更新海鸥的最优位置和适应值;
对最优位置进行扰动,并确定新的海鸥的最优位置:
其中,TD(z)表示自由度参数为z的t分布;ω为自适应参数;c=0.1,b=1;K
进一步,所述公交GPS数据集还包括:
公交运行方向、运行时间、天气的温度、天气的相对湿度、1小时降水量。
进一步,所述公交班次在各个站点之间的运行距离为:
其中,Δd为两个GPS数据点之间的距离;R为地球半径,取6371km;
进一步,还包括:将输入变量中各站公交到站时间与天气影响因素通过时间同步进行对应,输入变量为:
式中:x
进一步,获取公交班次、对应公交班次在各个站点之间的运行距离以及对应的行走时间作为公交到站GPS数据集后,将公交到站GPS数据集分为两个不同的运行方向,将每个运行方向的运行时间分为早高峰、平峰及晚高峰。
进一步,所述早高峰、平峰及晚高峰的影响因素包括:人数、车辆数、道路环境、公交所经交叉口数量、各站台形式、天气。
本发明提供的一种公交到站时间预测方法具有以下有益效果:
本发明利用LSTM神经网络来预测公交到站时间,在训练LSTM神经网络时,将LSTM神经网络的参数作为海鸥的位置参数,将LSTM神经网络测试集的均方差作为海鸥的适应度,利用海鸥算法寻找最优的模型参数组合;其不仅能够可以自动寻找最优模型参数组合,大大减少人工调参的工作量,同时能够提高LSTM神经网络的性能。训练好的LSTM神经网络可以基于历史数据和当前信息,对公交到站时间进行准确预测,可以帮助乘客更好地规划出行。解决了现有技术中,训练LSTM神经网络的过程中,需要人工进行调参,对于一些复杂的模型参数组合和配置问题,人工调整参数往往难以达到最优效果,导致预测效果不佳的问题。
附图说明
为了更清楚地说明本发明实施例及其设计方案,下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明公交到站时间预测方法流程图;
图2为本发明的公交站间运行过程分析图;
图3为本发明的LSTM模型结构示意图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案并能予以实施,下面结合附图和具体实施例对本发明进行详细说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例:
本发明提供了一种公交到站时间预测方法,具体如图1所示,包括:处理公交GPS数据集,得到训练集、和测试集;随机生成一组LSTM神经网络的初始模型参数;将LSTM神经网络的初始模型参数作为海鸥算法中海鸥的位置参数;将每一只海鸥的位置参数作为LSTM神经网络的模型参数输入LSTM神经网络中;将训练集输入LSTM神经网络对LSTM神经网络进行训练,当LSTM神经网络输出的结果与预期值的均方差M1最小时,得到第一LSTM神经网络;将测试集输入第一LSTM神经网络中,求出第一LSTM神经网络的输出值与期望值的均方差M2;将M2作为海鸥算法中海鸥的适应度;如果海鸥中最小的适应度大于阈值,调整海鸥的位置参数,直到海鸥中最小的适应度小于阈值;将海鸥中最小的适应度所对应的海鸥的位置参数作为LSTM神经网络的最优模型参数,得到训练好的LSTM神经网络;将不同方向不同时段的公交GPS数据集输入训练好的LSTM神经网络中,对公交到站时间进行预测分析。
考虑到公交运行具有定线行车、定点停车的特点,运行状态具有周期性和规律性,故本发明拟运用改进的海鸥算法优化LSTM模型对公交到站时间进行预测分析,更准确地预测出公交到站时间。
以下为本发明实施细节:
对公交GPS数据集进行处理,经过线路数据处理、站点数据处理、时间转化处理、位移计算处理、影响因素特征集定量化处理后将公交GPS数据处理为能够输入模型使用的数据集。其中位移计算处理考虑到地球本身为球体,为了尽量减少计算误差,采用正弦函数的Haversine公式对两点之间的位移进行计算:
其中,Δd为两个GPS数据点之间的距离;R为地球半径,取6371km;
同时考虑人、车、道路环境、所经交叉口数量、各站台形式及天气等因素会影响公交运行到站时间,公交到站GPS数据集经处理后分为两个不同的运行方向和分早高峰、平峰及晚高峰分别输入本发明所提模型进行预测分析。
如图2所示,本发明将运用LSTM对公交到站时间进行预测,输入变量将包括公交运行过程中多种影响因素及公交运行到站时间同方向同时段的历史数据,输出变量为公交到站时间预测值。
如图3所示,本发明运用引入非线性收敛因子对参数进行改进、引入正弦余弦算子协调算法的局部搜索和全局搜索能力以及引入自适应分布变异策略以进行扰动变异产生新解对标准海鸥算法进行改进后的海鸥算法对LSTM网络的学习率、迭代次数以及两个隐藏层的节点数等模型参数进行优化,构建ISOA-LSTM公交到站时间预测模型。具体实现步骤如下:
S1.初始化参数。定义改进海鸥算法的初始参数值及LSTM神经网络结构等初始参数,将天气影响因素中的天气温度、相对湿度、1小时降水量分别输入预测模型进行分析,数据集划分为训练集和测试集,预测时间步长为1。
输入变量中各站公交到站时间与天气影响因素主要通过时间上的同步进行对应,具体符号化说明为:
式中:x
S2.初始化海鸥位置;
S3.计算海鸥适应度P
S4.根据相关公式计算海鸥位置
其中,k表示当前迭代次数;f
S5.根据相关公式计算海鸥新的攻击位置
r
其中,r是海鸥进行攻击行为时螺旋飞行的半径;θ为0,2π]区间内的随机角度值;u和v是常数;e是自然对数的底数;a是常数,取值为2;r
S6.更新最佳海鸥位置和适应值;
S7.根据相关公式确定对最优位置进行扰动,并确定最优位置:
其中,TD(z)表示自由度参数为z的t分布;ω为自适应参数;c=0.1,b=1;K
S8.判断是否达到结束条件,若是则输出最优值,否则跳转步骤1。
S9.将输出的最优值作为优化后LSTM网络的模型参数,再训练LSTM神经网络,最终输出公交到站时间预测结果。
本发明在原始海鸥算法中,运用引入非线性收敛因子对参数进行改进、引入正弦余弦算子协调算法的局部搜索和全局搜索能力以及引入自适应分布变异策略以进行扰动变异产生新解对标准海鸥算法进行改进后的海鸥算法对LSTM网络的学习率、迭代次数以及两个隐藏层的节点数等模型参数进行优化,构建ISOA-LSTM公交到站时间预测模型。
本发明所提模型结合改进海鸥优化算法和长短期记忆神经网络的优缺点,能够降低局部最优与过度拟合现象出现的几率且该模型的设计具有很好的稳定性,实现对公交到站时间更为准确地预测。
以上所述实施例仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换,均属于本发明的保护范围。
- 一种公交车到站时间预测算法
- 一种利用公交IC卡预测公交到站时间的方法
- 一种基于多公交线路运行数据融合的城市公交到站时间预测方法