掌桥专利:专业的专利平台
掌桥专利
首页

一种旅行时间预测方法

文献发布时间:2024-04-18 19:54:45


一种旅行时间预测方法

技术领域

本发明涉及人工智能技术领域,尤其涉及一种旅行时间预测方法。

背景技术

随着经济和科技的发展,城市交通系统在为居民提供了良好的出行环境和方式的同时产生了大量的数据,与此同时,社会的进一步发展对交通系统提出了更高的要求,交通拥堵、出行条件恶化等现象层出不穷。针对这些异常交通的现象,依靠有效地对城市各个领域和基础设施挖掘的数据进行分析,设计相关问题的预测模型,极大地发挥数据中隐藏信息的价值,辅助城市交通系统的进一步发展和完善,构筑以大数据为中心的智慧城市系统,为居民提供成本更低、更方便的交通服务。

预估到达时间(ETA,Estimated Time of Arrival)又称为旅行时间预测,是智能交通系统中尤为关键的一项任务,根据给定的出发时间,精确地预估出从一段路径的起点到终点所需时长,有助于节省用户的出行时间,优化车辆调度和路径规划等。在实际生活中,旅行时间预测问题不仅需要考虑交通系统的时间特性,比如早晚高峰的部分道路规律性拥堵和交通事故导致的偶发性拥堵等,还需要考虑交通系统的空间特性,比如途径红绿灯的个数、道路的限速、道路受否为主干道,道路是否通过学校等各种情况。此外,还需要考虑额外因素的影响,由于现阶段情况下,交通系统运行的主要主体是人且易受到自然因素影响,因此预估到达时间问题还需要引入对驾驶员的个性化特征和外部环境特征的建模,比如司机驾驶方式、雨天雾天等情况下对车量行驶速度的干扰等。综上所述,交通情况的复杂程度与预估到达时间任务的准确度密切相关,即路况越复杂、外部干扰因素越多的行驶轨迹越难以对其的到达时间给出准确的预测。因此,预估到达时间通常通过对路径的属性特征、空时特征、环境特征、驾驶员特征等多个特征进行多个不同数据学习产生预测值。

基于GPS轨迹序列的旅行时间预测在交通运输领域中具有广泛的应用。一个完整的旅行时间预测算法通常将一段完整的历史行程GPS轨迹序列作为输入,预测本段轨迹的旅行时间作为输出。本算法针对基于GPS轨迹的旅行时间预测问题进行研究。

现有的预测准确度较高的基于GPS轨迹数据集的到达时间预测模型主要基于深度学习模型,下述将给出几种常见的基于深度学习的算法模型。

其中一种常用的模型是循环神经网络(RNN,Recurrent Neural Network),它可以对时间序列数据进行建模。在基于GPS轨迹数据的到达时间预测中,通过将轨迹数据转换为时间序列数据,RNN可以学习到时间序列中的时间依赖性特征,并产生预测值。此外,基于RNN的变种模型,如长短期记忆网络(LSTM,Long Short-Term Memory)和门控循环单元(GRU,Gated Recurrent Unit)等,也被广泛用于处理GPS轨迹数据。

另一个常用的模型是卷积神经网络(CNN,Convolutional Neural Network)。CNN可以对空间数据进行建模,并且可以捕捉到不同区域之间的空间相关性。在基于GPS轨迹数据的到达时间预测中,CNN可以将轨迹数据转换为空间数据,并学习相邻轨迹坐标点间的空间相关性特征。此外,基于CNN的变种模型,如卷积长短期记忆网络(ConvLSTM)和空间变换器网络(STN,Spatial Transformer Network)等,也被广泛用于处理GPS轨迹数据。

此外,由多个基准模型组合而成的混合模型在预估到达时间任务上也取得了一定成果。如DeepTTE预估到达时间模型,采用卷积神经网络和长短期记忆网络及残差网络为核心共同组成的深度学习模型,可以较好地学习轨迹的空时特征,并在一定程度上融合了外部信息,取得了较好的预测结果,且相比于上述的单一模型,DeepTTE模型的泛化能力较强。

通过图1详细描述提供准确的旅行时间的挑战,在图中,橙色圆圈代表移动车辆;橙色圆圈越接近,交通拥堵越严重。红色圆圈表示涉及事故的车辆,绿色箭头表示车辆的行驶方向。红色虚线框表示特殊的子段(异常的空间特征或异常的交通状况),绿色虚线框表示受影响的子段。长箭头表示影响关系,黑色箭头表示对更远的子段的影响,红色箭头表示对相邻子段的影响。

虽然,预估到达时间这一问题在过去已经被广泛研究,但提供准确的旅行时间仍然非常具有挑战性,其主要受以下几个方面影响:

交通状况主要受到空间相关性、时间依赖性和外部信息的影响。整个轨迹的空间相关性是可变的、复杂的和强相关的。例如,在图1(a)中,红色虚线框标识了具有特殊空间特征(单向车道)的子段A。当大多数上游车辆驶向该子段时,如果子段A拥堵,上游子段的交通流量将无法顺畅通过,因此直接相邻于子段A的子段B以及较远的子段C和D将会拥堵。子段B、C和D都在子段A的影响范围内。当A发生拥堵,那么邻接子段B如向A方向行驶,则B受A的拥堵影响,这种情况称为直接影响。同时,受A影响而造成子段B拥堵,继而造成与B邻接的子段C和D发生拥堵的情况称为间接影响。这两种影响模式有所不同,与直接影响模式相比,间接影响模式受上下游路段的空间特征影响程度更大,例如,若在子段B处增加为双车道,由于子段A仅会对子段B行驶方向为子段A的车道直接影响,沿子段B方向行驶车道不受影响,因此子段A对子段C、D的间接影响较子段B为单车道时有所减弱。此外,在自然生活中,交通事故发生的轨迹段的上游或下游部分存在交通异常的高概率,如交通堵塞。这并不意味着这种类型的路段总是出现异常的交通状况,而是由上游或下游的异常路段造成的,如图1(b)所示。因此,仅针对单个道路段或子路径的空间相关性(我们将它们称为局部空间相关性)是不足以提取轨迹的空间相关性的。

此外,随着交通网络的不断发展和智能交通系统的逐渐完善,道路交通数据量不断增大,这给交通预测带来了更高的要求。为了提高给定路径的预测准确性,许多研究者将外部信息融合到道路交通预测模型中。过去的一些工作,类如DeepTTE算法,将外部信息(如司机编号、车辆编号、天气信息等)融合到每个道路段或历史轨迹点上,以提高预测准确性。其中一种方法是将编码的外部信息与每个轨迹点拼接并传输到模型中。这种方法将相同的外部信息分配给每个轨迹上的节点,从而提高了模型的预测能力。但是,在现实中,这些外部信息随时间仍然不同,并且一些外部信息可能相互影响。例如,同一司机驾驶相同车辆的驾驶特性将受到当前道路交通状况、当天累计驾驶时间、气候等因素的影响。因此,如果忽略这些外部信息的变化,模型的预测准确性将受到限制。此外,不同相关的外部信息在不同的应用场景中对旅行时间产生其他影响。例如,在拥堵的道路上,司机的驾驶经验对旅行时间的影响小于天气信息。因此,在将外部信息融合到预测模型中时,需要针对不同的应用场景进行选择和处理。这样才能更好地提高模型的预测准确性。

发明内容

为此,本发明首先提出一种旅行时间预测方法,通过建立AttentionTTE模型实现旅行时间预测,模型主要由四个部分组成:加权属性融合模块用于处理当前轨迹的外部信息;局部空间相关性提取模块用于将GPS坐标映射到向量空间,提取局部空间相关性,并为后续处理生成特征映射;空间相关性和时间依赖性提取模块是模型的主要模块,用于学习轨迹的时间依赖性、轨迹的全局空间相关性,并将外部信息项融合到轨迹中;多任务学习模块用于预测提供轨迹的行驶时间并平衡个体预测和集体预测。

所述加权融合属性模块将所有的属性信息值映射到相同维度的特征空间中,并且根据每个属性信息值的贡献动态构建属性信息特征,具体地,对于每个属性信息,通过词嵌入方法将其映射到一个低维空间,并计算其在该空间中的向量表示,将一条轨迹所对应的所有属性信息转换为相同维度的特征向量。词嵌入技术将司机编号、天气情况、日期和出发时间作为四个不同的原始类别变量,其中,出发时间以分钟为间隔将一天内的时间分为86400个类别值,属于第i个原始类别变量的每个值v,v∈V

然后使用基于L2范数的方法来计算每个属性信息的权重,为了获取每个属性特征向量的相应权重,计算每个属性特征向量的L2范数,每个属性特征向量的L2范数是该向量的模值,而每个属性的相应模值在总模值中所占的比例即为该属性的权重,其中,表示所有属性特征向量的L2范数,表示每个属性特征向量的L2范数:

其中,每个属性特征向量对应的权重如下:

通过将每个属性信息的权重与其向量表示相乘,得到加权的属性信息特征

所述局部空间相关提取模块采用相关深度学习方法,利用基于一维卷积核的神经网络作为局部空间特征提取模块,以学习历史轨迹中多个相邻轨迹点的局部空间相关性:每个历史轨迹由一系列连续的GPS轨迹点P={p

所述局部地理卷积神经网络利用一维卷积核来提取每个轨迹点周围的本地特征,将卷积核应用于每个轨迹点及其相邻的轨迹点,以捕获它们之间的空间相关性,将历史轨迹中每个轨迹点的空间相关性提取出来,形成一个特征向量,在输入数据之前,对原始数据进行处理,将每个轨迹点的经度和纬度坐标拼接起来,形成一个二元组,并将二元组串联起来,形成一个包含轨迹地理特征的序列,作为神经网络的输入,具体过程如下式所述:p

其中°表示单个轨迹点的经度和纬度的拼接操作,且p

对于每个GPS轨迹坐标点p

则得到输出序列loc(loc∈R

其次,采用参数大小为W

然后,向先前获得的矩阵中添加一列,将来自局部路径path

所述空间相关性和时间依赖性提取模块由两个部分组成,即全局空间相关性提取模块和时间依赖性提取模块,所述空间相关性提取模块捕捉历史轨迹中的全局特征,将历史轨迹中不同路段之间的空间相关性结合起来,并生成全局的空间特征向量;所述时间依赖性提取模块学习历史轨迹中的时间依赖性,通过对历史轨迹中不同路段的行程时间进行建模,时间依赖性提取模块能够有效地捕捉不同路段之间的时间相关性,并生成时间特征向量;最后,将空间特征向量和时间特征向量拼接在一起,获得行程时间的隐藏状态。

所述空间相关性提取模块基于自注意力机制的改进,首先通过简单的自注意力机制提取一段局部空间特征序列中所有节点之间的相关性,然后通过关注权重分布矩阵学习对序列全局空间相关性影响最显著的关键轨迹点,最后通过动态融合外部信息得到全局空间相关性。

具体地,使用三个不同的可学习矩阵,

序列中每个节点的查询矩阵与其他所有节点的键矩阵相乘,再经过softmax激活函数与值矩阵相乘,以获得注意力权重分布矩阵:

通过激活函数Tanh和可学习的矩阵W

随后,使用Sigmoid激活函数、查询矩阵Q

为了实现动态融合外部信息,将属性特征向量attr,attr∈R

为了建模外部信息随着驾驶时间变化的过程,将其输入到一个循环神经网络中,得到扰动项的输出,在处理序列中的每个节点时,循环神经网络将动态地融合外部信息:disturb=LSTM(hidden

最后,通过三个可学习矩阵W

所述时间依赖性提取模块要提取的时间依赖关系包含在完整轨迹序列中每个轨迹片段的个体序列中,即存在path

所述多任务学习模块将个体和全局预测相结合来训练模型,用于生成最终预测,具体而言,通过自注意力机制、L2-范数值计算,得到每个节点对整个序列隐藏状态的贡献,从而捕捉序列中节点之间的关联性和重要性:

本发明所要实现的技术效果在于:

通过设计一种新的自注意力机制解决以往方法无法提取轨迹的全局空间相关性问题;通过设计一种基于L2范数的加权属性融合方法,对外部信息之间的相互影响及外部信息随时间变化的过程进行建模,并提供准确度更高的旅行时间预测服务。

附图说明

图1子段之间的相关性;

图2AttentionTTE的主要结构;

图3空间相关性提取模块的自注意力;

具体实施方式

以下是本发明的优选实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于此实施例。

本发明提出了一种旅行时间预测方法。通过设计一种新的自注意力机制解决以往方法无法提取轨迹的全局空间相关性问题;通过设计一种基于L2范数的加权属性融合方法,对外部信息之间的相互影响及外部信息随时间变化的过程进行建模,并提供准确度更高的旅行时间预测服务。

首先给出相关定义:

历史轨迹:历史轨迹是每个驾驶员历史驾驶轨迹的采样结果。定义一个历史轨迹序列P,包含T个连续的历史GPS坐标点,即P={p1,...,pT}。每个GPS坐标点包含一个经度(pi.lng)、一个纬度(pi.lat)和一个时间戳(pi.ts)。对于每个轨迹,将记录当前轨迹的驾驶员编号、旅程的开始时间、周开始日期和当前天气条件。

个体预测:个体预测将完整的轨迹根据实际道路段长度等条件分成多个道路段块,并预测每个子路径的旅行时间。在任务中,根据局部空间相关性提取模块中一维卷积核的大小,将完整的轨迹划分为多个子路段块。

集体预测:集体预测直接预测完整轨迹的旅行时间。在任务中,通过生成一个固定长度的特征向量来预测整个轨迹的旅行时间。

局部空间相关性和全局空间相关性:局部空间相关性是完整轨迹中每个子段与其相邻的子段间的空间相关性。全局空间相关性是整个轨迹中每个子段与同一轨迹内的任意一个子段的空间相关性。基于局部空间相关性,进一步考虑了轨迹上相距较远的轨迹段之间的潜在空间相关性。

完整方法步骤:

AttentionTTE主要由四个部分组成:加权属性融合模块用于处理当前轨迹的外部信息(如司机编号、天气);局部空间相关性提取模块用于将GPS坐标映射到向量空间,提取局部空间相关性,并为后续处理生成特征映射;空间相关性和时间依赖性提取模块是模型的主要模块,主要用于学习轨迹的时间依赖性、轨迹的全局空间相关性,并将外部信息项融合到轨迹中;多任务学习模块主要用于预测提供轨迹的行驶时间并平衡个体预测和集体预测。

加权属性融合模块:

历史轨迹的行驶时间不仅仅取;决于地理空间中轨迹的坐标分布和长度,还受到各种因素的影响,比如司机信息、天气条件和出发时间。这些外部信息作为每个轨迹的属性通过影响时间和空间特征影响着行驶时间的预测,因此需要适当考虑外部信息对时间和空间特征的影响。由于数据集中的每一条轨迹均对应一组唯一的外部信息,因此可以将这些外部信息看作是每一条轨迹所自有的属性信息。

在以前的工作中,大多数研究人员使用词嵌入技术将属性信息融合至轨迹中,它能够将可能影响轨迹行驶时间的属性信息嵌入至特征向量中并与轨迹的特征向量融合。在具体实现中,研究人员将司机编号、天气情况、日期和出发时间等四种类型的值识别为属性信息的四个属性。由于这四个值无法直接输入到神经网络中,他们使用嵌入技术将这四种类型转换为低维向量。

首先,将司机编号、天气情况、日期和出发时间作为四个不同的原始类别变量,其中,出发时间以分钟为间隔将一天内的时间分为86400个类别值。词嵌入技术将属于第i个原始类别变量的每个值v,v∈V

这种方法具有一定的局限性。在将每个属性信息的嵌入方法生成的特征矩阵拼接并传输到模型的过程中,每个属性信息是相互独立的。先前的研究主要考虑了属性信息对时间和空间特征的影响,但没有考虑到每个属性信息对其他信息的影响。例如,在现实生活中,天气条件会对驾驶员的情绪产生负面影响,有些驾驶经验更丰富的司机可能会在恶劣天气下以类似于驾驶经验较短的司机的方式驾驶。不同驾驶员在向量空间中的投影向量会更加接近。因此,天气条件将会影响驾驶员在向量空间中的特征值。这表明,当使用属性信息来提高模型的性能时,需要考虑到这些信息之间的交互作用。如果能够捕捉到这些交互作用,就能更好地理解属性信息如何影响模型的输出,并能更准确地预测目标变量的值。因此,研究人员需要探索更加细致的方法,以充分利用属性信息,并最大程度地提高模型的性能。

为了解决之前提到的问题,提出了一种加权融合属性模块。这个模块可以将所有的属性信息值映射到相同维度的特征空间中,并且根据每个属性信息值的贡献动态构建属性信息特征。具体来说,对于每个属性信息,通过词嵌入方法将其映射到一个低维空间,并计算其在该空间中的向量表示。然后,使用一个基于L2范数的方法来计算每个属性信息的权重,该权重表示了该信息对最终向量的影响程度。通过将每个属性信息的权重与其向量表示相乘,可以得到加权的属性信息特征。最后,将加权的特征与模型的其他特征进行融合,以实现对目标变量的准确预测。

首先,使用词嵌入技术将一条轨迹所对应的所有属性信息转换为相同维度的特征向量,作为轨迹的属性特征向量Attr。词嵌入技术将将司机编号、天气情况、日期和出发时间作为四个不同的原始类别变量,其中,出发时间以分钟为间隔将一天内的时间分为86400个类别值。属于第i个原始类别变量的每个值v,v∈V

然后,通过一个可学习的矩阵W

其次,为了获取每个属性特征向量的相应权重,计算每个属性特征向量的L2范数。每个属性特征向量的L2范数是该向量的模值,而每个属性的相应模值在总模值中所占的比例即为该属性的权重。其中,表示所有属性特征向量的L2范数,表示每个属性特征向量的L2范数。

其中,每个属性特征向量对应的权重如下:

最后,对所有属性的特征向量进行加权求和,以得到加权后的属性特征向量。具体地,对于每个轨迹,将其属性信息对应的属性特征向量与相应的权重相乘并累加,得到该轨迹的加权特征向量。这样就能够根据不同的外部环境条件动态地构建属性信息特征,并将其应用到轨迹预测中。

与直接通过词嵌入编码融合每个属性信息的值相比,基于加权的属性融合模块可以更好地学习每个属性在不同时间和条件下对目标路径影响的差异。通过计算每个属性信息的特征向量的权重,可以根据不同的属性信息的重要性动态地构建属性信息特征。

局部空间相关提取模块:

采用相关深度学习方法,利用基于一维卷积核的神经网络作为局部空间特征提取模块,以学习历史轨迹中多个相邻轨迹点的局部空间相关性。如前所述,每个历史轨迹是由一系列连续的GPS轨迹点(包含经纬度信息和采样时间戳)P={p1,...,pT}组成,其中每个轨迹点p

局部地理卷积神经网络是一种针对地理信息的深度学习模型。它利用一维卷积核来提取每个轨迹点周围的本地特征,从而学习轨迹点之间的空间相关性。由于轨迹点通常是时间序列数据,局部地理卷积神经网络采用一维卷积核进行卷积操作,以保留时间序列数据的时序信息。将卷积核应用于每个轨迹点及其相邻的轨迹点,以捕获它们之间的空间相关性。通过这种方式,可以将历史轨迹中每个轨迹点的空间相关性提取出来,形成一个特征向量。

在输入数据之前,需要对原始数据进行处理,以适应神经网络的输入格式。具体来说,将每个轨迹点的经度和纬度坐标拼接起来,形成一个二元组(longitude,latitude)。将这些二元组串联起来,形成一个包含了轨迹地理特征的序列,作为神经网络的输入。这种处理方式可以保留轨迹点之间的空间关系,同时方便神经网络对数据进行处理。具体过程如下式所述:

其中。表示单个轨迹点的经度和纬度的拼接操作,且p

对于每个GPS轨迹坐标点p

loc

因此,可以得到输出序列loc(loc∈R

其次,采用参数大小为W

path

其中path

然后,向先前获得的矩阵中添加一列,将来自局部路径path

全局空间相关性和时间依赖性提取模块

该模块主要由两个部分组成,即全局空间相关性提取模块和时间依赖性提取模块。

基于局部空间相关性提取的结果,全局空间相关性提取模块用于从历史轨迹中提取全局空间特征。具体而言,全局空间相关性提取模块旨在捕捉历史轨迹中的全局特征,例如道路的整体拓扑结构和路段之间的空间布局关系。通过自注意力机制,全局空间相关性提取模块能够有效地将历史轨迹中不同路段之间的空间相关性结合起来,并生成全局的空间特征向量。

时间依赖性提取模块则旨在学习历史轨迹中的时间依赖性。通过对历史轨迹中不同路段的行程时间进行建模,时间依赖性提取模块能够有效地捕捉不同路段之间的时间相关性,并生成时间特征向量。

最后将全局空间特征向量和时间特征向量拼接在一起,以获得行程时间的隐藏状态。该隐藏状态既包含了历史轨迹中的空间信息,也包含了时间信息,从而能够更好地预测未来行程时间。

全局空间相关性提取模块

首先提出了全局空间相关性提取模块,如图3所示。该模块基于自注意力机制的改进,使自注意力机制能够更好地学习时间序列中同一序列中每个节点的潜在关系。它可以动态地融合序列上外部信息的影响。该模块首先通过简单的自注意力机制提取一段局部空间特征序列中所有节点之间的相关性。然后,通过关注权重分布矩阵学习对序列全局空间相关性影响最显著的关键轨迹点。最后,通过动态融合外部信息得到全局空间相关性。

通过局部空间相关性提取模块中的公式(12)进行计算,得到了一种新的长度为T-k+1的序列,其中序列的每个节点包含局部轨迹的局部空间相关性。值得注意的是,如果遵循先前工作的传统方法,轨迹的空间特征提取将已经完成。然而,轨迹的空间相关性取决于轨迹上所有轨迹点的空间特征,而该方法获得每个轨迹点的局部空间相关性。它没有考虑完整轨迹中子轨迹段之间相关性,即全局空间相关性。为了解决这个问题,使用自注意机制来学习包含局部空间特征和相关性的序列。自注意力机制在处理完整序列中节点之间的关系方面起着重要作用,并已在交通预测中部分应用。在自然语言处理过程等其他领域中,对于文本或序列中关键词或节点的特征提取,主要是通过增加文本或序列中每个单词或节点的特征向量的维数和增加自注意力机制的层数来完成的。但是,这个过程需要较大的模型可训练参数。此外,在本文的研究过程中,发现对于GPS轨迹数据集中的每个轨迹点分配更高的维度并使用更多层的自我关注机制会导致模型难以收敛。与之相比的是,当每个节点的特征维度较小时,自我关注机制对关键节点的特征提取能力下降。因此,直接使用自我关注机制是不足的。

本文提出的方法解决了传统方法的不足之处,通过自注意力机制学习局部空间特征和相关性的序列,考虑到完整轨迹中子段之间的全局空间相关性。同时,通过控制特征维度和对自注意力机制的该进,减少模型参数数量,提高模型的训练效率和准确性。该方法在实验中取得了较好的效果,可用于GPS轨迹数据的分析和预测。

具体使用三个不同的可学习矩阵

序列中每个节点的查询矩阵与其他所有节点的键矩阵相乘,再经过softmax激活函数与值矩阵相乘,以获得注意力权重分布矩阵(如下公式所示)。

为了提取轨迹序列中关键子段(如带有交通信号灯的道路段等)对其他子段的影响,将同一轨迹中不同子段之间的关系映射到区间[0,1]中。子段之间的关系值越接近1,它们之间的相关性就越强。通过使用Sigmod激活函数生成模糊注意力分配矩阵来实现这一点。

通过激活函数Tanh和可学习的矩阵W

随后,使用Sigmoid激活函数、查询矩阵Q

feature

其中,a=(a

在将外部信息作为属性进行融合时,传统方法往往将外部信息视为GPS点在特征向量空间中的补充。然而,一些外部信息会随着时间的推移而改变,比如天气和司机的个人信息,这些信息都能影响司机的驾驶风格。因此,将静态的外部信息作为GPS点的补充,难以充分包含当前的外部信息。

为了实现动态融合外部信息,将属性特征向量attr,attr∈R

在现实世界中,外部信息是随着时间变化而不断变化的,例如司机的驾驶风格、天气条件以及其他信息都会随着时间发生变化。为了建模外部信息随着驾驶时间变化的过程,将其输入到一个循环神经网络中(回忆一下之前的描述,LSTM通常非常有效地处理时间序列问题),得到扰动项的输出。在处理序列中的每个节点时,循环神经网络将动态地融合外部信息。这种方法的优点在于,它可以捕捉到外部信息随时间变化的趋势和规律,从而更好地反映当前的外部环境信息,提高模型的预测能力和泛化能力。例如,在交通预测中,根据天气预报、时间等因素动态融合外部信息,可以更准确地预测道路拥堵情况,提高交通预测的准确性。

disturb=LSTM(hidden

其中,disturb随着轨迹序列节点而变化的属性信息的特征,disturb∈R

最后通过三个可学习矩阵W

其中,feature

时间依赖性提取模块:

在模型中引入循环神经网络来提取历史轨迹的时间依赖关系。时间依赖关系包含在完整轨迹序列中每个轨迹片段的个体序列中,即存在path

将通过两层连接的LSTM从经过本地空间相关性提取模块处理的序列中提取时间依赖关系,获得带有时间依赖性的序列。

feature

通过两个可学习的矩阵将空间相关性和时间依赖性融合到隐藏状态中。

feature

多任务学习模块

最后引入多任务学习模块。过去,到达时间预测的工作主要分为个体和集体预测两种。个体预测是将历史轨迹划分为多个子历史轨迹段,依次预测每个历史轨迹段并将它们相加。集体预测是直接预测整个历史轨迹的旅行时间。一般而言,个体预测的准确性高于集体预测。个体预测无法对整个轨迹的复杂交通环境进行建模,如信号灯和路口对旅行时间的影响,因此无法准确预测较长的轨迹序列的旅行时间。因此,理想的模型应该既具有个体预测的准确性,又具备集体预测中建模复杂交通状态的能力。在实验阶段,通过将个体和全局预测相结合来训练模型,以提高模型预测的准确性。

使用多任务学习模块用于生成最终预测。在单个预测阶段,回顾之前的内容,可以生成隐藏状态序列feature

由于特征序列feature

回顾自注意力机制部分的内容,我们知道经过自注意力机制处理的序列的隐藏状态包含节点之间的关联性。在自注意力机制中,每个节点都将对序列中其他节点的隐藏状态进行加权求和,从而生成其自身的隐藏状态。为了量化每个节点对整个序列的隐藏状态的贡献,计算序列feature

总之,通过自注意力机制、L2-范数值计算可以得到每个节点对整个序列隐藏状态的贡献,从而更好地捕捉序列中节点之间的关联性和重要性。

随后,通过对特征序列进行加权求和,得到最终的轨迹特征隐藏状态。

最后通过多个全连接层将轨迹隐藏特征状态输入(在实验中,全连接层的隐藏状态维数为128),这些层由残差网络结构连接。残差网络可以避免由深度加深引起的模型退化。在残差网络的末尾通过添加一个输出维度为1的全连接层生成集合预测时间t

本发明使用MAE、MAPE和RMSE作为算法的评估指标。这些指标通常用于评估机器学习模型在预测任务中的表现。

MAE(平均绝对误差)是预测值与实际值之间绝对误差的平均值。它度量了预测值与真实值之间的平均差异,因此可以衡量模型的平均预测误差大小。例如,如果MAE为2,则意味着模型的平均预测误差为2个单位。

MAPE(平均绝对百分比误差)是一种相对测量方法,用于衡量预测值与真实值之间的误差大小。与MAE不同的是,它使用百分比误差,因此可以比较不同数据集的预测表现。例如,如果MAPE为10%,则意味着模型的平均误差为真实值的10%。

RMSE(均方根误差)是预测值与实际值之间偏差的平方除以观测次数n的平均数的平方根。与MAE类似,RMSE也度量了模型预测值与真实值之间的差异,但是由于它是平方根,因此它可以放大较大的误差。

本发明使用以下两种现有的算法进行对比实验:

MLP-LSTM:将多层感知器和双层LSTM连接模型作为基准模型之一,该模型的输入与模型输入保持一致,模型的隐藏层大小为128。

DeepTTE:DeepTTE模型目前是基于GPS轨迹数据集的到达时间预测中最准确的模型之一。在这个模型中,首次提出了地理卷积模块和基于属性融合的多任务学习模块。通过提取空间和时间特征以及平衡模型的全局和局部预测能力,可以获得高精度的预测值。但是,在空间特征提取模块中,DeepTTE仅考虑了几个相邻路径节点的空间特征,并未建立全局空间特征之间的相关性。在属性融合方面也没有考虑属性随时间变化的情况。在实验中将其隐藏状态的维度设置为与模型相同。

通过以下实验证明算法的有效性:

1.使用数据集中的前1至20日的数据集作为训练集,接下来的3日的数据集作为验证集,最后的7日数据集作为测试集,以测试模型在完整周期(一周)训练下的预测能力。

2.为了确定模在较短时间跨度的数据集上训练的模型的预测能力,在时间跨度为24小时和时间跨度为一周的数据集上进行了实验。首先,将数据集的周期设置为24小时。分别将相邻两天的数据集用作训练集和测试集。为了减轻人为时间规划(如周末、节假日等)的干扰,排除了周末、周一和周五的数据集,并将周二作为训练集,周三作为测试集。在模型的属性融合模块中,排除了目标轨迹的日期属性。其次,选择前一周的所有数据集作为训练集,选择本周的周三作为测试集。在上述数据集上测试模型。

3.为了测试模型对到达时间的预测能力是否会随着训练和预测之间的时间间隔增加而降低,使用一地8月份的第一周数据集作为训练集,最后一周数据集作为测试集进行实验。

实验结果如下所述:

此外,整个模型的可训练参数大小约为0.56MB。加权属性融合模块的可训练参数约为0.21MB,空间相关性和时间依赖性提取模块(包括局部空间相关性提取模块)的可训练参数约为0.27MB,而多任务学习模块的可训练参数约为0.08MB。与DeepTTE相比,DeepTTE是具有更高预测精度的深度学习模型(模型的可训练参数约为0.71MB,属性融合模块约为0.40MB),但可训练参数更少。模型具有较少的可训练参数,因为属性嵌入过程中每个属性的编码潜在空间限制为较低的值。

相关技术
  • 一种交通流量或旅行时间的预测方法和设备
  • 一种基于多模态数据融合与多模型集成的旅行时间预测方法
技术分类

06120116380651