掌桥专利:专业的专利平台
掌桥专利
首页

一种车联网资源分配方法及系统

文献发布时间:2023-06-19 18:35:48


一种车联网资源分配方法及系统

技术领域

本发明涉及一种车联网资源分配方法及系统,属于物联网技术领域。

背景技术

车联网(Vehicle-to-everything,V2X)技术是物联网(Internet of Things,IoT)的重要领域。其是智能交通系统(Intelligent Transportation Systems,ITS)的重要组成部分之一。车联网作为新基建的关键部分之一,车联网逐渐成为无线通信的一个新的热门领域。无论是在智能汽车技术,如自动驾驶,智能防碰撞技术等,或是在车载信息设备,如车载影音系统,车载道路信息系统中,车联网都发挥着重要的作用。

然而,车联网中终端逐渐增加的通信速率需求给车联网的容量以及资源分配带来了巨大的挑战。不仅如此,在一些延迟敏感型的应用场景,如自动驾驶,车辆防碰撞等场景中,对车联网的资源分配提出了更高的稳定性和可靠性的要求。现有的方案多为使用传统优化方案,在获取信道状态信息后使用凸优化等工具求解最优信道分配矩阵。这种方案的优点是技术成熟,原理清晰并且理论效果优秀。但在车联网实际情况中,车辆终端往往处在高速运动之中,这将带来快速变化的信道状态以及信道估计可能不准确的问题。

在车联网场景中,为了提高频带利用率通常会选择复用V2V链路和V2I链路。而复用会导致可靠性降低,系统容量减小,时延增加等问题,这在V2V防撞告警等应用中是致命的。同时,现有方案使用集中式训练,即在基站侧进行数据汇总和训练,并将结果发送给各个终端执行。这种训练策略导致实际的延迟更高,同时需要消耗一定的信道资源。并且,现有方案没有考虑到在车联网信道状态变化较快情况下会导致的信道估计误差,使得训练效果下降的问题。因此,需要寻找可以改善车辆终端高速行驶带来的问题的技术方案。

在车联网场景中,为了提高频带利用率通常会选择复用V2V链路和V2I链路。而复用会导致可靠性降低,系统容量减小,时延增加等问题,这在V2V防撞告警等应用中是致命的。同时,现有方案使用集中式训练,即在基站侧进行数据汇总和训练,并将结果发送给各个终端执行。这种训练策略导致实际的延迟更高,同时需要消耗一定的信道资源。并且,现有方案没有考虑到在车联网信道状态变化较快情况下会导致的信道估计误差,使得训练效果下降的问题。

发明内容

本发明所要解决的技术问题是克服现有技术的缺陷,提供一种车联网资源分配方法及系统。

为解决上述技术问题,本发明提供一种车联网资源分配方法,包括:

在预先构建的车联网通信场景中,利用通信链路获取车辆环境信息;所述车联网通信场景为车对车通信V2V以及车对基础设施通信V2I,通信链路包括V2V链路和V2I链路,V2V链路复用V2I链路的上行链路,并且每个V2I链路的上行链路只被一个V2V链路复用;所述车辆环境信息包括各个子信道的信道状态信息、当前车辆V2V链路的剩余负载大小以及剩余时延长度;所述信道状态信息包括信道增益和干扰强度;所述子信道为V2I链路被分配的频率范围后划分的子信道,V2V链路复用这些子信道;

通过V2V链路以及V2I链路,周期性的向车联网通信场景内其他车辆终端或者基站通报目标车辆的位置信息、信道状态信息、子信道选择策略;

若目标车辆的当前时刻的信道状态信息获取失败或有误,则获取目标车辆的n个时刻信道增益以及干扰强度序列,输入到预先构建的基于注意力机制的预测模型,预测当前时刻的信道状态信息;

将前车辆V2V链路的剩余负载大小、剩余时延长度以及预测的当前时刻的信道状态信息输入到预先训练好的资源分配模型,得到当前资源分配动作,根据当前资源分配动作得到子信道选择策略,根据子信道选择策略进行资源分配。

进一步的,所述基于注意力机制的预测模型采用注意力机制的Seq2Seq算法。

进一步的,所述资源分配模型的训练过程包括:

将第m个V2I链路到基站在第f个子信道上的信道增益定义为g

定义动作空间A为a

定义状态空间S为目标车辆的车辆环境信息,表示为s

定义奖励函数R,目标是最大化V2I链路的容量,同时保证V2V链路的可-靠性,并且满足时延条件,奖励函数R定义为r

训练时采用DDPG算法,车辆输入当前时刻的状态s

一种车联网资源分配系统,包括:

获取模块,用于在预先构建的车联网通信场景中,利用通信链路获取车辆环境信息;所述车联网通信场景为车对车通信V2V以及车对基础设施通信V2I,通信链路包括V2V链路和V2I链路,V2V链路复用V2I链路的上行链路,并且每个V2I链路的上行链路只被一个V2V链路复用;所述车辆环境信息包括各个子信道的信道状态信息、当前车辆V2V链路的剩余负载大小以及剩余时延长度;所述信道状态信息包括信道增益和干扰强度;所述子信道为V2I链路被分配的频率范围后划分的子信道,V2V链路复用这些子信道;

通报模块,用于通过V2V链路以及V2I链路,周期性的向车联网通信场景内其他车辆终端或者基站通报目标车辆的位置信息、信道状态信息、子信道选择策略;

预测模块,用于在若目标车辆的当前时刻的信道状态信息获取失败或有误,则获取目标车辆的n个时刻信道增益以及干扰强度序列,输入到预先构建的基于注意力机制的预测模型,预测当前时刻的信道状态信息;

分配模块,用于将前车辆V2V链路的剩余负载大小、剩余时延长度以及预测的当前时刻的信道状态信息输入到预先训练好的资源分配模型,得到当前资源分配动作,根据当前资源分配动作得到子信道选择策略,根据子信道选择策略进行资源分配。

一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行所述的方法中的任一方法。

一种计算设备,包括,

一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。

本发明所达到的有益效果:

本发明利用注意力机制的时间序列预测模型对信道增益,干扰强度进行预测,确保能够得到较为准确的信道状态信息;深度强化学习算法良好的解决了传统资源分配方法求解凸优化问题复杂度高的缺点,利于车载设备使用;使用基于深度学习和注意力机制的时间序列预测解决了车联网信道状态变化快,获取实时信道状态信息困难的痛点,为资源分配模块提供了良好的信息支撑。

附图说明

图1是本发明的方法的流程示意图;

图2是本发明的系统的模块示意图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

如图1所示,一种车联网资源分配方法,包括:

构建一个车联网通信场景,包括车对车通信(V2V)以及车对基础设施通信(V2I),V2V链路复用V2I上行链路,并且每个V2I上行链路只被一个V2V链路复用。

初始化阶段:车辆初始化深度强化学习算法,如网络参数,经验池等。初始化环境感知模块,获取链路信息并进行第一次数据同步。

定义动作空间A为a

目标车辆收集车辆环境信息,如当前信道状态获取失败或获取值有明显错误,使用时间序列预测模型进行预测来获取当前时刻估计值。将当前时刻值转换为状态向量S

资源分配模型接受状态向量s

等待指定时隙后,回到步骤4进行下一次资源分配计算。

在动作a

相应的本发明还提供获取模块,用于在预先构建的车联网通信场景中,利用通信链路获取车辆环境信息;所述车联网通信场景为车对车通信V2V以及车对基础设施通信V2I,通信链路包括V2V链路和V2I链路,V2V链路复用V2I链路的上行链路,并且每个V2I链路的上行链路只被一个V2V链路复用;所述车辆环境信息包括各个子信道的信道状态信息、当前车辆V2V链路的剩余负载大小以及剩余时延长度;所述信道状态信息包括信道增益和干扰强度;所述子信道为V2I链路被分配的频率范围后划分的子信道,V2V链路复用这些子信道;

通报模块,用于通过V2V链路以及V2I链路,周期性的向车联网通信场景内其他车辆终端或者基站通报目标车辆的位置信息、信道状态信息、子信道选择策略;

预测模块,用于在若目标车辆的当前时刻的信道状态信息获取失败或有误,则获取目标车辆的n个时刻信道增益以及干扰强度序列,输入到预先构建的基于注意力机制的预测模型,预测当前时刻的信道状态信息;

分配模块,用于将前车辆V2V链路的剩余负载大小、剩余时延长度以及预测的当前时刻的信道状态信息输入到预先训练好的资源分配模型,得到当前资源分配动作,根据当前资源分配动作得到子信道选择策略,根据子信道选择策略进行资源分配。

如图2所示,所述系统,具体包括:环境感知模块,时间序列预测模块,数据同步模块以及资源分配模块。

环境感知模块:用于收集车辆的环境信息,包括各个子信道的信道增益,干扰强度,当前车辆V2V链路的剩余负载大小以及剩余时延长度(规定最大时延-已用时延)等信息。此模块包括以下过程:

1)环境信息获取:车辆通过无线模块获取当前车辆在每个子信道上的信道增益,可以是盲估计,半盲估计以及使用导频的方式等。同时,车辆感知每个信道上干扰信号的强度。

2)位置信息获取:车辆通过定位系统获取当前实时位置。

3)链路状态获取:收集当前待发送数据量以及相应的剩余时延,记为L

4)同步信息获取:从数据同步模块收集其他终端信道状态信息。

5)数据预处理:将收集到的环境信息以及链路信息进行准确性核验,当出现明显错误的数据时进行删除。若信道信息获取失败则准备使用时间序列预测模块进行预测。再将收集的数据转换为向量格式,方便资源分配模块中深度学习算法进行读取。

序列处理模块:针对车联网信道状态信息变化快,实时获取困难的问题,通过使用深度学习方式处理信道增益序列,来预测当前时刻的信道增益和干扰强度。主要包括以下步骤:

1)从环境感知模块处收集前n个时刻信道增益以及干扰强度序列。

2)由于环境感知模块获取的数据存在噪声等误差,因此对序列进行加权平均,滤波等操作,得到最优的序列值。并提取序列的周期性等特征,便于下一步预测。

3)当无法准确获取当前测量值时,通过使用注意力机制的Seq2Seq算法,如Transformer等进行序列的预测,得到当前时刻的预测值。将此值或预测值与测量值的加权平均作为当前时刻的信道增益或干扰强度。

数据同步模块:通过使用V2V链路以及V2I链路,周期性的向车联网内其他终端通报自己的位置信息,信道状态,子信道选择策略等。该模块主要包括2个同步机制:基于V2V链路的信道状态信息共享以及基于V2I的车联网间终端位置信息及子信道选择策略同步。

基于V2V链路的信道状态信息共享在已经建立连接的V2V终端之间进行同步,在执行功率分配达到给定周期后,通过V2V链路将各自的位置信息,信道状态进行通报,在需要更换子信道时也将同步更换策略。这里的周期可以通过给定一个值,或者要求在每次执行环境信息收集后进行同步。也可以在资源分配模块输出动作向量与前一次向量差值大于预设阈值,即分配策略变动比较大时进行。

基于V2I的车联网间终端位置信息及子信道选择策略同步是在基站和车联网终端之间发生。车联网终端周期性的将自己的位置信息,信道状态,子信道选择策略等汇报给基站,并由基站发送给其他终端。此过程中的子信道选择策略由资源分配模块给出每个子信道的优先权重,车辆根据权重大小以及获取到的离自身较近的车辆间的V2V链路的选择进行取舍,优先选择干扰小并且不会跟近距离的车辆重复复用的信道。将结果作为子信道选择策略向量发送给基站。

通过使用数据同步模块,可以让各个车辆在获取自身周围信道状态信息的同时,同步获得其他终端的信道信息,以进行V2V链路子信道选择的策略优化,并将策略共享给V2V对的另一个终端。

资源分配模块:利用环境感知模块和时间序列预测模块得到的环境信息以及信道状态信息,通过深度强化学习的方式进行数据的处理,分析,得到当前车辆使奖励函数最大化的资源分配方法。考虑到在实际车联网应用场景中,V2V与V2I链路都需要进行功率分配优化,因此本发明将联合优化V2V,V2I链路效果,并在保证V2V链路可靠性的情况下,提高V2I链路容量,并且可以通过调整神经网络的奖励函数参数来动态调节各个方面的权重。此模块主要包括以下步骤:

1)构建一个车联网通信场景,包括车对车通信(V2V)以及车对基础设施通信(V2I),V2V链路复用V2I上行链路,并且每个V2I上行链路只被一个V2V链路复用。

2)V2I链路和V2V链路的集合分别用M={1,2,…,M}和K={1,2,…,K}表示。在时域上,将时间划分为持续时间为t的时隙,从频域上将系统总带宽W

3)训练阶段使用DDPG算法,以最小化V2V用户中断概率以及最大化V2I用户系统容量为目标,同时满足时延条件。每一次训练时,车辆将收集到的本地信息如信道增益,干扰强度,剩余负载大小以及剩余时延信息等送入Actor网络和Critic网络。Actor网络根据输入选择动作,包括发射功率和复用子信道等。Critic网络计算奖励值,并更新网络参数。

4)每一轮训练完成,得到当前V2V用户发射功率以及信道复用策略,包括每个子信道的权重,车辆根据子信道的权重以及从同步模块获得的其他链路的复用策略选择子信道,避免重复复用。并使用该策略进行功率分配。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

技术分类

06120115628282