一种汽车试验台工况动态跟随测试系统及方法
文献发布时间:2024-04-18 19:58:53
技术领域
本发明涉及汽车工况测试领域,具体涉及一种汽车试验台工况动态跟随测试系统及方法。
背景技术
目前,基于PI控制的驾驶员模型是最常用的驾驶员模型,PI驾驶员模型以实际车速和目标车速偏差为输入,通过调整PI参数得到合适的踏板输出,进而实现工况跟随,但PI驾驶员模型参数难以确定。为了改进PI参数难以确定的缺点,有研究人员采用模糊PI控制和单神经元自适应PID,具有较好的适应性和鲁棒性,但未能处理不同工况下出相同速度偏差而生成相同的PID控制参数的问题。其次,采用智能控制算法建立驾驶员模型,保证了良好的车速跟随效果,但模型较为复杂,会显著影响优化效率。
发明内容
针对现有技术的缺陷,本发明提供一种汽车试验台工况动态跟随测试系统及方法,采用模糊PID与强化学习相结合的方式,解决了不同工况下出相同速度偏差而生成相同的PID控制参数的问题,工况跟随效果更好,并且能够进行自学习,进行控制参数的自动优化。
为了达到上述目的,本发明所采用的技术方案是:
一种汽车试验台工况动态跟随测试系统,包括驾驶员模块、试验台架和动力系统总成;
所述动力系统总成包括动力系统控制模块和汽车动力系统,动力系统控制模块用于接收加速踏板信号和制动踏板信号,并生成动力系统控制信号发送给整车控制器,整车控制器根据控制策略生成节气门开度信号、电机转矩信号或者制动压力信号,对汽车动力系统进行动力控制;
所述试验台架包括测功机和试验台控制器,试验台控制器根据转速转矩传感器获取的动力系统总成中传动轴的转速计算实际车速,并将实际车速传递给驾驶员模块,由驾驶员模块结合目标车速对实际车速进行调整;
所述驾驶员模块包括上位机,所述上位机采用Q学习算法与模糊PID控制,用于生成实时的PID控制参数,通过PID控制参数生成相应的加速或制动信号传递给整车控制器,用于汽车行驶工况自动测试。
进一步地,所述动力系统控制模块包括整车控制器、发动机控制器和电机控制器,所述汽车动力系统包括发动机、行星齿轮机构、ISG电机、驱动电机、变速箱,驱动电机的输出轴和传动轴机械连接,在传动轴上设置转速转矩传感器,转速转矩传感器与测功机控制器信号连接。
一种汽车试验台工况动态跟随测试方法,包括以下步骤:
S1.确定输入变量,包括:目标车速与实际车速的差值e、车速差值的变化率ec、工况类型Road
S2.变量模糊化处理:对输入变量从基本论域到模糊论域的转换;
S3.所述工况类型采用高斯型隶属函数,采用Q学习算法通过对语气算子λ的调整,实现高斯型隶属函数的动态调整;
S4.通过模糊推理与清晰化求得PID控制参数。
进一步地,步骤3中,采用Q学习算法对语气算子调整包括,初始化Q值、确定状态,执行动作,获得奖励,更新Q值。
进一步地,所述Q学习算法的状态变量具体为:S
进一步地,所述Q学习算法的动作具体为:语气算子调整,采用ε-贪婪策略,根据工况跟随效果和语气算子的动作获取最大奖励值,并更新Q值表。
进一步地,采用Q学习算法对语气算子λ调整的具体过程为:设其中一个工况隶属函数为
进一步地,Q学习网络的奖励函数具体为:R=-(V
进一步地,在每一步决策更新结束后,根据公式Q(s
有益效果:本发明采用模糊PID与强化学习相结合的方式,在模糊PID控制的基础上采用Q学习算法对隶属函数语气算子进行调整,处理了不同工况下出相同速度偏差而生成相同的PID控制参数的问题,使得工况跟随效果更好,并且能进行自学习,进行控制参数的自动优化。
附图说明
图1本发明汽车试验台工况动态跟随测试系统框图;
图2Q值表的更新过程。
具体实施方式
下面结合附图和具体实施例对本发明做进一步详细的说明。
如图1所示,一种汽车试验台工况动态跟随测试系统,包括驾驶员模块、试验台架和动力系统总成。
所述动力系统总成包括动力系统控制模块和汽车动力系统,所述动力系统控制模块包括整车控制器、发动机控制器和电机控制器,所述汽车动力系统包括发动机、行星齿轮机构、ISG电机、驱动电机、变速箱,驱动电机的输出轴和传动轴机械连接,在传动轴上设置转速转矩传感器,转速转矩传感器与测功机控制器信号连接。动力系统控制模块用于接收加速踏板信号和制动踏板信号,并生成动力系统控制信号发送给整车控制器,整车控制器根据控制策略生成节气门开度信号、电机转矩信号或者制动压力信号,对汽车动力系统进行动力控制。
所述驾驶员模块包括上位机,所述上位机采用Q学习算法与模糊PID控制,用于生成实时的PID控制参数,PID控制参数生成相应的加速或制动信号传递给整车控制器,用于汽车行驶工况自动测试。
所述试验台架包括测功机和试验台控制器,所述试验台控制器用于获取实际车速并传递给驾驶员模块,试验台控制器根据转速转矩传感器获取的动力系统总成中传动轴的转速计算实际车速,并将实际车速反馈到上位机调整车速。
本发明还提供一种汽车试验台工况动态跟随测试方法,通过Q学习算法对模糊PID控制参数进行调整,包括确定输入变量、变量模糊化处理、对隶属函数动态调整、通过模糊化推理与清晰化求得PID控制参数等几个步骤。
在进行汽车试验台工况动态跟随测试前,需要将整车参数包括汽车总质量、轮胎半径、滚动阻力系数、空气阻力系数、汽车迎风面积、汽车旋转质量转换系数、行驶工况等信息先输入到试验台控制器中,试验台架准备完毕后,进行工况跟随测试,具体为:
S1.确定输入变量,包括:目标车速与实际车速的差值e、车速差值的变化率ec、工况类型Road
设定系统的各项初始参数,设系统目标速度与实际速度偏差为e(t),初始论域为(-e,e),车速差值变化率为
S2.变量模糊化处理:对输入变量从基本论域到模糊论域的转换;进行模糊推理决策,选取适当的模糊语言变量,确定语言变量的隶属函数,最后建立模糊控制规则,其中,速度偏差与速度偏差变化率的语言变量采用“负大、负中、负小、零、正小、正中、正大”来描述,工况类型语言变量采用“零、正小、正中、正大”来描述,速度偏差与速度偏差变化率的隶属度函数选择三角形隶属函数与梯形隶属函数组合的方式,工况类型隶属函数采用高斯型隶属函数,最后建立模糊规则,根据目标速度与实际速度偏差大小及偏差变化率的趋势来确定输出量的大小。
S3.所述工况类型采用高斯型隶属函数,采用Q学习算法通过对语气算子λ的调整,实现高斯型隶属函数的动态调整。
在模糊控制中,尽管初始论域、初始规则通过在线调整一般能保证系统的稳定性,然而在不同工况下会出现相同的速度偏差e和速度偏差变化率ec计算出相同的结果,然而这些结果可能并不是对这些工况都是最优,因此采用Q学习算法,实现对高斯型隶属函数的动态调整以适应不同的工况类型,确保当前工况的最优PID控制量。
S4.通过模糊推理与清晰化求得PID控制参数。
把模糊量转化为精确量,目前常用的去模糊化有以下几种方法:最大隶属度法、重心法和加权平均法。为了获得准确的控制量,本发明选用重心法去模糊化后得到ΔK
在上述技术方案中,步骤3中,Q学习算法对语气算子的调整过程包括,初始化Q值、确定状态,执行动作,获得奖励及更新Q值等。
其中,Q学习算法的状态变量具体为:S
所述Q学习算法的动作具体为:语气算子调整量,采用ε-贪心策略,根据所述工况跟随效果和所述语气算子的动作获取最大奖励值,并更新所述Q值表。其中,ε-贪心是一种常用的策略,其值介于0到1,表示有ε的概率应采用公式所计算出来的语气算子λ的调整幅值大小,有1-ε的概率不通过Q表而从离散的调整信号取值集合中随机选择语气算子λ的调整幅值大小。
采用Q学习算法对语气算子λ调整的具体过程为:设其中一个高斯隶属函数为
需要说明的是,一般情况是计算工况类型(可以理解为速度的大小)落入两峰值之间的两个隶属度函数,其他峰值的隶属度函数不变,当再次改变该隶属度函数时,是以上次改变后的隶属度函数作为其基隶属度函数,而不是最初的隶属度函数。
Q学习网络的奖励函数具体为:R=-(V
在上述技术方案中,用Q表进行学习时采用q-learning算法,在每一步决策更新结束后,依照公式Q(s
本发明在模糊PID控制的基础上采用Q学习算法对隶属函数语气算子进行调整,以目标车速与实际车速的差值e、车速差值的变化率ec、工况类型作为强化学习的状态,以语气算子λ的改变作为强化学习的动作,解决了不同工况下由于出现相同的车速偏差e和车速偏差变化率ec而生成相同的控制参数的问题,使工况测试具有一定的自学习能力,且显著提升了控制参数的优化效率。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。