掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本申请涉及电池、新能源车辆、车联网、机器学习等技术领域,尤其涉及一种机器学习模型构建方法、电池健康度预测方法以及装置。

背景技术

随着新能源汽车的普及,锂电池成为重要的动力源。锂电池的健康度(State ofHealth,SOH)是影响电池性能和寿命的关键因素,因此,对电池健康度进行预测的准确性和稳定性,要求越来越高。随着电池使用年限增加,电池健康度不断下降,能准确并实时地预测电池健康度具有重要意义。相关技术在预测电池健康度时,预测结果不够准确。

发明内容

鉴于上述问题,本申请提供一种机器学习模型构建方法、电池健康度预测方法、装置、电子设备、存储介质及程序产品,能够缓解电池健康度预测不够准确的问题。

第一方面,本申请提供了机器学习模型构建方法,所述机器学习模型适用于预测电池健康度,所述方法包括:获取电池在充电过程中的电池特征数据,作为电池样本数据;处理所述电池样本数据,得到与所述电池样本数据对应的电池健康度标签;基于所述电池样本数据和模型参数,分别构建至少一个机器学习模型;基于每个机器学习模型输出的电池健康度预测结果与所述电池健康度标签之间的偏差,从所述至少一个机器学习模型中确定目标机器学习模型。

本申请实施例的技术方案中,将电池特征数据作为电池样本数据构建机器学习模型,机器学习模型能够用于预测电池健康度,提高了电池健康度的预测准确性,实现了对电池健康度的远程监控,便于针对健康度较低的电池提前采取相关应对措施以降低对车辆驾驶的影响。

在一些实施例中,所述电池样本数据包括至少一个连续充电数据;所述处理所述电池样本数据,得到与所述电池样本数据对应的电池健康度标签包括:基于预设的充电量阈值,从所述至少一个连续充电数据中确定目标连续充电数据,其中,所述目标连续充电数据的充电量大于或等于所述预设的充电量阈值;处理所述目标连续充电数据,得到所述电池健康度标签。

本申请实施例的技术方案中,基于预设的充电量阈值,从多个连续充电数据中选择满足条件的目标连续充电数据来进行电池健康度标签的计算,提高了电池健康度标签的准确性,进而提高了机器学习模型的预测准确性。

在一些实施例中,所述目标连续充电数据包括多个目标连续充电数据;所述处理所述目标连续充电数据,得到所述电池健康度标签包括:分别处理所述多个目标连续充电数据,得到与所述多个目标连续充电数据一一对应的多个电池健康度;确定所述多个电池健康度之间差异数据;在所述差异数据小于预设差异数据的情况下,将所述多个电池健康度的均值作为所述电池健康度标签。

本申请实施例的技术方案中,将差异性较小的电池健康度的均值作为电池健康度标签,提高了电池健康度标签的准确性。

在一些实施例中,每个目标连续充电数据包括实际充电量比例数据和实际充电容量数据;所述分别处理所述多个目标连续充电数据,得到与所述多个目标连续充电数据一一对应的多个电池健康度包括:基于所述实际充电容量数据和所述实际充电量比例数据之间的比值,得到电池在充满电状态下的参考充电容量数据;基于所述参考充电容量数据与标准充电容量数据之间的比值,得到所述电池健康度。

在一些实施例中,所述方法还包括:对所述电池样本数据进行预处理;所述对所述电池样本数据进行预处理包括以下至少一项:在所述电池样本数据包括采集的电池剩余容量数据和采集的电压数据的情况下,基于电池容量和电压之间的真实关联关系,确定与采集的电压数据对应的真实电池容量数据,并将所述真实电池容量数据添加至所述电池样本数据中;在所述电池健康度标签表示电池健康度小于预设健康度阈值的情况下,将与所述电池健康度标签对应的所述电池样本数据进行删除;去除所述电池样本数据中的异常数据。

本申请实施例的技术方案中,计算电池的真实电池容量数据以扩充电池样本数据,提高了电池样本数据的多样性,且使得电池样本数据更好地反映电池的特征,通过对电池样本数据进行预处理,提高了电池样本数据的准确性,进而提高了机器学习模型的预测准确性。

在一些实施例中,所述获取电池在充电过程中的电池特征数据,作为电池样本数据包括:获取电池在充电过程中的初始特征数据,其中,所述初始特征数据包括多个指标数据;将与所述初始特征数据对应的初始健康度标签为参考,确定每个指标数据的重要度,其中,所述重要度用于表征指标数据对电池健康度的影响程度;基于所述重要度,从所述多个指标数据中筛选出目标指标数据;将所述目标指标数据确定为所述电池样本数据,其中,所述初始健康度标签为与所述电池样本数据对应的电池健康度标签。

本申请实施例的技术方案中,从多个指标数据中筛选出对电池健康度的影响程度大的目标指标数据作为用于构建机器学习模型的电池样本数据,提高了机器学习模型的预测准确性和稳定性。

在一些实施例中,所述将与所述初始特征数据对应的初始健康度标签为参考,确定每个指标数据的重要度包括:利用多个评价模型,分别以所述初始健康度标签为参考对每个指标数据进行评价,得到针对每个指标数据的多个重要度,所述多个重要度与所述多个评价模型一一对应。

本申请实施例的技术方案中,通过多个评价模型分别对每个指标数据进行评价,即通过多个评价模型对指标数据进行投票以筛选出重要的指标数据,提高了指标数据的筛选准确性。

在一些实施例中,所述基于所述重要度,从所述多个指标数据中筛选出目标指标数据包括:在所述多个重要度中至少具有预设数量个重要度满足重要度阈值条件的情况下,将对应的指标数据确定为所述目标指标数据。

在一些实施例中,所述多个评价模型包括以下至少两个:回归模型、特征选择模型、随机森林模型。

在一些实施例中,所述机器学习模型包括随机森林模型;所述模型参数包括与所述至少一个机器学习模型一一对应的至少一组模型参数,每一组模型参数是利用网格搜索方式从候选模型参数中搜索得到的。

本申请实施例的技术方案中,在构建机器学习模型的过程中,通过网格搜索方式搜索得到多组模型参数,将每组模型参数对应的机器学习模型预测得到的电池健康度预测结果与电池健康度标签进行对比,以便从至少一个机器学习模型中选择预测准确性最高的目标机器学习模型,提高了模型的准确性和鲁棒性。

在一些实施例中,所述电池样本数据包括以下至少一个:电池电压数据、电池电流数据、电池温度数据、电池容量数据。

另一方面,本申请提供了一种电池健康度预测方法,所述方法包括:获取电池在充电过程中的电池特征数据;将所述电池特征数据输入机器学习模型中,由所述机器学习模型预测电池健康度,其中,所述机器学习模型是利用上述机器学习模型构建方法构建得到的。

另一方面,本申请提供了一种机器学习模型构建装置,所述机器学习模型适用于预测电池健康度,所述装置包括:获取模块、处理模块、构建模块和确定模块。获取模块,用于获取电池在充电过程中的电池特征数据,作为电池样本数据;处理模块,用于处理所述电池样本数据,得到与所述电池样本数据对应的电池健康度标签;构建模块,用于基于所述电池样本数据和模型参数,分别构建至少一个机器学习模型;确定模块,用于基于每个机器学习模型输出的电池健康度预测结果与所述电池健康度标签之间的偏差,从所述至少一个机器学习模型中确定目标机器学习模型。

另一方面,本申请提供了一种电池健康度预测装置,所述装置包括:获取模块和预测模块。获取模块,用于获取电池在充电过程中的电池特征数据;预测模块,用于将所述电池特征数据输入机器学习模型中,由所述机器学习模型预测电池健康度,其中,所述机器学习模型是利用上述机器学习模型构建装置构建得到的。

另一方面,本申请提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项实施方式所述的方法的步骤。

另一方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项实施方式所述的方法的步骤。

另一方面,本申请提供了一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述任一项实施方式所述的方法的步骤。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

附图说明

通过阅读对下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在全部附图中,用相同的附图标号表示相同的部件。在附图中:

图1为本申请实施方式提供的机器学习模型构建方法的流程示意图;

图2为本申请实施方式提供的电池健康度预测方法的流程示意图;

图3为本申请实施方式提供的机器学习模型构建方法和电池健康度预测方法的流程示意图;

图4为本申请实施方式提供的机器学习模型构建装置的示意图;

图5为本申请实施方式提供的电池健康度预测装置的示意图。

具体实施方式

下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。

在本申请实施例的描述中,技术术语“第一”“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本申请实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

在本申请实施例的描述中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

在本申请实施例的描述中,术语“多个”指的是两个以上(包括两个),同理,“多组”指的是两组以上(包括两组),“多片”指的是两片以上(包括两片)。

在本申请实施例的描述中,技术术语“中心”“纵向”“横向”“长度”“宽度”“厚度”“上”“下”“前”“后”“左”“右”“竖直”“水平”“顶”“底”“内”“外”“顺时针”“逆时针”“轴向”“径向”“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请实施例的限制。

在本申请实施例的描述中,除非另有明确的规定和限定,技术术语“安装”“相连”“连接”“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;也可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请实施例中的具体含义。

随着新能源汽车的普及,锂电池成为重要的动力源。锂电池的健康度(State ofHealth,SOH)是影响电池性能和寿命的关键因素,因此,对电池健康度进行预测的准确性和稳定性,要求越来越高。随着电池使用年限增加,电池健康度不断下降,能准确并实时地预测电池健康度具有重要意义。相关技术在预测电池健康度时,预测结果不够准确。

在一些示例中,用于估计电池健康度的方法,比如传统的电化学方法,需要破坏电池结构进行测试,该方式不适用于在线预测新能源车辆的电池健康度。

在一些示例中,可以通过实验获取电池在充电状态、放电状态下不同时间点的外特征参数的均值、标准差、最差和极差,以构建特征指标,并基于相关模型估计锂电池剩余电量SOC(State of Charge)。该方式通过提取充放电过程的外特征参数的统计学指标,在构建模型时,指标能够提供的信息相对有限。同时,基于实验条件构建出的模型无法用于评估实际运行的车辆电池健康度。可见,该方式获取的锂电池指标特征为指定充放电状态实验所得的电压、电流、温度等统计类指标。而车辆实际运行情况复杂,实验条件下无法模拟反映真实数据场景,该方式无法直接用于提取车辆实际运行的指标数据,无法实现实际场景下车辆电池健康度的预测。

有鉴于此,本申请实施方式提供了一种优化的机器学习模型构建方法和电池健康度预测方法。

图1为本申请实施方式提供的机器学习模型构建方法的流程示意图。

如图1所示,本申请实施方式提供的机器学习模型构建方法100例如包括步骤S110-S140,机器学习模型适用于预测电池健康度。

步骤S110,获取电池在充电过程中的电池特征数据,作为电池样本数据。

步骤S120,处理电池样本数据,得到与电池样本数据对应的电池健康度标签。

示例性,电池样本数据包括电池在充电过程中的电池特征数据。电池健康度标签用于表示电池健康度(State of Health,SOH)。在得到电池样本数据之后,需要进一步处理电池样本数据得到针对该电池样本数据的电池健康度标签。

步骤S130,基于电池样本数据和模型参数,分别构建至少一个机器学习模型。

示例性地,模型参数为构建机器学习模型所需的相关模型参数。例如,当机器学习模型由节点或神经元构成时,模型参数包括节点或神经元的个数、节点或神经元构成的网络层级的层数或网络深度、表征节点之间或神经元之间的连接关系的参数等等。根据模型参数的不同,可以构建不同的机器学习模型,可见,基于电池样本数据和不同的模型参数,可以构建至少一个机器学习模型。

步骤S140,基于每个机器学习模型输出的电池健康度预测结果与电池健康度标签之间的偏差,从至少一个机器学习模型中确定目标机器学习模型。

示例性地,每个机器学习模型在构建完成之后可以输出针对电池样本数据的电池健康度预测结果。基于电池健康度预测结果和电池健康度标签之间的偏差,从至少一个机器学习模型中确定目标机器学习模型,例如从至少一个机器学习模型中确定偏差最小的模型作为目标机器学习模型,以便利用目标机器学习模型进行后续的电池健康度预测。

可以理解,本申请的实施例将电池特征数据作为电池样本数据构建机器学习模型,机器学习模型能够用于预测电池健康度,提高了电池健康度的预测准确性,实现了对电池健康度的远程监控,便于针对健康度较低的电池提前采取相关应对措施以降低对车辆驾驶的影响。基于车辆运行过程中的电池特征数据,可以实现非接触、实时、低成本的电池健康度预测。

在一示例中,电池样本数据包括电池电压数据、电池电流数据、电池温度数据、电池容量数据中的至少一个。电池电压数据包括电池在充电过程中的电压。电池电流数据包括电池在充电过程中的电流。电池温度数据包括电池在充电过程中的电池温度。电池容量数据包括电池在充电过程中的荷电状态SOC(State of Charge),荷电状态用于表示电池的剩余容量。

在另一示例中,通过处理电池样本数据,可以得到与电池样本数据对应的电池健康度标签。

示例性地,电池样本数据包括至少一个连续充电数据。例如在一次连续充电中将电池从剩余电量10%充至100%,则对应的连续充电数据包括充电量90%(即100%-10%=90%)。例如在一次连续充电中将电池从剩余电量70%充至100%,则对应的连续充电数据包括充电量30%(即100%-70%=30%)。

接下来,基于预设的充电量阈值,从至少一个连续充电数据中确定目标连续充电数据,目标连续充电数据的充电量大于或等于预设的充电量阈值。然后处理目标连续充电数据得到电池健康度标签。

预设的充电量阈值例如可以设置为60%,如果连续充电数据小于预设的充电量阈值,表示该连续充电数据过小导致对电池健康度的反映效果不佳。如果连续充电数据大于或等于预设的充电量阈值,表示该连续充电数据较大,对电池健康度的反映效果较好。基于预设的充电量阈值,从至少一个连续充电数据中确定目标连续充电数据,便于在基于目标连续充电数据计算电池健康度标签时准确性较高。目标连续充电数据例如包括充电量90%。

可见,本申请的实施例基于预设的充电量阈值,从多个连续充电数据中选择满足条件的目标连续充电数据来进行电池健康度标签的计算,提高了电池健康度标签的准确性,进而提高了机器学习模型的预测准确性。

示例性地,在确定出目标连续充电数据之后,如果目标连续充电数据包括多个目标连续充电数据,需要分别处理每个目标连续充电数据,以便得到电池健康度标签。

例如,分别处理多个目标连续充电数据,得到与多个目标连续充电数据一一对应的多个电池健康度。在另一示例中,每个目标连续充电数据包括实际充电量比例数据和实际充电容量数据。针对每个目标连续充电数据,基于对应的实际充电容量数据和对应的实际充电量比例数据之间的比值,得到电池在充满电状态下的参考充电容量数据,参考充电容量数据表示电池在充满电状态下的容量数据。

以一个目标连续充电数据为例,电池在一次连续充电过程中充电量为80%(比如从20%充到100%),则实际充电量比例数据为80%,并且实际充电容量数据比如是72安时(Ah),此时电池在充满电状态下(如从0%充到100%)参考充电容量数据为90安时(即72安时/80%)。

以另一个目标连续充电数据为例,电池在一次连续充电过程中充电量为90%(比如从10%充到100%),则实际充电量比例数据为90%,并且实际充电容量数据比如是108安时(Ah),此时电池在充满电状态下(如从0%充到100%)参考充电容量数据为120安时(即108安时/90%)。

接下来,基于参考充电容量数据与标准充电容量数据之间的比值,得到电池健康度。例如,电池的标准充电容量数据为150安时,表示电池在健康度较高的情况下(理想的情况下)充满电的容量为150安时。参考充电容量数据90安时与标准充电容量数据150安时之间的比值为0.6,参考充电容量数据120安时与标准充电容量数据150安时之间的比值为0.8,多个电池健康度为0.6、0.8。

在得到多个电池健康度之后,确定多个电池健康度之间差异数据,在差异数据小于预设差异数据的情况下,将多个电池健康度的均值作为电池健康度标签。

例如,差异数据包括标准差,预设差异数据包括预设标准差。计算多个电池健康度0.6、0.8的标准差,如果标准差小于预设标准差,表示数据之间的差异性较小,可以将多个电池健康度0.6、0.8的均值0.7作为电池健康度标签。

可以理解,将差异性较小的电池健康度的均值作为电池健康度标签,提高了电池健康度标签的准确性。

示例性地,如果多个电池健康度的标准差小于预设标准差,可以去除对应的电池样本数据。

示例性地,如果目标连续充电数据只有一个,则无需计算标准差和均值,计算得到对应的电池健康度之后,可以直接将该电池健康度作为电池健康度标签。

在另一示例中,还可以对电池样本数据进行预处理,以提高电池样本数据的数据质量。预处理包括向电池样本数据中添加数据、删除部分电池样本数据、去除电池样本数据中的异常数据等等。

例如,电池的剩余容量数据与电压数据具有关联关系,关联关系可以以OCV(OpenCircuit Voltage)曲线表示。OCV曲线是一个在电池充放电过程中,电压随电池容量变化而变化的曲线。在电池样本数据包括采集的电池剩余容量数据和采集的电压数据的情况下,采集的电池剩余容量数据通常是车辆显示的容量数据,该显示的容量数据与真实的剩余容量数据之间具有一定差异。基于电池容量和电压之间的真实关联关系(如OCV曲线),从OCV曲线中确定与采集的电压数据对应的真实电池容量数据,并将真实电池容量数据添加至电池样本数据中,使得预处理后的电池样本数据包括采集的电池剩余容量数据和真实电池容量数据。可见,通过真实电池容量数据来扩充电池样本数据,提高了电池样本数据的多样性。

根据电池实质特性设定预设健康度阈值,预设健康度阈值用于表示电池健康度是否符合电池特性。在电池健康度标签表示电池健康度小于预设健康度阈值的情况下,可知对应的电池样本数据存在异常,此时将与电池健康度标签对应的电池样本数据进行删除。预设健康度阈值可以根据实际情况具体设置,例如可以设置为0.2、0.3等。

另外,还可以对电池样本数据进行异常检测,去除电池样本数据中的异常数据,异常数据例如包括冗余数据、格式不符合预定要求的数据等。

可以理解,本申请的实施例的数据预处理方式,通过计算电池的真实电池容量数据以扩充电池样本数据,提高了电池样本数据的多样性,删除部分电池样本数据和去除电池样本数据中的异常数据使得电池样本数据更好地反映电池的特征。可见,通过对电池样本数据进行预处理,提高了电池样本数据的数据质量,进而提高了机器学习模型的预测准确性。

在另一示例中,可以首先获取电池在充电过程中的初始特征数据,然后对初始特征数据进行处理得到电池样本数据,并将与初始特征数据对应的初始健康度标签作为与电池样本数据对应的电池健康度标签。

例如,每个初始特征数据均包括多个指标数据,多个指标数据例如包括电池电压数据、电池电流数据、电池温度数据、电池容量数据等等,更具体地,比如电压最大值是一个指标,电压最小值是一个指标,比如温度最大值是一个指标,温度最小值是一个指标等等。每个指标数据对电池健康度的影响程度不同,有些指标数据对电池健康度的影响程度很大,有些指标数据对电池健康度的影响程度很小,因此每个指标数据的重要度是不同的。例如,对电池健康度影响程度大的指标数据,其重要度也大。

示例性地,以初始健康度标签为参考确定每个指标数据的重要度,基于重要度从多个指标数据中筛选出目标指标数据,例如将重要度大的至少一个指标数据确定为目标指标数据。然后,将目标指标数据确定为电池样本数据。

示例性地,利用多个评价模型分别评价每个指标数据。例如利用多个评价模型分别以初始健康度标签为参考对每个指标数据进行评价,得到针对每个指标数据的多个重要度,多个重要度与多个评价模型一一对应。在多个重要度中至少具有预设数量个重要度满足重要度阈值条件的情况下,将对应的指标数据确定为目标指标数据。

具体地,以多个评价模型包括回归模型、特征选择模型、随机森林模型为例,以一个初始特征数据为例,该初始特征数据对应的初始健康度标签例如为0.7,该初始特征数据例如包括指标数据a、指标数据b、指标数据c、指标数据d。分别利用回归模型、特征选择模型、随机森林模型以初始健康度标签为参考,在基于初始健康度为0.7前提下评价指标数据a对电池健康度的影响程度,分别得到针对指标数据a的多个重要度为1、1、0(回归模型输出1,特征选择模型输出1,随机森林模型输出0)。多个重要度1、1、0中至少具有预设数量个重要度满足重要度阈值条件包括:至少具有2个重要度为1或大于0,即,预设数量例如为2,重要度满足重要度阈值条件例如为重要度为1或大于0。

类似地,利用回归模型、特征选择模型、随机森林模型对指标数据b进行评价,分别得到多个重要度为1、1、1。利用回归模型、特征选择模型、随机森林模型对指标数据c进行评价, 分别得到多个重要度为1、0、0, 利用回归模型、特征选择模型、随机森林模型对指标数据d进行评价,分别得到多个重要度为0、0、0。

可见,指标数据a对应的多个重要度、指标数据b对应的多个重要度,均至少具有预设数量个重要度满足重要度阈值条件,因此将指标数据a、指标数据b确定为目标指标数据,并将目标指标数据作为构建机器学习模型的电池样本数据。

示例性地,回归模型例如包括Lasso回归模型,特征选择模型例如包括SelectKBest模型。

可以理解,本申请的实施例通过多个评价模型分别对每个指标数据进行评价,实现了通过多个评价模型对指标数据进行投票以筛选出重要的指标数据,提高了指标数据的筛选准确性。从初始特征数据中筛选出最优特征子集(目标指标数据)作为构建机器学习模型的电池样本数据,使用投票法筛选多种指标数据可以提高模型的准确性和稳定性。

在另一示例中,机器学习模型包括随机森林模型,具体可以包括随机森林分类模型。用于构建机器学习模型的模型参数包括与至少一个机器学习模型一一对应的至少一组模型参数,每一组模型参数均是利用网格搜索方式从候选模型参数中搜索得到的。例如,利用网格搜索方式,从候选模型参数中搜索第一组模型参数,第一组模型参数例如包括随机森林模型的节点个数、节点构成的网络层级的层数或网络深度、表征节点之间的连接关系的参数等等。

在利用第一组模型参数构建随机森林模型时,电池样本数据中的每个指标数据对应于一个节点。例如,指标数据为电池温度数据对应的节点的分类逻辑例如为将电池温度大于40℃的电池样本数据分类至下一层的第一节点(第一节点例如对应电池电压数据),将电池温度小于等于40℃的电池样本数据分类至下一层的第二节点(第二节点例如对应电池电流数据)。

第一节点对应的分类逻辑例如为将电池电压大于某一电压值的电池样本数据分类至下一层的第三节点,将电池电压小于等于某一电压值的电池样本数据分类至下一层的第四节点。第二节点对应的分类逻辑例如为将电池电流大于某一电流值的电池样本数据分类至下一层的第五节点,将电池电流小于等于某一电流值的电池样本数据分类至下一层的第六节点。以此类推,构建得到与第一组模型参数对应的第一个随机森林模型。

接下来,利用网络搜索方式重新从候选模型参数中搜索第二组模型参数,第二组模型参数与第一组模型参数至少有一个参数不同。基于第二组模型参数和电池样本数据构建第二个随机森林模型。以此类推构建得到多个随机森林模型。

然后,根据多个随机森林模型分别输出的电池健康度预测结果与电池健康度标签之间的偏差,从多个随机森林模型中选择预测准确性最高的一个或多个作为目标机器学习模型,优选地,目标机器学习模型为一个,目标机器学习模型对应的一组模型参数为利用网络搜索方式搜索得到的最佳参数组合。

可以理解,在构建机器学习模型的过程中,通过网格搜索方式搜索得到多组模型参数,将每组模型参数对应的机器学习模型预测得到的电池健康度预测结果与电池健康度标签进行对比,以便从至少一个机器学习模型中选择预测准确性最高的目标机器学习模型,以提高模型预测的准确性和鲁棒性。

在另一示例中,可以将电池样本数据划分为训练集和测试集两部分,利用训练集来构建机器学习模型。在构建得到目标机器学习模型之后,可以利用测试集测试目标机器学习模型的预测能力。例如模型对测试集中每个样本数据进行预测得到预测结果,确定预测结果和标签之间的差值,得到与测试集中多个电池样本数据一一对应的多个差值,基于多个差值之间的平均绝对偏差和/或R

图2为本申请实施方式提供的电池健康度预测方法的流程示意图。

如图2所示,本申请实施方式提供的电池健康度预测方法200例如包括步骤S210-S220。

步骤S210,获取电池在充电过程中的电池特征数据。

步骤S220,将电池特征数据输入机器学习模型中,由机器学习模型预测电池健康度。

示例性地,本申请实施例的机器学习模型包括上文所指的目标机器学习模型。

图3为本申请实施方式提供的机器学习模型构建方法和电池健康度预测方法的流程示意图。

如图3所示,本申请实施方式提供的机器学习模型构建方法和电池健康度预测方法300例如包括步骤S310-S370。

步骤S310,获取电池样本数据。

示例性地,获取车联网数据,基于车联网数据判断车辆实际运行状态,提取实际使用场景下电池充电过程的相关数据作为电池样本数据。电池样本数据包括电池剩余电量SOC数据、电池电压数据、电池电流数据、电池温度数据等。

步骤S320,生成针对电池样本数据的电池健康度标签。

电池样本数据包括至少一个连续充电数据,设置预设的充电量阈值以从至少一个连续充电数据中选取满足条件的目标连续充电数据。利用安时积分法进行计算得到电池健康度标签,安时积分法的计算过程可参考上文,在此不再赘述。

步骤S330,数据预处理。

去除电池样本数据中的异常值,以进行数据清洗。本申请的电池包括磷酸铁锂电池,根据磷酸铁锂电池实际特性,基于表示电压和容量关系的OCV曲线得到真实电池容量数据SOC,将真实电池容量数据SOC添加至电池样本数据,使得电池样本数据包括真实电池容量数据SOC和采集的电池容量数据SOC(采集的电池容量数据为车辆显示的容量数据)。

步骤S340,利用集成模型筛选目标指标数据。

例如,电池样本数据包括多个指标数据,利用集成模型进行指标数据的筛选。集成模型包括Lasso回归、SelectKBest模型、随机森林算法等等,通过多种模型基于投票法筛选出最优的特征子集(目标指标数据),从而得到用于构建机器学习模型的最优电池样本数据。使用投票法筛选出重要指标数据可以提高模型的准确性和稳定性。

步骤S350,构建机器学习模型。

示例性地,机器学习模型包括随机森林模型。随机森林模型包括多个决策树。将电池样本数据拆分为训练集和训练集。在利用训练集构建模型时,利用网格搜索方式多次调节模型参数,得到多组不同的模型参数,并将不同组的模型参数对应的模型输出的电池健康度预测结果分别与电池健康度标签进行对比,选出预测准确性最高的最佳的一组模型参数,将最佳的一组模型参数对应的模型作为最终的机器学习模型,以此提升模型的准确性和鲁棒性。

步骤S360,评估机器学习模型的预测效果。

示例性地,利用测试集对构建的模型进行测试,比如计算模型输出的预测结果和标签之间的平均绝对偏差和/或R

步骤S370,利用机器学习模型预测电池健康度。

示例性地,获取车联网数据,对车辆网数据进行如上述步骤S310-S340的处理,得到电池在实际充电过程中的电池特征数据,将电池特征数据输入已构建的机器学习模型中进行预测,得到电池健康度。

可以理解,本申请的实施例基于车辆网数据识别出车辆实际使用下电池充电特征,使用安时积分法和机器学习模型将电池健康度的预测转化为监督分类学习,建立反映多指标特征和电池健康度之间的关系的机器学习模型,利用机器学习模型可以实现不同型号、不同工况等复杂条件下的电池健康度预测。本申请的实施例够解决传统锂电池健康度预测中限制条件多、覆盖率低、泛化性差的问题。另外,本申请无需实际测量电池的健康度,可基于大量的车辆网数据构建模型,利用模型预测健康度,实现了锂电池的远程监测,具有广泛的应用前景。

图4为本申请实施方式提供的机器学习模型构建装置的示意图。

本申请实施方式提供一种机器学习模型构建装置400,请参阅图4,机器学习模型构建装置400包括:第一获取模块410、处理模块420、构建模块430和确定模块440。

示例性地,第一获取模块410用于获取电池在充电过程中的电池特征数据,作为电池样本数据。

示例性地,处理模块420用于处理电池样本数据,得到与电池样本数据对应的电池健康度标签。

示例性地,构建模块430用于基于电池样本数据和模型参数,分别构建至少一个机器学习模型。

示例性地,确定模块440用于基于每个机器学习模型输出的电池健康度预测结果与电池健康度标签之间的偏差,从至少一个机器学习模型中确定目标机器学习模型。

可以理解,关于机器学习模型构建装置400的具体描述,可以参见上文中对机器学习模型构建方法的描述。

示例性地,电池样本数据包括至少一个连续充电数据;处理模块420用于:基于预设的充电量阈值,从至少一个连续充电数据中确定目标连续充电数据,其中,目标连续充电数据的充电量大于或等于预设的充电量阈值;处理目标连续充电数据,得到电池健康度标签。

示例性地,目标连续充电数据包括多个目标连续充电数据;处理目标连续充电数据,得到电池健康度标签包括:分别处理多个目标连续充电数据,得到与多个目标连续充电数据一一对应的多个电池健康度;确定多个电池健康度之间差异数据;在差异数据小于预设差异数据的情况下,将多个电池健康度的均值作为电池健康度标签。

示例性地,每个目标连续充电数据包括实际充电量比例数据和实际充电容量数据;分别处理多个目标连续充电数据,得到与多个目标连续充电数据一一对应的多个电池健康度包括:基于实际充电容量数据和实际充电量比例数据之间的比值,得到电池在充满电状态下的参考充电容量数据;基于参考充电容量数据与标准充电容量数据之间的比值,得到电池健康度。

示例性地,机器学习模型构建装置400还包括:预处理模块,用于对电池样本数据进行预处理;对电池样本数据进行预处理包括以下至少一项:在电池样本数据包括采集的电池剩余容量数据和采集的电压数据的情况下,基于电池容量和电压之间的真实关联关系,确定与采集的电压数据对应的真实电池容量数据,并将真实电池容量数据添加至电池样本数据中;在电池健康度标签表示电池健康度小于预设健康度阈值的情况下,将与电池健康度标签对应的电池样本数据进行删除;去除电池样本数据中的异常数据。

示例性地,第一获取模块410用于:获取电池在充电过程中的初始特征数据,其中,初始特征数据包括多个指标数据;将与初始特征数据对应的初始健康度标签为参考,确定每个指标数据的重要度,其中,重要度用于表征指标数据对电池健康度的影响程度;基于重要度,从多个指标数据中筛选出目标指标数据;将目标指标数据确定为电池样本数据,其中,初始健康度标签为与电池样本数据对应的电池健康度标签。

示例性地,将与初始特征数据对应的初始健康度标签为参考,确定每个指标数据的重要度包括:利用多个评价模型,分别以初始健康度标签为参考对每个指标数据进行评价,得到针对每个指标数据的多个重要度,多个重要度与多个评价模型一一对应。

示例性地,基于重要度,从多个指标数据中筛选出目标指标数据包括:在多个重要度中至少具有预设数量个重要度满足重要度阈值条件的情况下,将对应的指标数据确定为目标指标数据。

示例性地,多个评价模型包括以下至少两个:回归模型、特征选择模型、随机森林模型。

示例性地,机器学习模型包括随机森林模型;模型参数包括与至少一个机器学习模型一一对应的至少一组模型参数,每一组模型参数是利用网格搜索方式从候选模型参数中搜索得到的。

示例性地,电池样本数据包括以下至少一个:电池电压数据、电池电流数据、电池温度数据、电池容量数据。

图5为本申请实施方式提供的电池健康度预测装置的示意图。

本申请实施方式提供一种电池健康度预测装置500,请参阅图5,电池健康度预测装置500包括:第二获取模块510和预测模块520。

示例性地,第二获取模块510用于获取电池在充电过程中的电池特征数据。

示例性地,预测模块520用于将电池特征数据输入机器学习模型中,由机器学习模型预测电池健康度。

可以理解,关于电池健康度预测装置500的具体描述,可以参见上文中对电池健康度预测方法的描述,在此不再赘述。

本申请实施方式提供一种电子设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一项实施方式中的方法的步骤。

本申请实施方式提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项实施方式中的方法的步骤。

本申请的一个实施方式提供一种计算机程序产品,计算机程序产品中包括指令,指令被计算机设备的处理器执行时,使得计算机设备能够执行上述任一项实施方式的方法的步骤。

需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本申请而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。尤其是,只要不存在结构冲突,各个实施例中所提到的各项技术特征均可以任意方式组合起来。本申请并不局限于文中公开的特定实施例,而是包括落入权利要求的范围内的所有技术方案。

相关技术
  • 知识表示、机器学习模型训练、预测方法、装置以及电子设备
  • 为构建的机器学习模型选取特征的方法及装置
  • 锂电池的健康度和剩余寿命预测模型的构建方法及装置
  • 锂电池的健康度和剩余寿命预测模型的构建方法及装置
技术分类

06120116490329