掌桥专利:专业的专利平台
掌桥专利
首页

电解液溶剂化结构预测方法、装置和计算机设备

文献发布时间:2024-04-18 19:57:50


电解液溶剂化结构预测方法、装置和计算机设备

技术领域

本申请涉及人工智能技术领域,特别是涉及一种电解液溶剂化结构预测方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着科技的发展,电池行业也蓬勃发展,出现了以金属或者合金为材料的电池,如锂电池,锂电池是一类由锂金属或锂合金为正/负极材料、使用非水电解液溶液的电池。在电池研发过程中,主要通过调整电池的电解液配方来实现所需求的功能,而电解液溶剂化结构作为电解液的微观结构决定了电池的多项重要属性,因此需要对电解液溶剂化结构进行研究。

传统技术中,主要通过分子动力学模拟获得电解液溶剂化结构,但是这种模拟方式需要消耗非常大的计算资源,存在模拟速度慢的问题。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高溶剂化结构模拟速度的电解液溶剂化结构预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本申请提供了一种电解液溶剂化结构预测方法。所述方法包括:

获取电解液配方信息;

基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息;

将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量;

基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理;

根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

第二方面,本申请还提供了一种电解液溶剂化结构预测装置。所述装置包括:

配方信息获取模块,用于获取电解液配方信息;

成分分析模块,用于基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息;

向量转化模块,用于将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量;

组合处理模块,用于基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理;

预测模块,用于根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取电解液配方信息;

基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息;

将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量;

基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理;

根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取电解液配方信息;

基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息;

将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量;

基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理;

根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

获取电解液配方信息;

基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息;

将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量;

基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理;

根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

上述电解液溶剂化结构预测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取电解液配方信息,基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息,能够实现对电解液成分的分析,通过将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量,能够得到分子结构表示和浓度信息的向量表达,基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理的组合处理,获得组合处理结果,根据组合处理结果确定表征各种电解液成分配比的溶剂化结构,能够通过包括分子内信息学习处理和分子间基于注意力机制的卷积处理的组合处理,模拟溶剂化结构形成的端到端的过程,实现基于人工智能的溶剂化结构快速预测,无需分子动力学模拟,能够提高溶剂化结构模拟速度。

附图说明

图1为一个实施例中电解液溶剂化结构预测方法的应用环境图;

图2为一个实施例中电解液溶剂化结构预测方法的流程示意图;

图3为一个实施例中分子结构的示意图;

图4为一个实施例中至少一层级组合处理的示意图;

图5为一个实施例中至少一层级原子表征更新的示意图;

图6为另一个实施例中至少一层级原子表征更新的示意图;

图7为一个实施例中溶剂化结构预测模型的示意图;

图8为一个实施例中分子动力学模拟的流程示意图;

图9为一个实施例中电解液溶剂化结构预测方法的应用场景图;

图10为一个实施例中分子图结构的示意图;

图11为一个实施例中预训练的溶剂化结构预测模型的架构图;

图12为一个实施例中电解液溶剂化结构预测装置的结构框图;

图13为一个实施例中计算机设备的内部结构图;

图14为一个实施例中计算机设备的内部结构图。

具体实施方式

本申请涉及人工智能技术领域。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的电解液溶剂化结构预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。用户输入需要计算的电解液配方信息至终端102,终端102获取电解液配方信息,基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息,将电解液配方信息中各种电解液成分各自的分子结构表示和浓度信息上传至服务器104,服务器104将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量,基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理,根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备、便携式可穿戴设备和飞行器,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种电解液溶剂化结构预测方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行,其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现,也可以为区块链上的节点。在本申请实施例中,以该方法应用于服务器为例进行说明,包括以下步骤:

步骤202,获取电解液配方信息。

其中,电解液是金属离子电池传输金属离子的载体,一般由金属离子、盐离子(阴离子)和至少一种溶剂分子组成。比如,电解液具体可以为锂离子电池传输锂离子的载体,一般由锂离子、盐离子(阴离子)和至少一种溶剂分子组成。举例说明,盐离子具体可以为FSI(一种盐离子的名称),锂离子和盐离子组成锂盐,如LiFSI(一种锂盐的名称),溶剂分子具体可以为乙二醇二甲醚(DME)。

其中,电解液配方信息是指需要计算的电解液配方的信息,电解液配方包括电解液成分以及每种电解液成分的数量。电解液成分是指构成电解液的分子,包括金属离子、盐离子和至少一种溶剂分子。比如,电解液成分具体可以是指构成电解液的锂离子、盐离子和至少一种溶剂分子。

具体的,在需要进行电解液溶剂化结构预测时,服务器会获取电解液配方信息。在具体的应用中,用户可以直接将电解液配方信息输入至服务器,也可以通过终端将电解液配方信息输入至服务器。在一个具体的应用中,用户会在与服务器连接的终端上输入电解液配方信息,终端在接收到电解液配方信息后,会将电解液配方信息输出至服务器。

步骤204,基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息。

其中,分子结构表示是指对电解液成分的分子结构进行描述的表达式。比如,分子结构表示具体可以是指用ASCII(American Standard Code for InformationInterchange,美国信息交换标准代码)字符串明确描述分子结构的表达式。举例说明,分子结构表示具体可以为SMILES(Simplified molecular input line entry system,简化分子线性输入规范)表达式。在一个具体的应用中,如图3所示,给出了盐离子FSI和乙二醇二甲醚(DME)的分子结构,分子中包括许多原子以及连接不同原子的化学键,化学键的形式可以为单键、双键等等。浓度信息用于描述电解液成分在电解液的所有电解液成分中所占分量。比如,浓度信息具体可以为30%,表示电解液成分在电解液的所有电解液成分中所占分量为30%。

具体的,服务器基于电解液配方信息,可以确定多个电解液成分以及每种电解液成分的数量信息,从而可以通过对电解液成分的分子结构进行转化,获得各种电解液成分各自的分子结构表示,并通过每种电解液成分的数量信息,计算出各种电解液成分各自的浓度信息。

在具体的应用中,对电解液成分的分子结构进行转化是指用ASCII字符串来描述电解液成分的分子结构,获得电解液成分的分子结构表示。在一个具体的应用中,在对电解液成分的分子结构进行转化后,所获得的电解液成分的分子结构表示具体可以为电解液成分的SMILES表达式。

在具体的应用中,服务器通过每种电解液成分的数量信息,可以计算出电解液所包含的电解液成分的总数量,从而可以通过分别计算每种电解液成分的数量与电解液所包含的电解液成分的总数量的比值,计算出各种电解液成分各自的浓度信息。在一个具体的应用中,每种电解液成分包括金属离子、盐离子和一种溶剂分子,其中金属离子的数量为256,盐离子的数量为256,溶剂分子的数量为1210,则电解液所包含的电解液成分的总数量为1722,通过计算分别计算每种电解液成分的数量与电解液所包含的电解液成分的总数量的比值,可以得到金属离子的浓度为0.149,盐离子的浓度为0.149,溶剂分子的浓度为0.702。

步骤206,将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量。

其中,分子图向量是指表征分子结构表示的向量,在分子图向量中包含分子结构表示中每个原子的原子属性特征以及连接原子的化学键的键属性特征。化学键是纯净物分子内或晶体内相邻两个或多个原子(或离子)间强烈的相互作用力的统称,使离子相结合或原子相结合的作用力通称为化学键。浓度特征向量是指表征浓度信息的向量,可以通过对浓度信息进行量化编码得到。

具体的,服务器会将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量。在具体的应用中,将每种电解液成分的分子结构表示转化为分子图向量是指根据分子结构表示中每个原子以及连接原子的化学键的化学性质,分别确定每个原子的原子属性特征以及连接原子的化学键的键属性特征,再根据分子结构表示中所有原子的原子属性特征以及连接原子的化学键的键属性特征获得分子图向量。在具体的应用中,服务器可以采用量化编码的方式将每种电解液成分的浓度信息转化为浓度特征向量。

在一个具体的应用中,在根据原子的化学性质确定原子的原子属性特征时,所考虑的化学性质包括原子在元素周期表的序号、SP杂化方式、原子的价位、原子是不是在环内、连接度数、形式电荷、是否是离子等等。其中,在成键过程中,由于原子间的相互影响,同一原子中几个能量相近的不同类型的原子轨道(即波函数),可以进行线性组合,重新分配能量和确定空间方向,组成数目相等的新的原子轨道,这种轨道重新组合的过程称为杂化,杂化后形成的新轨道称为杂化轨道。同一原子内由1个ns轨道和1个np轨道参与的杂化称为SP杂化。连接度数是指原子所连接的化学键的数目。形式电荷在化学上是指分配给分子中的一个原子的电荷,并假定所有化学键中的电子在原子之间均等共享,而无论相对电负性如何。

在一个具体的应用中,在根据化学键的化学性质确定连接原子的化学键的键属性特征时,所考虑的化学性质包括键的类型(包括单键、双键等等)、连接氢原子个数、是否为芳香键、是否为共轭键等等。其中,单键,在化合物分子中两个原子间以共用一对电子而构成的共价键。通常用一条短线“-”表示。例如甲烷、乙烷分子中的键。双键是共价键的一种,共价键,就意味着共用电子对的存在。简单的说,就是这一对电子,由键的两方各出一个,彼此共用。因此,一个共价键就可以填补一个最外层电子的空额。例如乙烯中的C=C双键。芳香键是指芳香环中的化学键。共轭键是指共轭双键中的化学键。在有机化合物分子结构中单键与双键相间的情况称为共轭双键。有机化合物分子结构中由一个单键隔开的两个双键。以C=C-C=C表示。含有共轭双键的分子比含孤立双键的分子较为稳定,能量较小,共轭双键中单键与双键的键长趋于平均化。

在一个具体的应用中,服务器可以利用RDKit将每种电解液成分的分子结构表示转化为分子图向量,RDKit是一个用于化学信息学的开源工具包,基于对化合物2D和3D分子操作,利用机器学习方法进行化合物描述符生成、fingerprint(指纹)生成、化合物结构相似性计算、2D和3D分子展示等。

步骤208,基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理。

其中,分子内信息学习处理是指针对每种电解液成分,在电解液成分内进行信息传递的学习,以使得电解液成分内的原子融合周边原子和化学键的信息。分子间基于注意力机制的卷积处理是指针对每种电解液成分,在电解液成分间进行基于注意力机制的卷积处理,以使得各种电解液成分内的原子的特征中对于电解液溶剂化结构预测更为关键的信息更加突出,并获得融合各原子的特征的虚拟向量。虚拟向量是指额外添加的、用于聚合各原子的特征的向量。在进行分子间基于注意力机制的卷积处理时会将额外添加的虚拟向量作为输入。

其中,注意力机制是在计算能力有限的情况下,将计算资源分配给更重要的任务,同时解决信息超载问题的一种资源分配方案。在神经网络学习中,一般而言模型的参数越多则模型的表达能力越强,模型所存储的信息量也越大,但这会带来信息过载的问题。那么通过引入注意力机制,在众多的输入信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注度,甚至过滤掉无关信息,就可以解决信息过载问题,并提高任务处理的效率和准确性。本实施例中,即聚焦于电解液成分内的原子的特征中对电解液溶剂化结构预测更为关键的信息,以提高电解液溶剂化结构预测的效率和准确性。

具体的,服务器会基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果。其中,组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理。其中,通过分子内信息学习处理,能够使得电解液成分内每个原子更好的学习和融合其他原子以及化学键的特征,通过分子间基于注意力机制的卷积处理,能够使得每种电解液成分内各原子的特征中对电解液溶剂化结构预测更为关键的特征更为突出,还能够得到聚合各原子的特征的虚拟向量。

在具体的应用中,在至少一层级中每一当前层级进行的组合处理中,分子间基于注意力机制的卷积处理,是基于分子内信息学习处理所输出的分子内处理结果进行的,所输出的是当前层级组合处理的结果。

在具体的应用中,当至少一层级包括一个层级时,服务器会基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果,即组合处理结果。当至少一层级包括多个层级时,服务器在得到第一层级组合处理的结果后,会再基于第一层级组合处理的结果继续进行下一层级的组合处理,直至最后一层级的组合处理输出多个层级的组合处理结果。

在一个具体的应用中,服务器会将各种电解液成分的浓度特征向量作为位置编码,作用于第一层级的组合处理中。在一个具体的应用中,各种电解液成分的浓度特征向量作为位置编码,可以作用于分子内信息学习处理,也可以作用于分子间基于注意力机制的卷积处理。

步骤210,根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

其中,溶剂化结构是指金属离子周边的盐离子和溶剂分子的微观配比。比如,对于锂离子电池来说,溶剂化结构是指锂离子周边的盐离子和溶剂分子的微观配比。

具体的,服务器会根据组合处理结果进行回归预测,确定表征各种电解液成分配比的溶剂化结构。其中,回归预测是回归方程的一项重要应用,所谓预测就是对给定的X值,估计Y值将落在什么范围。在本实施例中,即对给定的组合处理结果,估计出表征各种电解液成分配比的溶剂化结构。

上述电解液溶剂化结构预测方法,通过获取电解液配方信息,基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息,能够实现对电解液成分的分析,通过将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量,能够得到分子结构表示和浓度信息的向量表达,基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理的组合处理,获得组合处理结果,根据组合处理结果确定表征各种电解液成分配比的溶剂化结构,能够通过包括分子内信息学习处理和分子间基于注意力机制的卷积处理的组合处理,模拟溶剂化结构形成的端到端的过程,实现基于人工智能的溶剂化结构快速预测,无需分子动力学模拟,能够提高溶剂化结构模拟速度。

在一个实施例中,根据组合处理结果确定表征各种电解液成分配比的溶剂化结构包括:

从组合处理结果中,提取出表征各种电解液成分间配比的特征聚合向量;

对特征聚合向量进行回归预测,获得表征各种电解液成分间配比的溶剂化结构。

其中,特征聚合向量是指聚合每种电解液成分中各原子的特征的向量。分子间基于注意力机制的卷积处理可实现全局特征聚合,在组合处理结果中会存在聚合每种电解液成分中各原子的特征的向量,即特征聚合向量,该特征聚合向量能够表征各种电解液成分间配比。

具体的,在组合处理结果中包括特征聚合向量以及每种电解液成分中各原子在最后一层级的组合处理后的编码向量,服务器会从组合处理结果中,提取出表征各种电解液成分间配比的特征聚合向量,对特征聚合向量进行回归预测,获得表征各种电解液成分间配比的溶剂化结构。

在具体的应用中,服务器可以通过预训练的多层感知机对特征聚合向量进行回归预测,获得表征各种电解液成分间配比的溶剂化结构。多层感知机可按照实际应用场景进行训练,本实施例在此处不对训练多层感知机进行限定。在一个具体的应用中,多层感知机可以为全连接层,即通过预训练的全连接层对特征聚合向量进行回归预测,可以获得表征各种电解液成分间配比的溶剂化结构。

在一个具体的应用中,假设特征聚合向量的维度为128维,且各种电解液成分中包括一种盐离子以及两种溶剂分子,预训练的多层感知机可以为大小为128*3的全连接层,通过回归预测,即可获得表征各种电解液成分间配比的溶剂化结构,即盐离子和两种溶剂分子的配比情况,这里默认金属离子为一个。

本实施例中,通过从组合处理结果中,提取出表征各种电解液成分间配比的特征聚合向量,能够利用对特征聚合向量进行回归预测,实现准确的电解液溶剂化结构预测,获得表征各种电解液成分间配比的溶剂化结构。

在一个实施例中,至少一层级包括多个层级;基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果包括:

基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果;

从第二层级开始的每一当前层级,基于上一层级组合处理的结果进行当前层级的组合处理,获得当前层级组合处理的结果,直至最后一层级的组合处理输出多个层级的组合处理结果。

具体的,服务器会基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果,从第二层级开始的每一当前层级,基于上一层级组合处理的结果进行当前层级的组合处理,获得当前层级组合处理的结果,直至最后一层级的组合处理输出多个层级的组合处理结果。其中,第二层级的上一层级为第一层级。

在一个具体的应用中,以多个层级为三个层级为例对进行至少一层级组合处理进行说明。如图4所示,服务器会基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果,基于第一层级组合处理的结果进行第二层级的组合处理,获得第二层级组合处理的结果,再基于第二层级组合处理的结果进行第三层级的组合处理,获得第三层级的组合处理的结果,即多个层级的组合处理结果。

本实施例中,通过基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果,从第二层级开始的每一当前层级,基于上一层级组合处理的结果进行当前层级的组合处理,能够实现至少一层级组合处理,获得组合处理结果。

在一个实施例中,在至少一层级中每一当前层级进行的组合处理的步骤包括:

根据输入到当前层级的输入数据确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征;

基于键属性特征和各原子的初始原子表征进行分子内信息学习处理,获得包括各原子的目标原子表征的分子内处理结果;

依据各原子的目标原子表征,进行分子间基于注意力机制的卷积处理,获得当前层级组合处理的结果。

其中,初始原子表征是指在进行当前层级的组合处理时,在进行分子内信息学习处理之前,用于表征原子的信息的特征向量。需要说明的是,各种电解液成分中各原子的初始原子表征是会随着每一层级的组合处理不断更新的。当前层级中各种电解液成分中连接各原子的化学键的键属性特征,是指当前层级的组合处理时各种电解液成分中连接各原子的化学键的键属性特征,需要说明的是,连接各原子的化学键的键属性特征可以是不随着每一层级的组合处理不断更新的,即在每一层级的组合处理时各种电解液成分中连接各原子的化学键的键属性特征都是相同的。

具体的,服务器会根据输入到当前层级的输入数据确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征,基于键属性特征和各原子的初始原子表征进行分子内信息学习处理,以使得每个原子更好的学习和融合相关联的邻居原子以及相接化学键的特征,获得包括各原子的目标原子表征的分子内处理结果。在获得分子内处理结果后,服务器会依据各原子的目标原子表征,进行分子间基于注意力机制的卷积处理,以对各原子的目标原子表征进行编码,获得当前层级组合处理的结果。其中,当前层级组合处理的结果包括对当前层级的虚拟向量和各原子的目标原子表征进行编码后所得到的向量。

本实施例中,能够基于键属性特征和各原子的初始原子表征进行分子内信息学习处理,从而获得包括各原子的目标原子表征的分子内处理结果,进而可以依据各原子的目标原子表征,进行分子间基于注意力机制的卷积处理,获得当前层级组合处理的结果。

在一个实施例中,至少一层级包括多个层级;根据输入到当前层级的输入数据确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征包括:

在至少一层级中的第一层级,根据各种电解液成分的分子图向量和浓度特征向量,确定第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征;

从至少一层级中第二层级开始的每一当前层级,根据上一层级组合处理的结果,确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征。

具体的,在至少一层级中的第一层级,电解液成分的分子图向量包括电解液成分中各原子的原子属性特征以及连接各原子的化学键的键属性特征。服务器可以直接将各原子的原子属性特征作为各原子的初始原子表征,并将分子图向量中所包括的连接各原子的化学键的键属性特征作为第一层级中连接各原子的化学键的键属性特征。在具体的应用中,服务器还可以将各种电解液成分的浓度特征向量作为位置编码使用,分别融合至各种电解液成分的分子图向量,以对分子图向量进行更新,再基于更新后的分子图向量,确定第一层级中各种所述电解液成分中各原子的初始原子表征以及连接各所述原子的化学键的键属性特征。

具体的,从至少一层级中第二层级开始的每一当前层级,上一层级组合处理的结果包括对各原子的目标原子表征进行编码后所获得的目标融合向量,且在每一层级的组合处理时各种电解液成分中连接各原子的化学键的键属性特征都是相同的,因此,服务器可以根据上一层级组合处理的结果,确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征。

在具体的应用中,服务器会将上一层级组合处理的结果中各原子的目标融合向量分别作为各原子的初始原子表征,并将上一层级的组合处理时的连接各原子的化学键的键属性特征作为当前层级的组合处理时的连接各原子的化学键的键属性特征。

本实施例中,针对至少一层级中不同层级,可以采用不同的方式确定当前层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征,能够实现对初始原子表征以及键属性特征的准确确定。

在一个实施例中,根据各种电解液成分的分子图向量和浓度特征向量,确定第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征包括:

将各种电解液成分的浓度特征向量作为位置编码,分别融合至各种电解液成分的分子图向量,获得第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征。

其中,位置编码用于说明各种电解液成分的分子图向量在输入数据中的位置,这样就为每个位置分配了一个唯一的表示。

具体的,服务器会将各种电解液成分的浓度特征向量作为位置编码,分别融合至各种电解液成分的分子图向量,以实现对各种电解液成分的分子图向量的更新,以使得更新后分子图向量更能够准确的表征电解液成分。再将更新后分子图向量中各原子的原子属性特征作为第一层级中各种电解液成分中各原子的初始原子表征,并将更新后分子图向量中连接各原子的化学键的键属性特征,作为第一层级中连接各原子的化学键的键属性特征。

在具体的应用中,服务器可以通过将各种电解液成分的浓度特征向量分别叠加至各种电解液成分的分子图向量的方式实现融合。需要说明的是,由于在第一层级的组合处理中,已经将浓度信息融合至各种电解液的分子图向量中,因此从至少一层级中第二层级开始的每一当前层级,不需要再次重复融合浓度信息,避免对浓度信息的重复融合。本实施例中,能够将浓度信息融合至分子图向量中,使得所得到的第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征更准确的表征各种电解液成分。

在一个实施例中,基于键属性特征和各原子的初始原子表征进行分子内信息学习处理,获得包括各原子的目标原子表征的分子内处理结果包括:

基于键属性特征和各原子的初始原子表征进行至少一层级原子表征更新,获得各原子的目标原子表征;

将各原子的目标原子表征作为分子内处理结果。

具体的,服务器会基于键属性特征和各原子的初始原子表征进行至少一层级原子表征更新,获得各原子的目标原子表征,将各原子的目标原子表征作为分子内处理结果。其中,至少一层级原子表征更新的层级数可按照实际应用场景进行配置。

在具体的应用中,服务器会基于键属性特征和各原子的初始原子表征进行第一层级的原子表征更新,以对各原子的初始原子表征进行更新,获得第一层级原子表征更新的结果,从第二层级开始的每一当前层级,基于上一层级原子表征更新的结果和键属性特征,获得当前层级原子表征更新的结果,以对上一层级原子表征更新所得到的各原子的原子表征再次进行更新,直至最后一层级的原子表征更新输出原子的目标原子表征。

在一个具体的应用中,在至少一层级中每一当前层级进行的原子表征更新的步骤包括:基于各原子的邻居原子的原子表征以及相接化学键的键属性特征,分别对各原子的原子表征进行更新。在一个具体的应用中,针对每一个原子,服务器会先对邻居原子的原子表征以及相接化学键的键属性特征进行聚合,得到中间聚合向量,再聚合中间聚合向量和原子的原子表征,以对原子的原子表征进行更新。其中,邻居原子是指与原子通过化学键直接相邻的原子。相接化学键是指连接原子和邻居原子的化学键。在对邻居原子的原子表征以及相接化学键的键属性特征进行聚合,得到中间聚合向量时,可以采用直接叠加、加权平均等方式进行聚合,本实施例在此处不对聚合方式进行具体限定。在对中间聚合向量和原子的原子表征进行聚合时,可以采用最大池化、平均池化等方式进行聚合,本实施例在此处不对聚合方式进行具体限定。

在一个具体的应用中,对邻居原子的原子表征以及相接化学键的键属性特征进行聚合,得到中间聚合向量的公式为:

其中,

在一个具体的应用中,聚合中间聚合向量和原子的原子表征的公式为:

其中,

在一个具体的应用中,以多个层级为三个层级为例对进行至少一层级原子表征更新进行说明。如图5所示,服务器会基于键属性特征和各原子的初始原子表征进行第一层级的原子表征更新,以对原子的初始原子表征进行更新,获得第一层级原子表征更新的结果,在第二层级的原子表征更新中,基于第一层级原子表征更新的结果和键属性特征,继续对原子的原子表征进行更新,获得第二层级原子表征更新的结果,在第三层级的原子表征更新中,基于第二层级原子表征更新的结果和键属性特征,继续对原子的原子表征进行更新,获得第三层级原子表征更新的结果,即各原子的目标原子表征。如图6所示,以原子602为例,针对原子602来说,在经过三个层级原子表征更新后,原子602可以学习到邻居原子604以及与邻居原子604相邻的其他间接邻居原子的特征。

本实施例中,通过基于键属性特征和各原子的初始原子表征进行至少一层级原子表征更新,能够获得各原子的目标原子表征,从而可以根据各原子的目标原子表征,实现对分子内处理结果的获取。

在一个实施例中,依据各原子的目标原子表征,进行分子间基于注意力机制的卷积处理,获得当前层级组合处理的结果包括:

基于注意力机制,对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量;

分别融合注意力编码向量和相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级组合处理的结果。

具体的,在获得当前层级的各原子的目标原子表征后,服务器会基于注意力机制,对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量,通过分别融合注意力编码向量和相应的当前层级的虚拟向量和各原子的目标原子表征,就可以获得当前层级组合处理的结果。

在具体的应用中,在基于注意力机制,对当前层级的虚拟向量和各原子的目标原子表征进行编码时,服务器会获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,参与注意力权重计算,以对注意力权重进行修正,通过这种方式实现注意力权重修正,能够使得基于注意力机制所获得的注意力权重更准确,从而使得更好的聚焦于当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量中对于电解液溶剂化结构预测更为关键的信息,以提高电解液溶剂化结构预测的效率和准确性。

本实施例中,通过基于注意力机制,对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量,分别融合注意力编码向量和相应的当前层级的虚拟向量和各原子的目标原子表征,能够实现分子间的跨分子学习,获得当前层级组合处理的结果。

在一个实施例中,至少一层级中第一层级的虚拟向量为预配置虚拟向量,从至少一层级中第二层级开始的每一当前层级,当前层级的虚拟向量从上一层级组合处理的结果中提取。

具体的,至少一层级中第一层级的虚拟向量为预配置虚拟向量,即在至少一层级组合处理中,服务器会预配置虚拟向量作为第一层级的基于注意力机制的卷积处理的输入,以通过预配置虚拟向量来融合各种电解液成分的特征。其中,预配置虚拟向量可按照实际应用场景进行配置。比如,预配置虚拟向量具体可以为与各原子的目标原子表征维度相同的零向量。

具体的,由于服务器预配置虚拟向量作为第一层级的基于注意力机制的卷积处理的输入,则从第一层级组合处理的结果开始,每一层级组合处理的结果中均会包括虚拟向量,因此,从至少一层级中第二层级开始的每一当前层级,当前层级的虚拟向量可以直接从上一层级组合处理的结果中提取。

本实施例中,针对至少一层级中不同层级,可以采用不同的方式确定当前层级的虚拟向量,能够实现对当前层级的虚拟向量的准确确定。

在一个实施例中,注意力机制为多头注意力机制;基于注意力机制,对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量包括:

基于多头注意力机制中每一头注意力,分别对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量;

分别对当前层级的虚拟向量和各原子的目标原子表征各自相应的每一头注意力的中间编码向量进行融合,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量。

具体的,注意力机制为多头注意力机制,服务器会基于多头注意力机制中每一头注意力,分别对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量,再分别对当前层级的虚拟向量和各原子的目标原子表征各自相应的每一头注意力的中间编码向量进行拼接,对拼接后中间编码向量进行线性变换,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量。

在具体的应用中,在分别对当前层级的虚拟向量和各原子的目标原子表征进行编码时,服务器会获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,参与注意力权重计算,以对注意力权重进行修正,通过这种方式实现注意力权重修正,能够使得基于注意力机制所获得的注意力权重更准确,从而使得更好的聚焦于当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量中对于电解液溶剂化结构预测更为关键的信息,以提高电解液溶剂化结构预测的效率和准确性。

在具体的应用中,服务器可以通过预训练的权重矩阵对拼接后中间编码向量进行线性变换,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量。其中,预训练的权重矩阵可按照实际应用场景进行训练,本实施例在此处不对权重矩阵的训练进行限定。

本实施例中,能够基于多头注意力机制实现对当前层级的虚拟向量和各原子的目标原子表征的编码。

在一个实施例中,基于多头注意力机制中每一头注意力,分别对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量包括:

针对多头注意力机制中每一头注意力,通过注意力的变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,获得当前层级的虚拟向量和各原子的目标原子表征各自的查询向量、键向量和值向量;

基于当前层级的虚拟向量和各原子的目标原子表征各自的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重;

基于注意力权重分别对相应的值向量进行加权,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量。

其中,注意力的变换矩阵包括查询向量变换矩阵、键向量变换矩阵以及值向量变换矩阵,分别与查询向量、键向量和值向量相应。

具体的,针对多头注意力机制中每一头注意力,服务器会通过注意力的变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,获得当前层级的虚拟向量和各原子的目标原子表征各自的查询向量、键向量和值向量。在具体的应用中,通过查询向量变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,可以获得当前层级的虚拟向量和各原子的目标原子表征各自的查询向量。通过键向量变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,可以获得当前层级的虚拟向量和各原子的目标原子表征各自的键向量。通过值向量变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,可以获得当前层级的虚拟向量和各原子的目标原子表征各自的值向量。

在一个具体的应用中,在通过注意力的变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换之前,服务器可以分别对当前层级的虚拟向量和各原子的目标原子表征进行层归一化,以使得当前层级的虚拟向量和各原子的目标原子表征的分布相对稳定,便于更好的进行基于注意力机制的卷积处理。

在具体的应用中,服务器会基于当前层级的虚拟向量和各原子的目标原子表征各自的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重,再基于注意力权重分别对相应的值向量进行加权,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量。

在一个具体的应用中,在基于当前层级的虚拟向量和各原子的目标原子表征各自的查询向量和键向量进行注意力权重计算时,服务器可以通过缩放点积进行注意力权重计算,即针对虚拟向量和各原子的目标原子表征,先计算其查询向量和所有键向量的相似度,获得点积,再对点积进行缩放,即可得到注意力权重。通过缩放点积进行注意力权重计算可以通过如下公式表示:

其中,attention

本实施例中,通过注意力的变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,能够获得当前层级的虚拟向量和各原子的目标原子表征各自的查询向量、键向量和值向量,通过基于当前层级的虚拟向量和各原子的目标原子表征各自的查询向量和键向量进行注意力权重计算,能够获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重,从而可以通过基于注意力权重分别对相应的值向量进行加权,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量。

在一个实施例中,基于当前层级的虚拟向量和各原子的目标原子表征各自的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重包括:

基于当前层级的虚拟向量和各原子的目标原子表征各自相应的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的初始权重;

获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,对初始权重进行修正,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重。

其中,原子关系编码用于表征各种电解液成分中各原子之间连接关系。比如,各原子之间连接关系具体可以是指各原子之间位置关系。举例说明,各原子之间位置关系具体可以是指在3D的分子结构表示中,电解液成分中各原子之间的距离。又举例说明,各原子之间位置关系具体还可以是指在2D的分子结构表示中,电解液成分中各原子之间的跳数,即各原子之间相隔了几个原子。又比如,各原子之间连接关系具体可以是指各原子之间通过化学键连接的关系。再比如,各原子之间连接关系具体可以包括各原子之间位置关系以及各原子之间通过化学键连接的关系。

具体的,服务器会基于当前层级的虚拟向量和各原子的目标原子表征各自相应的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的初始权重,再获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,对初始权重进行修正,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重。

在具体的应用中,各原子之间连接关系具体可以是指各原子之间位置关系,服务器会基于各原子之间位置关系进行编码,获得表征各种电解液成分中各原子之间连接关系的原子关系编码。在一个具体的应用中,服务器可以基于各原子之间位置关系构建原子关系矩阵,基于原子关系矩阵得到原子关系编码,原子关系矩阵中的元素即为两个原子之间的位置关系。举例说明,假设电解液成分中包括4个原子,则各原子之间连接关系可以通过4*4的矩阵表示,矩阵中的元素为每两个原子之间的位置关系。

在具体的应用中,各原子之间连接关系具体可以是指各原子之间通过化学键连接的关系,服务器可以基于连接各原子的化学键的键属性特征,获得表征各种电解液成分中各原子之间连接关系的原子关系编码。在一个具体的应用中,服务器可以基于各原子的化学键的键属性特征构建原子关系矩阵,基于原子关系矩阵得到原子关系编码,原子关系矩阵中的元素即为两个原子之间的化学键的键属性特征,若两个原子之间无化学键,则原子关系矩阵中相应位置处的元素值为0。

在具体的应用中,各原子之间连接关系具体可以包括各原子之间通过化学键连接的关系以及各原子之间位置关系,服务器可以基于各原子之间通过化学键连接的关系以及各原子之间位置关系,获得表征各种电解液成分中各原子之间连接关系的原子关系编码。在一个具体的应用中,服务器可以基于各原子之间通过化学键连接的关系以及各原子之间位置关系构建原子关系矩阵,基于原子关系矩阵得到原子关系编码,原子关系矩阵中的元素表征各原子之间通过化学键连接的关系以及各原子之间位置关系。

在具体的应用中,服务器可以通过缩放点积进行注意力权重计算,即针对虚拟向量和各原子的目标原子表征,先计算其查询向量和所有键向量的相似度,获得点积,再对点积进行缩放,即可得到初始权重。通过缩放点积进行注意力权重计算可以通过如下公式表示:

其中,attention

在具体的应用中,原子关系编码可以用attn_bias表示,则注意力权重可以通过如下公式表示:

其中,attention

本实施例中,通过将原子关系编码作为偏置项,参与注意力权重计算,以对初始权重进行修正,通过这种方式实现注意力权重修正,能够使得基于注意力机制所获得的注意力权重更准确,从而使得更好的聚焦于当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量中对于电解液溶剂化结构预测更为关键的信息,以提高电解液溶剂化结构预测的效率和准确性。

在一个实施例中,分别融合注意力编码向量和相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级组合处理的结果包括;

将注意力编码向量分别叠加至相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的中间融合向量;

通过全连接层对中间融合向量进行映射,获得中间融合向量相应的映射后向量;

分别叠加中间融合向量和相应的映射后向量,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量;

将当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,作为当前层级组合处理的结果。

具体的,服务器会将注意力编码向量分别叠加至相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的中间融合向量,再对中间融合向量进行层归一化,通过全连接层对层归一化后的中间融合向量进行映射,获得中间融合向量相应的映射后向量,分别叠加中间融合向量和相应的映射后向量,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,将当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,作为当前层级组合处理的结果。通过层归一化处理,能够使得中间融合向量的分布相对稳定,便于更好的通过全连接层进行映射。

在具体的应用中,上述获得目标融合向量的过程可以通过如下公式表示:

h`

h

其中,LN表示层归一化,h

本实施例中,能够实现分别融合注意力编码向量和相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,进而可以将当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,作为当前层级组合处理的结果。

在一个实施例中,至少一层级组合处理通过预训练的溶剂化结构预测模型执行,溶剂化结构通过溶剂化结构预测模型确定;溶剂化结构预测模型通过基于分子动力学模拟生成的训练数据训练得到。

其中,分子动力学模拟是基于牛顿力学原理模拟原子和分子的物理运动轨迹和状态的方法。对于较为复杂的生物分子体系,通常通过对相互作用粒子的牛顿运动方程进行数值解析来确定体系内粒子的轨迹,而粒子间的作用力和势能采用分子力学力场来确定。

具体的,至少一层级组合处理通过预训练的溶剂化结构预测模型执行,溶剂化结构通过溶剂化结构预测模型确定,溶剂化结构预测模型通过基于分子动力学模拟生成的训练数据训练得到。在具体的应用中,服务器会将各种电解液成分的分子图向量和浓度特征向量,输入预训练的溶剂化结构预测模型,以使得溶剂化结构预测模型输出表征各种电解液成分的溶剂化结构。

在一个具体的应用中,如图7所示,在溶剂化结构预测模型中包括执行至少一层级组合处理的组合处理模块和根据组合处理结果确定表征各种电解液成分配比的溶剂化结构的预测模块。

在组合处理模块中包括N+1层级组合处理单元,每层级组合处理单元都用于实现一层级的组合处理。组合处理模块会基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果,从第二层级开始的每一当前层级,基于上一层级组合处理的结果进行当前层级的组合处理,获得当前层级组合处理的结果,直至最后一层级的组合处理输出多个层级的组合处理结果。在得到组合处理结果后,预测模块会从组合处理结果中,提取出表征各种电解液成分间配比的特征聚合向量,对特征聚合向量进行回归预测,获得表征各种电解液成分间配比的溶剂化结构。

其中,组合处理包括依次进行的分子内信息学习处理和基于分子间注意力机制的卷积处理。在一个具体的应用中,如图7所示,分子内信息学习处理可以基于图同构网络模型(GIN)实现,基于分子间注意力机制的卷积处理可以通过Transformer with VN实现,其中的Transformer是指利用注意力机制来提高模型训练速度的模型,VN是指virtual token(虚拟token),也就是上述实施例中提及的虚拟向量。在一个具体的应用中,如图7所示,在基于分子间注意力机制的卷积处理中,服务器会获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,参与注意力权重计算,以对注意力权重进行修正,通过这种方式实现注意力权重修正,能够使得基于注意力机制所获得的注意力权重更准确。

本实施例中,能够通过基于分子动力学模拟生成的训练数据训练得到的溶剂化结构预测模型,实现对溶剂化结构的确定,实现了基于人工智能的溶剂化结构快速预测,无需分子动力学模拟,能够提高溶剂化结构模拟速度。

在一个实施例中,预训练的溶剂化结构预测模型通过训练步骤获得,训练步骤包括:

获取至少一条样本配方信息;

基于至少一条样本配方信息分别进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构;

基于至少一条样本配方信息和相应的模拟溶剂化结构进行训练,获得预训练的溶剂化结构预测模型。

具体的,服务器会获取至少一条样本配方信息,基于至少一条样本配方信息分别进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构,再基于至少一条样本配方信息和相应的模拟溶剂化结构进行有监督训练,获得预训练的溶剂化结构预测模型。

在具体的应用中,服务器会获取海量分子信息,将海量分子信息中各种分子进行配对,并随机进行浓度配比,获得至少一条样本配方信息。在一个具体的应用中,服务器可以将各种分子进行两两配对,并随机进行浓度配比,获得至少一条样本配方信息。

在具体的应用中,服务器可以将至少一条样本配方信息依次输入化学模拟计算软件,以进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构。在一个具体的应用中,化学模拟计算软件具体可以为Lammps(Large-scale Atomic/MolecularMassively Parallel Simulator,大规模原子分子并行模拟器),其主要用于分子动力学相关的一些计算和模拟工作。服务器可以将至少一条样本配方信息处理为Lammps的输入格式,接着进行Lammps模拟,得到输出元素最终的物理化学结构。举例说明,当样本配方信息中包括随机选择的两种溶剂分子时,整体的数学表达为:

A+xi*B+yi*C+zi*D->A+x*B+y*C+z*D;

其中,A为金属离子、B为盐离子、C和D为随机选择的两种溶剂分子,xi,yi,zi为输入配比,x,y,z为最终形成的溶剂化结构平均配比。需要说明的是,这里的输入配比是以金属离子的数量为基准确定的,即输入配比是盐离子和溶剂分子相对于单个金属离子的配比。

本实施例中,通过获取至少一条样本配方信息,基于至少一条样本配方信息分别进行分子动力学模拟,能够获得至少一条样本配方信息各自相应的模拟溶剂化结构,从而可以基于至少一条样本配方信息和相应的模拟溶剂化结构进行训练,获得能够实现准确预测的预训练的溶剂化结构预测模型。

在一个实施例中,基于至少一条样本配方信息分别进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构包括:

针对至少一条样本配方信息中每条样本配方信息,为样本配方信息中各样本分子配置初始位置和初始速度;

将初始位置作为当前位置,并将初始速度作为当前速度;

基于各样本分子的当前位置和当前速度,计算各样本分子的合外力;

基于各样本分子的合外力,计算各样本分子的更新位置和更新速度;

将更新位置更新为当前位置,并将更新速度更新为当前速度,跳转至基于各样本分子的当前位置和当前速度,计算各样本分子的合外力的步骤,直到各种样本分子达到平衡态,获得样本配方信息相应的模拟溶剂化结构。

具体的,针对至少一条样本配方信息中每条样本配方信息,服务器会为样本配方信息中各样本分子配置初始位置和初始速度,将初始位置作为当前位置,并将初始速度作为当前速度,基于各样本分子的当前位置和当前速度,计算各样本分子的合外力,再基于各样本分子的合外力,确定各样本分子的加速度,以根据各样本分子的加速度以及当前位置和当前速度,计算各样本分子的更新位置和更新速度,将更新位置更新为当前位置,并将更新速度更新为当前速度,跳转至基于各样本分子的当前位置和当前速度,计算各样本分子的合外力的步骤,再次进行计算,直到各种样本分子达到平衡态,获得样本配方信息相应的模拟溶剂化结构。其中,各种样本分子达到平衡态是指各种样本分子的加速度趋于0,处于稳定的状态。

在具体的应用中,如图8所示,在进行分子动力学模拟时,服务器首先会为样本分子配置初始位置r0和初始速度v0,将初始位置作为当前位置,并将初始速度作为当前速度,基于各样本分子的当前位置和当前速度,计算各样本分子的合外力Fi,再基于各样本分子的合外力,确定各样本分子的加速度(未在图8中示出),以根据各样本分子的加速度以及当前位置和当前速度,计算各样本分子的更新位置(r(t+dt))和更新速度(v(t+dt)),其中的t+dt表示时刻变化,在t小于时间阈值t

本实施例中,通过先为样本分子设置初始位置和初始速度,再计算样本分子的合外力,再计算样本分子的更新位置和更新速度,再跳转至计算样本分子的合外力的步骤,如此往复直到达到平衡态,能够实现分子动力学模拟,获得样本配方信息相应的模拟溶剂化结构。

在一个实施例中,电解液溶剂化结构预测方法还包括:

基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的电荷信息;

将每种电解液成分的电荷信息转化为电荷向量;

基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果包括:

基于各种电解液成分的分子图向量、浓度特征向量和电荷向量,进行至少一层级组合处理,获得组合处理结果。

其中,电荷信息是指电解液成分所带电荷的信息。比如,电荷信息具体可以包括电荷类型和电荷价位。举例说明,电荷类型具体可以为正电荷、负电荷等。电荷价位具体可以为一价、二价等。电荷向量是指电荷信息的向量表示。

具体的,服务器基于电解液配方信息,可以确定多个电解液成分,从而可以通过对各种电解液成分的电荷信息进行转化,获得各种电解液成分各自的电荷向量。在获得电荷向量后,服务器可以基于各种电解液成分的分子图向量、浓度特征向量和电荷向量,进行至少一层级组合处理,获得组合处理结果。

在具体的应用中,当至少一层级包括一个层级时,服务器会基于各种电解液成分的分子图向量、浓度特征向量和电荷向量,进行第一层级的组合处理,获得第一层级组合处理的结果,即组合处理结果。当至少一层级包括多个层级时,服务器在得到第一层级组合处理的结果后,会再基于第一层级组合处理的结果继续进行下一层级的组合处理,直至最后一层级的组合处理输出多个层级的组合处理结果。在一个具体的应用中,服务器会将各种电解液成分的浓度特征向量和电荷向量均作为位置编码,作用于第一层级的组合处理中。在一个具体的应用中,各种电解液成分的浓度特征向量和电荷向量作为位置编码,可以作用于分子内信息学习处理,也可以作用于分子间基于注意力机制的卷积处理。举例说明,在作用于分子内信息学习处理时,服务器会将各种电解液成分的浓度特征向量和电荷向量分别融合至各种电解液成分的分子图向量,获得第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征。

本实施例中,通过基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的电荷信息,将每种电解液成分的电荷信息转化为电荷向量,能够实现基于各种电解液成分的分子图向量、浓度特征向量和电荷向量,进行至少一层级组合处理,获得组合处理结果,在组合处理过程中,由于同时考虑了电荷信息和浓度信息,能够使得所获得的组合处理结果能够更准确的表征各种电解液成分。

在一个实施例中,每种电解液成分包括金属离子、盐离子和至少一种溶剂分子;将每种电解液成分的浓度信息转化为浓度特征向量包括:

计算盐离子和至少一种溶剂分子相对于金属离子的相对浓度;

分别对相对浓度进行编码,获得盐离子和至少一种溶剂分子各自的浓度特征向量,并将金属离子的浓度特征向量设置为零向量。

具体的,服务器会基于每种电解液成分的浓度信息,计算盐离子和至少一种溶剂离子相对于金属离子的相对浓度,再分别对相对浓度进行编码,获得盐离子和至少一种溶剂分子各自的浓度特征向量,并将金属离子的浓度特征向量设置为零向量。在具体的应用中,在分别对相对浓度进行编码时,服务器可以预训练的浓度编码表对相对浓度进行编码,在预训练的浓度编码表中预先为每种相对浓度配置了浓度特征向量,服务器通过查询浓度编码表,即可得到相对浓度相应的浓度特征向量。

本实施例中,通过计算盐离子和至少一种溶剂分子相对于金属离子的相对浓度,分别对相对浓度进行编码,能够实现对盐离子和至少一种溶剂分子的浓度信息的编码,通过将金属离子的浓度特征向量设置为零向量,能够实现对金属离子的浓度信息的编码。

在一个实施例中,通过一个应用场景图来说明本申请的电解液溶剂化结构预测方法,如图9所示,本申请的电解液溶剂化结构预测方法可以应用于包括前端和后端的终端,该电解液溶剂化结构预测方法具体包括以下步骤:

步骤1:用户在前端输入材料和数量,即需要计算的电解液配方信息。

具体的,当需要进行电解液溶剂化结构预测时,用户可以在前端输入电解液配方信息,从而使得前端可以获取到电解液配方信息。

步骤2:前端将用户输入文字信息转化为SMILES化学表达式以及各自浓度比例。

具体的,前端会基于用户输入文字信息(即电解液配方信息),获得各种电解液成分的各自的SMILES化学表达式以及浓度比例,将各种电解液成分的各自的SMILES化学表达式以及浓度比例输出至后端,以使得后端可以进行下一步计算。

步骤3:后端将前端上传的SMILES信息转化为图信息,浓度比例转化为量化特征。

具体的,后端在接收到各种电解液成分的各自的SMILES化学表达式以及浓度比例后,会将每种电解液成分的SMILES化学表达式转化为图信息(即分子图向量),并将每种电解液成分的浓度比例转化为量化特征(即浓度特征向量)。在具体的应用中,由于电解液成分为分子,分子本身就是图结构,所以可以将SMILES信息转化为图信息,即将分子用图进行表示。如图10所示,为分子图结构的示意图,在分子中原子通过单键、双键等化学键连接。

步骤4:将图信息和量化特征输入人工智能模型。

具体的,后端会将每种电解液成分的图信息和量化特征输入人工智能模型,以通过人工智能模型(即预训练的溶剂化结构预测模型)进行溶剂化结构预测,输出溶剂化结构预测结果。

在具体的应用中,溶剂化结构预测模型是通过基于分子动力学模拟生成的训练数据训练得到的,训练步骤包括:获取至少一条样本配方信息,基于至少一条样本配方信息分别进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构,基于至少一条样本配方信息和相应的模拟溶剂化结构进行训练,获得预训练的溶剂化结构预测模型。

在一个具体的应用中,后端可以将至少一条样本配方信息依次输入化学模拟计算软件,以进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构。在进行分子动力学模拟时,后端可以将至少一条样本配方信息处理为Lammps的输入格式,接着进行Lammps模拟,得到输出元素最终的物理化学结构。举例说明,当样本配方信息中包括随机选择的两种溶剂分子且金属离子为锂离子时,整体的数学表达为:

Li+xi*A+yi*B+zi*C->Li+x*A+y*B+z*C;

其中,Li为锂离子、A为盐离子、B和C为随机选择的两种溶剂分子,xi,yi,zi为输入配比,x,y,z为最终形成的溶剂化结构平均配比。需要说明的是,这里的输入配比是以锂离子的数量为基准确定的,即输入配比是盐离子和溶剂分子相对于单个锂离子的配比。

在具体的应用中,与上面分子动力学模拟的整体的数学表达对应,预训练的溶剂化结构预测模型主要是建模如下功能F:

F(xi,yi,zi;Li,A,B,C)=(x,y,z)。

在一个具体的应用中,以基于锂离子(Li)(包括256个)、盐离子(FSI)(包括256个)和一种溶剂分子(DME)(包括1210个)进行电解液溶剂化结构预测为例(输入配比是盐离子和溶剂分子相对于单个锂离子的配比,xi为盐离子的输入配比,为1,yi为溶剂分子的输入配比,为4.726),预训练的溶剂化结构预测模型的架构如图11所示,在溶剂化结构预测模型中包括执行至少一层级组合处理的组合处理模块以及根据组合处理结果确定表征各种电解液成分配比的溶剂化结构的预测模块,在组合处理模块中包括N+1层级组合处理单元,每层级组合处理单元都用于实现一层级的组合处理,组合处理模块的输出为多个层级的组合处理结果。在得到组合处理结果后,预测模块会从组合处理结果中,提取出表征各种电解液成分间配比的特征聚合向量(即图11中的represention),对特征聚合向量进行回归预测,获得表征各种电解液成分间配比的溶剂化结构(即图11中的x,y,其中x为盐离子的配比,y为溶剂分子的配比)。

其中,针对每一层级的组合处理,在分子内部采用GIN进行信息传递的学习,分子间采用transformer结构进行学习,分子的浓度信息将用量化编码的方式编码成向量代替transformer结构的位置编码来用。

具体的,GIN进行分子图内信息学习的步骤包括:

根据输入到当前层级的输入数据确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各种原子的化学键的键属性特征,基于键属性特征和各原子的初始原子表征进行至少一层级原子表征更新,获得各原子的目标原子表征,将各原子的目标原子表征作为分子内处理结果。

在一个具体的应用中,在至少一层级中的第一层级,将各种电解液成分的浓度特征向量作为位置编码,分别融合至各种电解液成分的分子图向量,获得第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征。从至少一层级中第二层级开始的每一当前层级,根据上一层级组合处理的结果,确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征。

在一个具体的应用中,在至少一层级中每一当前层级进行的原子表征更新的步骤包括:基于各原子的邻居原子的原子表征以及相接化学键的键属性特征,分别对各原子的原子表征进行更新。即针对每一个原子,后端会先对邻居原子的原子表征以及相接化学键的键属性特征进行聚合,得到中间聚合向量,再聚合中间聚合向量和原子的原子表征,以对原子的原子表征进行更新。其中,邻居原子是指与原子通过化学键直接相邻的原子。相接化学键是指连接原子和邻居原子的化学键。在对邻居原子的原子表征以及相接化学键的键属性特征进行聚合,得到中间聚合向量时,可以采用直接叠加、加权平均等方式进行聚合,本实施例在此处不对聚合方式进行具体限定。在对中间聚合向量和原子的原子表征进行聚合时,可以采用最大池化、平均池化等方式进行聚合,本实施例在此处不对聚合方式进行具体限定。

其中,GIN进行分子图内信息学习,公式如下:

其中,

具体的,分子间采用transformer结构进行跨分子学习的步骤包括:

采用多头注意力机制,针对多头注意力机制中每一头注意力,通过注意力的变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,获得当前层级的虚拟向量和各原子的目标原子表征各自的查询向量、键向量和值向量,基于当前层级的虚拟向量和各原子的目标原子表征各自相应的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的初始权重,获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,对初始权重进行修正,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重,基于注意力权重分别对相应的值向量进行加权,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量,分别对当前层级的虚拟向量和各原子的目标原子表征各自相应的每一头注意力的中间编码向量进行融合,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量,将注意力编码向量分别叠加至相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的中间融合向量,通过全连接层对中间融合向量进行映射,获得中间融合向量相应的映射后向量,分别叠加中间融合向量和相应的映射后向量,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,将当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,作为当前层级组合处理的结果。

在具体的应用中,至少一层级中第一层级的虚拟向量为预配置虚拟向量,从至少一层级中第二层级开始的每一当前层级,当前层级的虚拟向量从上一层级组合处理的结果中提取。

其中,分子间采用transformer结构进行跨分子学习所使用的公式如下:

h`

h

其中,LN表示层归一化,h

在具体的应用中,从组合处理结果中提取出的表征各种电解液成分间配比的特征聚合向量可以为transformer中的CLS token(即图11中的represention),在本实施例中也叫做virtual token,即图11中Transformer with VN中的VN。

在一个具体的应用中,将原子关系编码作为偏置项,对初始权重进行修正,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重的公式如下:

其中,attention

在具体的应用中,由于浓度比例已采用量化编码的方式转化为量化特征,所以输入到预训练的溶剂化结构预测模型的输入数据可以表示为h

在一个具体的应用中,当预训练的溶剂化结构预测模型主要建模功能F为F(xi,yi,zi;Li,A,B,C)=(x,y,z),溶剂化结构是指其中的x,y,z。所以,最终完整的人工智能模型的计算流程可以为:通过解析SMILES表达式和浓度特征向量得到初始特征h

以建模功能F为F(xi,yi,zi;Li,A,B,C)=(x,y,z)为例,回归各项属性的过程可以通过如下公式表示:x,y,z=MLP(virtual token),其中的virtual token=MHA(h_final),为从组合处理结果中提取出的虚拟向量。

步骤5:获得溶剂化结构预测结果。

具体的,在人工智能模型输出溶剂化结构预测结果后,后端就已经获得溶剂化结构预测结果。

步骤6:结果返回到前端。

具体的,后端在获取到溶剂化结构预测结果后,会将溶剂化结构预测结果返回到前端,以使得用户可以查看到溶剂化结构预测结果。

下面提供本申请的电解液溶剂化结构预测方法在在分子筛选实验中验证集和测试集上的表现情况,如表1所示,本申请的电解液溶剂化结构预测方法,在验证集上的平均绝对值误差为0.083,在测试集上的平均绝对值误差为0.135,其准确程度完全达到可用状态,在分子筛选实验中准确率高达85%。此外,需要说明的是,本申请所涉及的电解液溶剂化结构预测方法,一次电解液溶剂化结构预测计算耗时为0.01秒/V100(一种图形处理器),而计算模拟计算耗时为16小时/V100,提速576万倍,通过采用本申请所提供的电解液溶剂化结构预测方法,能够基于人工智能的溶剂化结构快速预测,无需分子动力学模拟,能够提高溶剂化结构模拟速度。

表1

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电解液溶剂化结构预测方法的电解液溶剂化结构预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电解液溶剂化结构预测装置实施例中的具体限定可以参见上文中对于电解液溶剂化结构预测方法的限定,在此不再赘述。

在一个实施例中,如图12所示,提供了一种电解液溶剂化结构预测装置,包括:配方信息获取模块1202、成分分析模块1204、向量转化模块1206、组合处理模块1208和预测模块1210,其中:

配方信息获取模块1202,用于获取电解液配方信息;

成分分析模块1204,用于基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息;

向量转化模块1206,用于将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量;

组合处理模块1208,用于基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级组合处理,获得组合处理结果;组合处理包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理;

预测模块1210,用于根据组合处理结果确定表征各种电解液成分配比的溶剂化结构。

上述电解液溶剂化结构预测装置,通过获取电解液配方信息,基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的分子结构表示和浓度信息,能够实现对电解液成分的分析,通过将每种电解液成分的分子结构表示转化为分子图向量,并将每种电解液成分的浓度信息转化为浓度特征向量,能够得到分子结构表示和浓度信息的向量表达,基于各种电解液成分的分子图向量和浓度特征向量,进行至少一层级包括依次进行的分子内信息学习处理和分子间基于注意力机制的卷积处理的组合处理,获得组合处理结果,根据组合处理结果确定表征各种电解液成分配比的溶剂化结构,能够通过包括分子内信息学习处理和分子间基于注意力机制的卷积处理的组合处理,模拟溶剂化结构形成的端到端的过程,实现基于人工智能的溶剂化结构快速预测,无需分子动力学模拟,能够提高溶剂化结构模拟速度。

在一个实施例中,预测模块还用于从组合处理结果中,提取出表征各种电解液成分间配比的特征聚合向量,对特征聚合向量进行回归预测,获得表征各种电解液成分间配比的溶剂化结构。

在一个实施例中,至少一层级包括多个层级;组合处理模块还用于基于各种电解液成分的分子图向量和浓度特征向量,进行第一层级的组合处理,获得第一层级组合处理的结果,从第二层级开始的每一当前层级,基于上一层级组合处理的结果进行当前层级的组合处理,获得当前层级组合处理的结果,直至最后一层级的组合处理输出多个层级的组合处理结果。

在一个实施例中,组合处理模块还用于根据输入到当前层级的输入数据确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征,基于键属性特征和各原子的初始原子表征进行分子内信息学习处理,获得包括各原子的目标原子表征的分子内处理结果,依据各原子的目标原子表征,进行分子间基于注意力机制的卷积处理,获得当前层级组合处理的结果。

在一个实施例中,至少一层级包括多个层级;组合处理模块还用于在至少一层级中的第一层级,根据各种电解液成分的分子图向量和浓度特征向量,确定第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征,从至少一层级中第二层级开始的每一当前层级,根据上一层级组合处理的结果,确定当前层级中各种电解液成分中各原子的初始原子表征,并获取连接各原子的化学键的键属性特征。

在一个实施例中,组合处理模块还用于将各种电解液成分的浓度特征向量作为位置编码,分别融合至各种电解液成分的分子图向量,获得第一层级中各种电解液成分中各原子的初始原子表征以及连接各原子的化学键的键属性特征。

在一个实施例中,组合处理模块还用于基于键属性特征和各原子的初始原子表征进行至少一层级原子表征更新,获得各原子的目标原子表征,将各原子的目标原子表征作为分子内处理结果。

在一个实施例中,组合处理模块还用于基于注意力机制,对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量,分别融合注意力编码向量和相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级组合处理的结果。

在一个实施例中,至少一层级中第一层级的虚拟向量为预配置虚拟向量,从至少一层级中第二层级开始的每一当前层级,当前层级的虚拟向量从上一层级组合处理的结果中提取。

在一个实施例中,注意力机制为多头注意力机制;组合处理模块还用于基于多头注意力机制中每一头注意力,分别对当前层级的虚拟向量和各原子的目标原子表征进行编码,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量,分别对当前层级的虚拟向量和各原子的目标原子表征各自相应的每一头注意力的中间编码向量进行融合,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力编码向量。

在一个实施例中,组合处理模块还用于针对多头注意力机制中每一头注意力,通过注意力的变换矩阵,分别对当前层级的虚拟向量和各原子的目标原子表征进行线性变换,获得当前层级的虚拟向量和各原子的目标原子表征各自的查询向量、键向量和值向量,基于当前层级的虚拟向量和各原子的目标原子表征各自的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重,基于注意力权重分别对相应的值向量进行加权,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力的中间编码向量。

在一个实施例中,组合处理模块还用于基于当前层级的虚拟向量和各原子的目标原子表征各自相应的查询向量和键向量进行注意力权重计算,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的初始权重,获取表征各种电解液成分中各原子之间连接关系的原子关系编码,将原子关系编码作为偏置项,对初始权重进行修正,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的注意力权重。

在一个实施例中,组合处理模块还用于将注意力编码向量分别叠加至相应的当前层级的虚拟向量和各原子的目标原子表征,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的中间融合向量,通过全连接层对中间融合向量进行映射,获得中间融合向量相应的映射后向量,分别叠加中间融合向量和相应的映射后向量,获得当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,将当前层级的虚拟向量和各原子的目标原子表征各自相应的目标融合向量,作为当前层级组合处理的结果。

在一个实施例中,组合处理模块还用于通过预训练的溶剂化结构预测模型执行至少一层级组合处理,溶剂化结构通过溶剂化结构预测模型确定;溶剂化结构预测模型通过基于分子动力学模拟生成的训练数据训练得到。

在一个实施例中,电解液溶剂化结构预测装置还包括训练模块,训练模块用于获取至少一条样本配方信息,基于至少一条样本配方信息分别进行分子动力学模拟,获得至少一条样本配方信息各自相应的模拟溶剂化结构,基于至少一条样本配方信息和相应的模拟溶剂化结构进行训练,获得预训练的溶剂化结构预测模型。

在一个实施例中,训练模块还用于针对至少一条样本配方信息中每条样本配方信息,为样本配方信息中各样本分子配置初始位置和初始速度,将初始位置作为当前位置,并将初始速度作为当前速度,基于各样本分子的当前位置和当前速度,计算各样本分子的合外力,基于各样本分子的合外力,计算各样本分子的更新位置和更新速度,将更新位置更新为当前位置,并将更新速度更新为当前速度,跳转至基于各样本分子的当前位置和当前速度,计算各样本分子的合外力的步骤,直到各种样本分子达到平衡态,获得样本配方信息相应的模拟溶剂化结构。

在一个实施例中,向量转化模块还用于基于电解液配方信息,获得电解液配方信息中多个电解液成分各自的电荷信息,将每种电解液成分的电荷信息转化为电荷向量;组合处理模块还用于基于各种电解液成分的分子图向量、浓度特征向量和电荷向量,进行至少一层级组合处理,获得组合处理结果。

在一个实施例中,每种电解液成分包括金属离子、盐离子和至少一种溶剂分子;向量转化模块还用于计算盐离子和至少一种溶剂分子相对于金属离子的相对浓度,分别对相对浓度进行编码,获得盐离子和至少一种溶剂分子各自的浓度特征向量,并将金属离子的浓度特征向量设置为零向量。

上述电解液溶剂化结构预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储获取到的电解液配方信息等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电解液溶剂化结构预测方法。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种电解液溶剂化结构预测方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图13和图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 客户稳定性的预测方法、装置、计算机设备和存储介质
  • 软件可靠性预测方法、装置、计算机设备和存储介质
  • 短时交通流变化预测方法、装置、计算机设备及存储介质
  • 一种结构可调的溶剂化离子液体电解液及其制备方法、锂硫电池
  • 一种结构可调的溶剂化离子液体电解液及其制备方法、锂硫电池
技术分类

06120116467446