掌桥专利:专业的专利平台
掌桥专利
首页

分子对接构象预测方法、装置、存储介质及设备

文献发布时间:2024-04-18 19:58:26


分子对接构象预测方法、装置、存储介质及设备

技术领域

本申请涉及人工智能技术领域,具体涉及一种分子对接构象预测方法、装置、存储介质及设备。

背景技术

蛋白质是构成人体细胞的基本有机物,在人体中发挥着非常重要的作用,蛋白质分子间的相互作用对于细胞内各种生物过程的调控和发生至关重要。然而,由于蛋白质分子结构的复杂性和多样性,在实验中直接测量蛋白质分子的相互作用是一项困难的任务。

因此,蛋白质分子对接成为了预测这些相互作用的重要手段。蛋白质分子对接作为一种关键的计算生物学方法,对于理解细胞内的生物分子过程和药物开发具有重要意义。蛋白质分子对接的主要目标是通过对两个或多个蛋白质分子进行模型构建和优化,预测蛋白质分子之间稳定的结合结构(即稳定的蛋白质分子对接构象)。相应的,蛋白质分子对接打分则是对海量的候选蛋白质分子对接构象的对接稳定性进行打分和排序,从而能够挑选出合理且准确的蛋白质分子对接构象。

然而,现有的蛋白质分子对接打分方式仅参照蛋白质分子的表面级作用力的维度进行打分和排序,参照维度单一,会导致蛋白质分子对接打分不准确,进而,使得预测的蛋白质分子对接构象的对接稳定性也会较差,对下游任务的测量精度产生负面影响。

发明内容

本申请实施例提供一种分子对接构象预测方法、装置、存储介质及设备,可以提升分子对接构象预测的准确性。

为解决上述技术问题,本申请实施例提供以下技术方案:

一种分子对接构象预测方法,包括:

获取第一分子的第一三维构象以及第二分子的第二三维构象;

将所述第一三维构象在不同旋转角的作用下分别与所述第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;

确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;

根据所述目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;

根据所述目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

一种分子对接构象预测装置,包括:

获取单元,用于获取第一分子的第一三维构象以及第二分子的第二三维构象;

对接单元,用于将所述第一三维构象在不同旋转角的作用下分别与所述第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;

确定单元,用于确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;

计算单元,用于根据所述目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;

预测单元,用于根据所述目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

在一些实施方式中,所述对接单元,包括:

旋转子单元,用于通过不同旋转角对所述第一三维构象进行旋转处理,得到旋转处理后每个旋转角下相应的第一目标三维构象;

遍历对接子单元,用于将每个旋转角下相应的第一目标三维构象分别与所述第二三维构象进行遍历对接,得到每个旋转角下相应的多个分子对接构象;

确定子单元,用于将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象,所述作用力参数由每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数生成。

在一些实施方式中,所述遍历对接子单元,用于:

将每个旋转角下相应的第一目标三维构象进行网格化处理,得到每个旋转角下相应的第一三维网格结构,并将所述第二三维构象进行网格化处理,得到第二三维网格结构;

依次将每个旋转角下相应的第一三维网格结构平移遍历所述第二三维网格结构,得到每个旋转角下平移遍历生成的多个分子对接构象。

在一些实施例中,所述确定子单元,包括:

确定子模块,确定每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数;

计算子模块,用于根据所述原子级别作用力参数、残基级别作用力参数和表面级别作用力参数,计算得到每个分子对接构象的作用力参数;

对比子模块,用于依次将每个旋转角下的多个分子对接构象的作用力参数进行对比,并将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象。

在一些实施例中,所述确定子模块,用于:

在每个第一三维网格结构的网格点上生成第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数,并在所述第二三维网格结构的网格点上生成第二原子级别作用力参数、第二残基级别作用力参数和第二表面级别作用力参数;

确定每个分子对接构象中第一三维网格结构和相应对接的所述第二三维网格结构之间重叠的第一目标网格点;

根据所述第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行计算,得到每个分子对接构象中的原子级别作用力参数;

根据所述第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行计算,得到每个分子对接构象中的残基级别作用力参数;

根据所述第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行计算,得到每个分子对接构象中的表面级别作用力参数。

在一些实施例中,所述确定子模块,还用于:

获取每个第一三维网格结构的网格点关联的原子的原子类型,根据所述原子类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一原子级别作用力参数;

获取每个第一三维网格结构的网格点关联的氨基酸残基的第一残基类型,根据所述第一残基类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一残基级别作用力参数;

获取每个第一三维网格结构的网格点关联的第一表面级别作用力集合,根据所述第一表面级别作用力集合进行向量化处理,得到每个第一三维网格结构的网格点上的第一表面级别作用力参数;

基于不同原子类型的原子对所述第二三维网格结构的网格点分别进行作用力测试,得到所述第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合;

将所述原子级别作用力集合进行向量化处理,得到所述第二三维网格结构的网格点上的第二原子级别作用力参数;

获取所述第二三维网格结构的网格点关联的氨基酸残基的第二残基类型,根据所述第二残基类型进行向量化处理,得到所述第二三维网格结构的网格点上的第二残基级别作用力参数;

获取所述第二三维网格结构的网格点关联的第二表面级别作用力集合,根据所述第二表面级别作用力集合进行向量化处理,得到所述第二三维网格结构的网格点上的第二表面级别作用力参数;

确定每个分子对接构象中第一三维网格结构和相应对接的所述第二三维网格结构之间重叠的第一目标网格点;

根据所述第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行计算,得到每个分子对接构象中的原子级别作用力参数;

根据所述第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行计算,得到每个分子对接构象中的残基级别作用力参数;

根据所述第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行计算,得到每个分子对接构象中的表面级别作用力参数。

在一些实施例中,所述对接单元,用于:

将所述第一三维构象和所述第二三维构象输入预训练后的构象预测模型,输出多个旋转角以及每个旋转角相应的偏移量;

获取所述第一三维构象在每个旋转角的作用下,得到的第二目标三维构象;

将每个旋转角下的第二目标三维构象根据相应的偏移量与所述第二三维构象进行对接,得到每个旋转角下的候选分子对接构象。

在一些实施例中,所述确定单元,用于:

将每个旋转角下的候选分子对接构象中的第二目标三维构象进行网格化处理,得到每个旋转角下的第三三维网格结构,并将所述第二三维构象进行网格化处理,得到第四三维网格结构;

在每个第三三维网格结构的网格点上生成第三原子级别作用力参数、第三残基级别作用力参数和第三表面级别作用力参数,并在所述第四三维网格结构的网格点上生成第四原子级别作用力参数、第四残基级别作用力参数和第四表面级别作用力参数;

确定每个候选分子对接构象中第三三维网格结构和相应对接的所述第四三维网格结构之间重叠的第二目标网格点;

根据所述第二目标网格点上的第三原子级别作用力参数和相应的第四原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;

根据所述第二目标网格点上的第三残基级别作用力参数和相应的第四残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;

根据所述第二目标网格点上的第三表面级别作用力参数和相应的第三表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数。

在一些实施例中,所述确定单元,用于:

将每个旋转角下的候选分子对接构象中经过相应旋转角作用下的第一三维构象进行网格化处理,得到每个旋转角下的第五三维网格结构,并将所述第二三维构象进行网格化处理,得到第六三维网格结构;

在每个第五三维网格结构的网格点上生成第五原子级别作用力参数、第五残基级别作用力参数和第五表面级别作用力参数,并在所述第六三维网格结构的网格点上生成第六原子级别作用力参数、第六残基级别作用力参数和第六表面级别作用力参数;

确定每个候选分子对接构象中第五三维网格结构和相应对接的所述第六三维网格结构之间重叠的第三目标网格点;

根据所述第三目标网格点上的第五原子级别作用力参数和相应的第六原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;

根据所述第三目标网格点上的第五残基级别作用力参数和相应的第六残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;

根据所述第三目标网格点上的第五表面级别作用力参数和相应的第六表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数。

一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述分子对接构象预测方法。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述分子对接构象预测方法。

一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取所述计算机指令,处理器执行所述计算机指令,使得实现上述分子对接构象预测方法。

本申请实施例通过获取第一分子的第一三维构象以及第二分子的第二三维构象;将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。以此,通过从目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数的多个维度上,综合对候选分子对接构象的对接稳定性进行预测,相对于相关技术中参照单一维度进行预测的方案,本申请实施例预测的目标候选分子对接构象的对接稳定性更好,因此极大的提升了分子对接构象预测的准确性。

本公开的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的分子对接构象预测系统的场景示意图。

图2是本申请实施例提供的分子对接构象预测方法的应用示意图。

图3为本申请实施例提供的分子对接构象预测方法的流程示意图。

图4为本申请实施例提供的分子对接构象预测方法的场景示意图。

图5为本申请实施例提供的分子对接构象预测方法的另一场景示意图。

图6为本申请实施例提供的分子对接构象预测方法的另一场景示意图。

图7为本申请实施例提供的分子对接构象预测方法的另一场景示意图。

图8为本申请实施例提供的分子对接构象预测方法的另一流程示意图。

图9是本申请实施例提供的分子对接构象预测装置的结构示意图。

图10是本申请实施例提供的服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请的方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请书中相关数据收集处理在实例应用时应该严格根据相关国家法律法规的要求,获取个人信息主体的知情同意或单独同意,并在法律法规及个人信息主体的授权范围内,开展后续数据使用及处理行为。

需要说明的是,在说明书、权利要求书和上述附图所描述的一些流程中,包含了按照特定顺序出现的多个步骤,但应该清楚了解,这些步骤可以不按照其在本文中出现的顺序来执行或并行执行,步骤序号仅仅是用于区分开各个不同的步骤,序号本身不代表任何的执行顺序。此外,本文中的“第一”、“第二”或者“目标”等描述,是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

对本公开实施例进行进一步详细说明之前,对本公开实施例中涉及的名词和术语进行说明,本公开实施例中涉及的名词和术语适用于如下的解释:

分子,是指单独存在,并保持纯物质的化学性质的最小粒子。

原子,原子是参加化学反应的最小质点,分子则是在游离状态下单质或化合物能够独立存在的最小质点。分子是由原子组成的,单质分子由相同元素的原子组成,化合物分子由不同元素的原子组成。化学变化的实质就是不同物质的分子中各种原子进行重新结合。

氨基酸是组成蛋白质的基本单位,是分子中具有氨基和羧基的一类含有复合官能团的化合物,具有共同的基本结构,由于它是羧酸分子的α碳原子上的氢被一个氨基取代的化合物,故又称为α氨基酸,按化学结构式分为脂肪族、芳香族氨基酸和杂环氨基酸。

组成蛋白质的氨基酸有20多种,但绝大多数的蛋白质只由20种氨基酸组成。按化学结构式分为脂肪族氨基酸、芳香族氨基酸和杂环氨基酸。

肽链(peptide chain)是生物名词,由多个氨基酸脱水缩合形成肽键(化学键)连接而成。

两个氨基酸相连为二肽,依此类推还有三肽、四肽……10个以下氨基酸组成的称寡肽(小分子肽),超过十个就是多肽,而超过五十个就被称为蛋白质。

蛋白质是由氨基酸以“脱水缩合”的方式组成的多肽链经过盘曲折叠形成的具有一定空间结构的物质。

蛋白质具有不同的结构层级,结构层级是指蛋白质分子在空间中的不同层次结构,包括原子层级、氨基酸层级、多肽链层级、二级结构层级、三级结构层级和四级结构层级,如下:

1、原子层级

蛋白质分子由原子组成,包括碳、氢、氧、氮和硫等元素。原子层级是蛋白质结构的最基本层级,它决定了蛋白质分子的化学性质和反应能力。

2、氨基酸层级

氨基酸是蛋白质分子的基本组成单元,它们通过肽键连接成多肽链。为蛋白质结构的第二层级,决定了蛋白质分子的序列和化学性质。

肽链里的氨基酸残基之间会自发形成氢桥键,二硫键等,使肽链盘曲折叠,结构更加稳定。比如形成特定蛋白质的肽链,一边从核糖体转录出来一边末端就开始盘曲折叠,并不是要强加给它一个开始盘曲折叠的信息它才开始盘曲折叠。

氨基酸残基(Residue),在蛋白质的序列中,氨基酸之间的氨基和羧基脱水成键,氨基酸由于其部分基团参与了肽键的形成,剩余的结构部分则称氨基酸残基。

3、多肽链层级

多肽链是氨基酸通过肽键连接而成的线性链状结构。是蛋白质结构的第三层级,它决定了蛋白质分子的主要结构和形状。

4、二级结构层级

二级结构是多肽链中相邻氨基酸之间的氢键作用形成的局部结构,包括α-螺旋,β-螺旋和无规卷曲等。为第四层级,决定了蛋白质分子的局部结构和稳定性。

5、三级结构层级

三级结构是多肽链中各个二级结构之间的空间排列形成的整体结构,包括α-螺旋,β-螺旋和无规卷曲等,是第五层级,决定蛋白质分子的整体结构和功能。

6、四级结构层级

是多个多肽链相互作用形成的复合物结构,包括同源二聚体、异源二聚体和多聚体等。是蛋白质结构的最高层级,决定了蛋白质分子的功能和生物学活性。

抗原:抗原是人体的免疫系统认为的需要清除的东西,比如说病毒、细菌、寄生虫、过敏原、疫苗等。

抗体:抗体是免疫球蛋白,它能够识别相对应的抗原,并且与抗原特异性接合,这样就在体内中和或者排除抗原,保护了机体不受异物的侵犯。外来抗原进入机体后能诱导机体产生特异的免疫反应,这种免疫反应通过淋巴细胞来完成。

配体:同锚定蛋白结合的任何分子都称为配体。配体通常本身具有其特别的生物活性,并能和受体接合,呈现特异性的生物活性分子。例如,配体可以与抗原接合从而使机体产生特异性反应。

蛋白蛋白对接(Protein-protein docking),是一种生物学技术,可以实现蛋白质间的相互作用,并可用于研究蛋白质间的结构和功能之间的关系,可以有助于理解蛋白质之间的相互作用机制,一般为模拟蛋白质分子之间的所有可能的对接形式,并根据打分方法给每种对接形式的对接构象进行打分排名。

蛋白质的表面级作用力,即以不同探针原子对蛋白质的表面进行采样探测,得到蛋白质的表面的表面级作用力,该表面级作用力可以包括静电力、疏水力和范德华力。

静电力,是由于原子的电荷而产生的作用力。当两个原子之间存在电荷差异时,就会产生静电相互作用力。这种力在原子间的距离很远时就开始发挥作用。

疏水力,指非极性基团为了避开水而聚集在一起的疏水作用力,对维持膜结构起主要作用,依赖于水的存在。

范德华力,是原子间最常见的作用力之一。它是一种短程力,只在原子之间距离较近时才会发挥作用。

氢键作用力是分子间作用力的一种,是一种永久偶极之间的作用力,氢键作用力是一种重要的能量来源,它能够控制蛋白质的结构,影响蛋白质的功能及其作用。

蛋白质对接构象,即为两个蛋白质对接之后的空间结构。

在相关技术中,在进行抗体药物研究时,一般需要先预测出与抗原产生特异性结合而导致机体产生特异性反应(例如病变)的配体与抗原的对接位置。然后研究出可以在该对接位置上能将配体挤出并与抗原接合的抗体,即评估出与配体具有竞争性的抗体,然后据此抗体研发抗体药物。目前预测配体与抗原对接位置或者抗体与抗原的对接位置的方法有传统的蛋白蛋白对接方法,该方法可以先将需要研究的配体与抗原或者抗体与抗原进行蛋白蛋白对接,得到大量的对接构象。然后,专家对大量的对接构象中挑选出候选对接构象并进入深入分析来确定配体与抗原或抗体与抗原的对接位置,该方法不仅效率低下,而且也受专家的个人经验和能力影响,导致无法保证预测得到的对接构象的准确性。或者,在相关技术中也可以采用仅参照每个对接构象的蛋白质分子之间的表面级作用力的维度进行打分排序,将高分的对接构象作为候选对接构象来确定配体与抗原或抗体与抗原的对接位置,但是,上述方法参照维度单一,会导致蛋白质分子对接打分不准确,使得预测的蛋白质分子对接构象的对接稳定性也会较差,对下游任务的测量精度产生负面影响。

本申请实施例为了解决上述问题,提出一种能够提高分子对接构象打分的准确性,使得分子对接构象的对接稳定性较好,提升分子对接构象预测的准确性。

请参阅图1,图1是本申请实施例提供的分子对接构象预测系统的场景示意图。它包括终端140、互联网130、网关120、服务器110等。

终端140括桌面电脑、膝上型电脑、PDA(个人数字助理)、手机、车载终端、家庭影院终端、专用终端等多种形式。另外,它可以是单台设备,也可以是多台设备组成的集合。终端140可以以有线或无线的方式与互联网130进行通信,交换数据。

服务器110是指能对终端140提供某些服务的计算机系统。相对于普通终端140来说,服务器110在稳定性、安全性、性能等方面都要求更高。服务器110可以是网络平台中的一台高性能计算机、多台高性能计算机的集群、一台高性能计算机中划出的一部分(例如虚拟机)、多台高性能计算机中划出的一部分(例如虚拟机)的组合等。

网关120又称网间连接器、协议转换器。网关在传输层上实现网络互连,是一种充当转换作用的计算机系统或设备。在使用不同的通信协议、数据格式或语言,甚至体系结构完全不同的两种系统之间,网关是一个翻译器。同时,网关也可以提供过滤和安全功能。终端140向服务器110发送的消息要通过网关120发送到相应的服务器110。服务器110向终端140发送的消息也要通过网关120发送到相应的终端140。

本公开实施例的分子对接构象预测方法可以完全在终端140实现,可以完全在服务器110实现,也可以一部分在终端140实现,另一部分在服务器110实现。

分子对接构象预测方法完全在终端140实现的情况下,可以由终端140获取第一分子的第一三维构象以及第二分子的第二三维构象;将该第一三维构象在不同旋转角的作用下分别与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

分子对接构象预测方法完全在服务器110实现的情况下,在服务器110获取第一分子的第一三维构象以及第二分子的第二三维构象;将该第一三维构象在不同旋转角的作用下分别与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

分子对接构象预测方法一部分在终端140实现,另一部分在服务器110实现的情况下,可以在终端140上获取第一分子的第一三维构象以及第二分子的第二三维构象,将该第一分子的第一三维构象以及第二分子的第二三维构象发送至服务器110,由服务器110实现将该第一三维构象在不同旋转角的作用下分别与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

本公开实施例可以应用在多种场景下,如图2所示的分子对接构象预测系统的场景。

分子对接构象预测系统:

分子对接构象预测系统是指能够根据对象提供的第一分子的第一三维构象11和第二分子的第二三维构象12,自动挑选出高分的目标候选分子对接构象13。

如图2所示,在终端的分子对接构象预测系统的界面10上,对象可以选择第一分子的第一三维构象11和第二分子的第二三维构象12,这时,医疗识别系统可以将将该第一三维构象11在不同旋转角的作用下分别与该第二三维构象12进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象,例如可以输出目标作用力参数最大的目标候选分子对接构象13,使得可以根据该目标候选分子对接构象13快速分析确定配体与抗原或抗体与抗原的对接位置。

需要说明的是,图1所示的分子对接构象预测系统的场景示意图仅仅是一个示例,本申请实施例描述的分子对接构象预测系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着分子对接构象预测系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。

在本实施例中,将从分子对接构象预测装置的角度进行描述,该分子对接构象预测装置具体可以集成在具备储存单元并安装有微处理器而具有运算能力的计算机设备中,计算机设备可以为服务器,即在本实施例中以计算机设备为服务器进行说明。

请参阅图3,图3是本申请实施例提供的分子对接构象预测方法的流程示意图。该分子对接构象预测方法包括:

在步骤201中,获取第一分子的第一三维构象以及第二分子的第二三维构象。

其中,该第一分子和第二分子均可以为蛋白质分子,相应的,本申请实施例应用在抗体药物研发的场景下,该第一分子可以为抗体或者配体,该第二分子可以为抗原。

该第一三维构象为该第一分子特定的空间结构,该第二三维构象为第二分子特定的空间结构,该第一三维构象和第二三维构象可以基于实验测量的结构,也可以来源于人工智能方法生成,例如Alphafold2(一种预测蛋白质三维结构的系统,AF2),该Alphafold2可以实现每一蛋白质分子的分子结构预测,从而得到每一蛋白质分子的空间结构。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

以此,在本申请实施例中,可以通过该Alphafold2预测得到该第一分子的第一三维构象以及第二分子的第二三维构象。例如,请一并参阅图4所示,可以获取该第一分子的第一三维构象21以及获取该第二分子的第二三维构象22。

在步骤202中,将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象。

其中,获取到第一三维构象和第二三维构象之后,为了实现后续的抗体药物研究,需要实现该第一三维构象和第二三维构象之间的蛋白蛋白对接,即需要模拟蛋白质之间的所有可能的对接形式,以便后续对每种对接形式的对接构象进行打分排名。

在本申请实施例中,由于该第一三维构象为三维结构,因此该旋转角可以为三维空间上的所有可能转动的角度的集合,可以为(0度°(角)至360°,0°至360°,0°至180°),即根据不同旋转角的作用下对第一三维构象进行旋转,模拟第一三维构象在不同的角度的作用下的变化形态。

进一步的,可以将进行旋转之后的第一三维构象分别与该第二三维构象进行对接,得到每个旋转角下最佳对接方式的候选分子对接构象,该最佳对接方式可以为基于Alphafold2预测得到,或者根据实验测试数据确定,以实现后续从每个旋转角下的候选分子对接构象中选取出得分高的目标候选分子对接构象。

在一些实施方式中,以全局搜索的方式来获取每个旋转角下的候选分子对接构象,如下,即将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象,包括:

(1)通过不同旋转角对该第一三维构象进行旋转处理,得到旋转处理后每个旋转角下相应的第一目标三维构象;

(2)将每个旋转角下相应的第一目标三维构象分别与该第二三维构象进行遍历对接,得到每个旋转角下相应的多个分子对接构象;

(3)将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象,该作用力参数由每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数生成。

其中,该旋转角可以为三维空间上的所有可能转动的角度的集合,可以为(0°至360°,0°至360°,0°至180°),可以以10度作为旋转角变化步长进行全局搜索,则全局搜索次数为36乘36乘18次,也即具有36乘36乘18个旋转角,上述举例的旋转角变化步长10度不作为具体限定,在实际的场景中,还可以是5度或者20度。以此,可以通过上述不同旋转角对该第一三维构象分别进行旋转处理,得到旋转处理后每个旋转角下相应的第一目标三维构象。

进一步的,为了模拟蛋白质分子之间的所有可能的对接形式,还需要将每个旋转角下相应的第一目标三维构象与该第二三维构象进行遍历对接,即根据每个旋转角下相应的第一目标三维构象与该第二三维构象所有可能的对接方式进行遍历,得到每个旋转角下相应的多个分子对接构象。

相应的,不同的分子对接构象中由于不同的三维构象对接方式,相应的对接效果也不同,因此,如何对不同的分子对接构象进行准确的打分预测,丞待解决,在相关技术中,虽然可以参照蛋白质分子的表面级作用力的维度进行打分和排序,但是由于参照维度单一,会导致打分不准确,最后导致预测的蛋白质对接构象的对接稳定性较差。

因此,本申请实施例从分子对接构象中不同的三维构象之间的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数一并进行考量,对该分子对接构象进行打分,可以提升分子对接构象预测的准确性。

需要说明的是,分子对接构象中不同的三维构象之间的原子会相互作用,产生原子级别作用力参数,该原子级别作用力参数越大,即三维构象之间产生越大的化学反应,说明三维构象之间对接位置越好,该原子级别作用力参数越小,即三维构象之间产生越小的化学反应,说明三维构象之间对接位置越差。

该分子对接构象中不同的三维构象之间的氨基酸残基(简称为残基)也会相互作用,产生残基级别作用力参数,残基可以包括多种,例如丙氨酸残基、精氨酸残基以及甘氨酸残基等,每种氨基酸之间具有不同的残基级别作用力,例如,请一并参阅下表1。

表1氨基酸之间残基作用力表

请参阅表1可以看出,丙氨酸残基相对于精氨基酸残基的残基级别作用力为1.07。精氨基酸残基相对于丙氨酸残基的残基级别作用力为1.46,精氨基酸残基相对于精氨酸残基的残基级别作用力为0.86,精氨基酸残基相对于甘氨酸残基的残基级别作用力为0.67。甘氨基酸残基相对于精氨酸残基的残基级别作用力为1.35,甘氨基酸残基相对于甘氨基酸残基的残基级别作用力为1.33。上述表1中的举例只是为了更好的说明本申请实施例,并不作为具体限定,根据不同的实施场景,氨基酸之间的残基级别作用力可以不同。

以此,可以参阅表1,根据分子对接构象中不同三维构象之间的残基之间的相互作用产生的残基级别作用力统计得到残基级别作用力参数,该残基级别作用力参数越大,即三维构象之间产生越大的化学反应,说明三维构象之间对接位置越好,该残基级别作用力参数越小,即三维构象之间产生越小的化学反应,说明三维构象之间的对接位置越差。

需要说明的是,分子对接构象中不同的三维构象之间彼此会产生表面级作用,产生表面级作用力参数,该表面级作用力参数越大,即三维构象之间产生越大的化学反应,说明三维构象之间对接位置越好,该表面级作用力参数越小,即三维构象之间产生越小的化学反应,说明三维构象之间对接位置越差。

以此,可以根据每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数一并生成作用力参数,从多个维度对每个分子对接构象进行打分,实现更准确的打分效果,进而,可以将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象,即得到每个旋转角下最佳对接方式的候选分子对接构象。

在一些实施方式中,将每个旋转角下相应的第一目标三维构象分别与该第二三维构象进行遍历对接,得到每个旋转角下相应的多个分子对接构象,包括:

(1.1)将每个旋转角下相应的第一目标三维构象进行网格化处理,得到每个旋转角下相应的第一三维网格结构,并将该第二三维构象进行网格化处理,得到第二三维网格结构;

(1.2)依次将每个旋转角下相应的第一三维网格结构平移遍历该第二三维网格结构,得到每个旋转角下平移遍历生成的多个分子对接构象。

在本申请实施例中,可以通过网格化处理的方式实现模拟蛋白质分子之间的所有可能的对接形式,该网格化处理可以理解为对该三维构象进行建模,方便后续的遍历以及参数采样,以此,可以将每个旋转角下相应的第一目标三维构象进行网格化处理,得到每个旋转角下的第一三维网格结构,该第一三维网格结构中包括相应的第一目标三维构象,即实现将第一目标三维构象中映射到相应的网格结构中。并将第二三维构象进行网格化处理,得到第二三维网格结构,该第二三维网格结构中包括相应的第二三维构象。

为了更好的说明本申请实施例,请一并参阅图5所示,将某个旋转角下相应的第一目标三维构象进行网格化处理,得到该旋转角下相应的第一三维网格结构23,该第一三维网格结构23中包括第一目标三维构象,即通过该第一三维网格结构23实现对第一目标三维构象进行建模。相应的,将该第二三维构象22进行网格化处理,得到第二三维网格结构24,该第二三维网格结构24中包括第二三维构象,即通过该第二三维网格结构24实现对第二三维构象22进行建模。

进一步的,为了模拟蛋白质分子之间所有可能的对接形式,可以将每个旋转角下相应的第一三维网格结构平移遍历该第二三维网格结构,该平移遍历的实现过程可以理解为卷积遍历的过程,在两个网格结构结合时,第一三维网格结构中的第一目标三维构象会和第二三维网格结构中的第二三维构象实现对接,以此,基于平移遍历,可以得到每个旋转角下平移遍历生成的全部分子对接构象。例如,请继续参阅图5所示,第一三维网格结构23平移遍历第二三维网格结构24的过程中,每一次平移,该第一三维网格结构23会以不同的偏移量与该第二三维网格结构24结合,相应的,该第一三维网格结构23中的第一目标三维构象会和第二三维网格结构中的第二三维构象实现对接,以生成相应的分子对接构象,以此类推,通过平移遍历,可以得到该旋转角下的全部分子对接构象。

在一些实施方式中,该将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象,包括:

(2.1)确定每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数;

(2.2)根据该原子级别作用力参数、残基级别作用力参数和表面级别作用力参数,计算得到每个分子对接构象的作用力参数;

(2.3)依次将每个旋转角下的多个分子对接构象的作用力参数进行对比,并将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象。

其中,为了实现后续可以选取准确分子对接构象,需要从每个旋转角下选取最佳的对接构象,在本申请实施例中,可以测量每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数,并将该原子级别作用力参数、残基级别作用力参数和表面级别作用力参数统计为作用力参数,该作用力参数可以从三个维度反应分子对接构象的对接稳定性进行打分,相对于相关技术中仅通过表面级作用力的维度进行打分的方案,可以更好保证预测的蛋白质对接构象的稳定性。

进一步的,可以依次将每个旋转角下的多个分子对接构象的作用力参数进行对比,找出每个旋转角下作用力参数最大的分子对接构象作为候选分子对接构象。

在一些实施方式中,该确定每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数,包括:

(3.1)在每个第一三维网格结构的网格点上生成第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数,并在该第二三维网格结构的网格点上生成第二原子级别作用力参数、第二残基级别作用力参数和第二表面级别作用力参数;

(3.2)确定每个分子对接构象中第一三维网格结构和相应对接的该第二三维网格结构之间重叠的第一目标网格点;

(3.3)根据该第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行计算,得到每个分子对接构象中的原子级别作用力参数;

(3.4)根据该第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行计算,得到每个分子对接构象中的残基级别作用力参数;

(3.5)根据该第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行计算,得到每个分子对接构象中的表面级别作用力参数。

其中,由于该第一三维网格结构中包括第一目标三维构象,所以可以以该第一三维网格结构的网格点作为测量点,测量得到每个第一三维网格结构的网格点上相应的第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数,第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数可以为向量。相应的,该第二三维网格结构中包括第二三维构象,所以可以以该第二三维网格结构的网格点作为测试点,测量得到该第二三维网格结构的网格点上相应的第二原子级别作用力参数、第二残基级别作用力参数和第二表面级别作用力参数。

为了更好的说明上述方案,本申请实施例先对如何在每个第一三维网格结构的网格点上生成第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数进行解释,该在每个第一三维网格结构的网格点上生成第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数,包括:

(4.1)获取每个第一三维网格结构的网格点关联的原子的原子类型,根据该原子类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一原子级别作用力参数;

(4.2)获取每个第一三维网格结构的网格点关联的氨基酸残基的第一残基类型,根据该第一残基类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一残基级别作用力参数;

(4.3)获取每个第一三维网格结构的网格点关联的第一表面级别作用力集合,根据该第一表面级别作用力集合进行向量化处理,得到每个第一三维网格结构的网格点上的第一表面级别作用力参数。

其中,该原子类型为原子的种类,例如该原子类型可以为碳、氢、氧、氮和硫。以此,获取每个第一三维网格结构的网格点上关联的原子的原子类型,该关联的判定可以为距离该网格点的空间距离最小的原子,并根据该原子类型进行向量化处理,该向量化处理可以为Onehot编码(独热编码)处理,以此,得到每个第一三维网格结构的网格点上的第一原子级别作用力参数,为了更好的说明本申请实施例,请一并参阅图6所示,可以获取第一三维网格结构31指示的网格点关联的原子的原子类型,例如为第三原子的原子类型,然后根据该原子类型进行向量化处理,即可以对该原子类型进行独热编码,得到该指示的网格点的第一原子级别作用力参数(0,0,1,0,0)。

进一步的,该残基类型为氨基酸残基的类型,例如为丙氨酸残基、精氨酸残基以及甘氨酸残基,以此,获取每个第一三维网格结构的网格点上关联的氨基酸残基的第一残基类型,该关联的判定可以为距离该网格点的空间距离最小的氨基酸残基,并根据该第一残基类型进行向量化处理,该向量化处理也可以为独热编码处理,以此,得到每个第一三维网格结构的网格点上的第一残基级别作用力参数,该第一残基级别作用力参数代表该网格点所属的氨基酸残基的类型。

相应的,还可以以该第一三维网格结构的网格点作为不同探针原子的表面,对网格点上的多种第一表面级别作用力进行探测,例如该第一表面级别作用力包括静电力、疏水力和范德华力,上述举例目的为更好的说明本申请实施例,还可以包括其他表面级作用力,此处不作一一赘述。以此,该第一表面级别作用力集合可以包括静电力、疏水力和范德华力,进而可以将该第一表面级别作用力集合进行向量化处理,该向量化处理也可以为独热编码处理,得到每个第一三维网格结构的网格点上的第一表面级别作用力参数。为了更好的说明本申请实施例,请一并参阅图7所示,可以获取第一三维网格结构31指示的网格点上的第一表面级别作用力集合,即静电力0.2、疏水力0.1和范德华力0.3,进而将该第一表面级别作用力集合进行独热编码处理,得到该指示的网格点上的第一表面级别作用力参数(0.2,0.1,0.3)。

同理,为了更好的说明上述方案,本申请实施例先对如何在该第二三维网格结构的网格点上生成第二原子级别作用力参数、第二残基级别作用力参数和第二表面级别作用力参数进行解释,该在该第二三维网格结构的网格点上生成第二原子级别作用力参数、第二残基级别作用力参数和第二表面级别作用力参数,包括:

(5.1)基于不同原子类型的原子对该第二三维网格结构的网格点分别进行作用力测试,得到该第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合;

(5.2)将该原子级别作用力集合进行向量化处理,得到该第二三维网格结构的网格点上的第二原子级别作用力参数;

(5.3)获取该第二三维网格结构的网格点关联的氨基酸残基的第二残基类型,根据该第二残基类型进行向量化处理,得到该第二三维网格结构的网格点上的第二残基级别作用力参数;

(5.4)获取该第二三维网格结构的网格点关联的第二表面级别作用力集合,根据该第二表面级别作用力集合进行向量化处理,得到该第二三维网格结构的网格点上的第二表面级别作用力参数。

其中,由于后续第一三维网格结构和第二三维网格结构需要进行结合,因此可以基于不同原子类型的原子作为探针原子对该第二三维网格结构的网格点分别进行作用力测试,得到该第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合,每种原子级别作用力由原子之间的吸引力、排斥力、疏水力和氢键力组成生成。

例如,请继续参阅图6所示,可以基于5种原子类型的原子对该第二三维网格结构32指示的网格点分别进行作用力测试,得到该第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合。

以此,将该原子级别作用力集合进行向量化处理,该向量化处理可以为独热编码处理,得到该第二三维网格结构的网格点上的第二原子级别作用力参数,例如,请继续参阅图6所示,得到该第二三维网格结构32指示的网格点的第二原子级别作用力参数为(0.2,0.1,0.3,0.5,0.7)。

进一步的,获取每个第二三维网格结构的网格点上关联的氨基酸残基的第二残基类型,该关联的判定可以为距离该网格点的空间距离最小的氨基酸残基,并根据该第二残基类型进行向量化处理,该向量化处理可以为独热编码处理,以此,得到该第二三维网格结构的网格点上的第二残基级别作用力参数,该第二残基级别作用力参数代表该网格点所属的氨基酸残基的类型。

相应的,还可以以该第二三维网格结构的网格点作为不同探针原子的表面,对网格点上的多种第二表面级别作用力进行探测,例如该第二表面级别作用力包括静电力、疏水力和范德华力。以此,该第二表面级别作用力集合可以包括静电力、疏水力和范德华力,进而可以将该第二表面级别作用力集合进行向量化处理,该向量化处理也可以为独热编码处理,得到每个第二三维网格结构的网格点上的第二表面级别作用力参数。为了更好的说明本申请实施例,请一并参阅图7所示,可以获取第二三维网格结构32指示的网格点上的第二表面级别作用力集合,即静电力0.3、疏水力0.2和范德华力0.1,进而将该第二表面级别作用力集合进行独热编码处理,得到该指示的网格点上的第二表面级别作用力参数(0.3,0.2,0.1)。

请继续参阅步骤(3.2),可以确定在分子对接构象中第一三维网格结构和相应的对接的第二三维网格结构之间发生重叠的第一目标网格点,该第一目标网格点即代表第一目标三维构象和第二三维构象之间发生相互作用的参照点。该同一第一目标网格点可以有多个。以此,根据该第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行向量运算,得到每个第一目标网格点上的原子级别作用力参数,将同一分子对接构象中全部第一目标网格点上的原子级别作用力参数进行求和,得到同一分子对接构象的原子级别作用力参数,例如,请继续参阅图6所示,假设第一三维网格结构31指示的网格点与第二三维网格结构32指示的网格点重叠,可以将该重叠的网格点确定为第一目标网格点,获取该第一目标网格点上的第一原子级别作用力参数(0,0,1,0,0)和第二原子级别作用力参数(0.2,0.1,0.3,0.5,0.7)进行向量运算,可以得到该第一目标网格点上的原子级别作用力参数为0.3,说明第一三维网格结构31在第一目标网格点以第三原子的原子类型对第二网格结构32中的第二三维构象的原子作用力为0.3,以此类推,可以算出每个第一目标网格点上的原子级别作用力参数进行求和,得到同一分子对接构象的原子级别作用力参数,进而得到每个分子对接构象的原子级别作用力参数。

根据该第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行向量运算,将第一残基级别作用力参数和相应的第二残基级别作用力参数组合为(i,j),i表示为某个氨基酸残基类型,j表示为某个氨基酸残基类型,以此,继续参阅表1,可以确定(i,j)对应的残基级别作用力参数,例如i为丙氨基酸残基,j为精氨基酸残基,那么该残基级别作用力参数为1.07,将同一分子对接构象中全部第一目标网格点上的残基级别作用力参数进行求和,得到同一分子对接构象的残基级别作用力参数。

根据该第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行向量运算,得到每个第一目标网格点上的表面级别作用力参数,将同一分子对接构象中全部第一目标网格点上的表面级别作用力参数进行求和,得到同一分子对接构象的表面级别作用力参数,例如,请继续参阅图7所示,假设第一三维网格结构31指示的网格点与第二三维网格结构32指示的网格点重叠,可以将该重叠的网格点确定为第一目标网格点,获取该第一目标网格点上的第一表面级别作用力参数(0.2,0.1,0.3)和第二原子级别作用力参数(0.3,0.2,0.1)进行向量运算,可以得到该第一目标网格点上的表面级别作用力参数为0.11,说明第一三维网格结构31的第一目标三维构象与第二网格结构32中的第二三维构象的表面作用力为0.11,以此类推,可以算出每个第一目标网格点上的表面级别作用力参数进行求和,得到同一分子对接构象的表面级别作用力参数,进而得到每个分子对接构象的表面级别作用力参数。

在一些实施方式中,以最优化搜索的方式来获取每个旋转角下的候选分子对接构象,如下,即该将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象,包括:

(6.1)将该第一三维构象和该第二三维构象输入预训练后的构象预测模型,输出多个旋转角以及每个旋转角相应的偏移量;

(6.2)获取该第一三维构象在每个旋转角的作用下,得到的第二目标三维构象;

(6.3)将每个旋转角下的第二目标三维构象根据相应的偏移量与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象。

其中,该预训练后的构象预测模型可以为深度学习模型,为基于第一三维构象样本、第二三维构象样本以及得分训练得到,用于预测不同的三维构象对应准确的分子对接构象,即该预训练后的构象预测模型可以根据输入的第一三维构象和第二三维构象,输出预测的多个旋转角和每个旋转角相应的偏移量,该多个旋转角和每个旋转角相应的偏移量可以组成多个候选分子对接构象。

即控制将该第一三维构象在每个旋转角的作用下,得到相应的第二目标三维构象,并将该第二目标三维构象根据相应的偏移量直接与第二三维构象进行对接,直接生成每个旋转角下的候选分子对接构象。

在步骤203中,确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数。

其中,每个候选分子对接构象为每个旋转角下以最佳对接方式进行对接生成的分子对接构象,需要进一步选取出最好的候选分子对接构象。

不同的候选分子对接构象中由于不同的三维构象对接方式,相应的对接稳定性和对接位置也不同,因此,需要结合每个候选分子对接构象中不同三维构象之间形成的不同维度的相互作用力,对不同的候选分子对接构象进行多维度打分,来评估不同的候选分子对接构象的对接稳定性和对接位置,该相互作用力越大,即三维构象之间产生越大的化学反应,说明相应的候选分子对接构象的对接稳定性和对接位置越好。而相互作用力越小,即三维构象之间产生越小的化学反应,说明相应的候选分子对接构象的对接稳定性和对接位置越差。

由于每个候选分子对接构象为蛋白质分子对接构象,不同蛋白质分子结构在对接后,不同三维构象之间的原子之间会产生相互作用,形成原子级别作用力(本申请中通过原子级别作用力参数进行表征)。不同蛋白质分子结构在对接后,不同三维构象之间的氨基酸残基之间会产生相互作用,形成残基级别作用力(本申请中通过目标残基级别作用力参数进行表征)。不同蛋白质分子结构对接后,不同三维构象之间的表面上会产生相互作用,形成表面级别作用力(本申请中通过目标表面级别作用力参数进行表征)。

相关技术往往只是在表面级别作用力下进行评估,而蛋白质分子的相互作用还包括原子之间的相互作用以及氨基酸残基之间的三维作用力方式,因此,本申请实施例可以综合原子级别作用力、残基级别作用力和表面级别作用力一并对该候选分子对接构象进行评估,实现粗细粒度结合的评估方式,即本申请实施例可以从候选分子对接构象中不同的三维构象之间的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数一并进行考量,对该分子对接构象进行打分,实现更准确的候选分子对接构象打分效果。

在一些实施方式中,以全局搜索的方式来获取每个旋转角下的候选分子对接构象的方式下,由于每个分子对接构象的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数已经计算过,因此,可以直接获取每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数。

在一些实施方式中,以最优化搜索的方式来获取每个旋转角下的候选分子对接构象的方式下,该确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,可以包括:

(1)将每个旋转角下的候选分子对接构象中的第二目标三维构象进行网格化处理,得到每个旋转角下的第三三维网格结构,并将该第二三维构象进行网格化处理,得到第四三维网格结构;

(2)在每个第三三维网格结构的网格点上生成第三原子级别作用力参数、第三残基级别作用力参数和第三表面级别作用力参数,并在该第四三维网格结构的网格点上生成第四原子级别作用力参数、第四残基级别作用力参数和第四表面级别作用力参数;

(3)确定每个候选分子对接构象中第三三维网格结构和相应对接的该第四三维网格结构之间重叠的第二目标网格点;

(4)根据该第二目标网格点上的第三原子级别作用力参数和相应的第四原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;

(5)根据该第二目标网格点上的第三残基级别作用力参数和相应的第四残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;

(6)根据该第二目标网格点上的第三表面级别作用力参数和相应的第三表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数。

将每个旋转角下的候选分子对接构象中的第二目标三维构象进行网格化处理,得到每个旋转角下的第三三维网格结构,并将该第二三维构象进行网格化处理,得到第四三维网格结构,该网格化处理的过程在之前对第一目标三维构象和第二三维构象的网格化处理实施过程中已经进行详阐述,因此,本步骤具体实现方式请参考之前实施例实现。

在每个第三三维网格结构的网格点上生成第三原子级别作用力参数、第三残基级别作用力参数和第三表面级别作用力参数,并在该第四三维网格结构的网格点上生成第四原子级别作用力参数、第四残基级别作用力参数和第四表面级别作用力参数,该网格点上生成原子级别作用力参数、残基级别作用力参数和表面级别作用力参数的实施过程已在上述实施例中进行详细阐述,本步骤具体实现方式请参考之前实施例。

确定每个候选分子对接构象中第三三维网格结构和相应对接的该第四三维网格结构之间重叠的第二目标网格点,如何确定重叠的网格点的实施过程已在上述实施例中进行详细阐述,本步骤具体实现方式请参考之前实施例。

根据该第二目标网格点上的第三原子级别作用力参数和相应的第四原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;根据该第二目标网格点上的第三残基级别作用力参数和相应的第四残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;根据该第二目标网格点上的第三表面级别作用力参数和相应的第三表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数,如何确定分子对接构象中原子级别作用力参数、残基级别作用力参数和表面级别作用力参数的实施过程,已在上述实施例中进行详细阐述,具体实现方式请参考之前实施例。

在一些实施方式中,确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,包括:

(1.1)将每个旋转角下的候选分子对接构象中经过相应旋转角作用下的第一三维构象进行网格化处理,得到每个旋转角下的第五三维网格结构,并将该第二三维构象进行网格化处理,得到第六三维网格结构;

(1.2)在每个第五三维网格结构的网格点上生成第五原子级别作用力参数、第五残基级别作用力参数和第五表面级别作用力参数,并在该第六三维网格结构的网格点上生成第六原子级别作用力参数、第六残基级别作用力参数和第六表面级别作用力参数;

(1.3)确定每个候选分子对接构象中第五三维网格结构和相应对接的该第六三维网格结构之间重叠的第三目标网格点;

(1.4)根据该第三目标网格点上的第五原子级别作用力参数和相应的第六原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;

(1.5)根据该第三目标网格点上的第五残基级别作用力参数和相应的第六残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;

(1.6)根据该第三目标网格点上的第五表面级别作用力参数和相应的第六表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数。

其中,可以将每个旋转角下的候选分子对接构象中经过相应旋转角作用下的第一三维构象进行网格化处理,得到每个旋转角下的第五三维网格结构,并将该第二三维构象进行网格化处理,得到第六三维网格结构,该网格化处理的过程在之前对第一目标三维构象和第二三维构象的网格化处理实施过程中已经进行详阐述,因此,本步骤具体实现方式请参考之前实施例实现。。

在每个第五三维网格结构的网格点上生成第五原子级别作用力参数、第五残基级别作用力参数和第五表面级别作用力参数,并在该第六三维网格结构的网格点上生成第六原子级别作用力参数、第六残基级别作用力参数和第六表面级别作用力参数,该网格点上生成原子级别作用力参数、残基级别作用力参数和表面级别作用力参数的实施过程已在上述实施例中进行详细阐述,本步骤具体实现方式请参考之前实施例。

确定每个候选分子对接构象中第五三维网格结构和相应对接的该第六三维网格结构之间重叠的第三目标网格点,如何确定重叠的网格点的实施过程已在上述实施例中进行详细阐述本,本步骤具体实现方式请参考之前实施例。

根据该第三目标网格点上的第五原子级别作用力参数和相应的第六原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数。根据该第三目标网格点上的第五残基级别作用力参数和相应的第六残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数。根据该第三目标网格点上的第五表面级别作用力参数和相应的第六表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数,如何确定分子对接构象中原子级别作用力参数、残基级别作用力参数和表面级别作用力参数的实施过程,已在上述实施例中进行详细阐述,具体实现方式请参考之前实施例。

在步骤204中,根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数。

其中,可以将每个候选分子对接构象的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数进行统计求和,计算得到每个候选分子对接构象的目标作用力参数,该目标作用力参数从多个维度出发对每个候选分子对接构象进行打分,可以实现更准确的打分效果,该目标作用力参数越大,说明相应的候选分子对接构象的对接稳定性越好,对接的位置越准确,该目标作用力参数越小,说明相应的候选分子对接构象的对接稳定性越差,对接的位置越不准确。

在步骤205中,根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

其中,可以根据该目标作用力参数的大小从多个候选分子对接构象中确定出我们需要目标候选分子对接构象,例如,可以将目标作用力参数最大的候选分子对接构象作为目标候选分子对接构象,还可以按照目标作用力参数由大至小的顺序,从多个候选分子对接构象中确定预设数量的目标候选分子对接构象,该预设数量可以为任意设置的数量,例如为3或者5,以此,可以根据目标作用力参数由大至小的顺序,从多个候选分子对接构象中选取预设数量的目标候选分子对接构象,该目标候选分子对接构象为高分的分子对接构象,具有更稳定的对接结构,提升了分子对接构象预测的准确性,还可以根据目标候选分子快速确定准确的对接位置。请继续参阅图5所示,可以获取打分排序后的预设数量的目标候选分子对接构象进行显示。

由上述可知,本申请实施例通过获取第一分子的第一三维构象以及第二分子的第二三维构象;将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。以此,通过从目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数的多个维度上,综合对候选分子对接构象的对接稳定性进行预测,相对于相关技术中参照单一维度进行预测的方案,本申请实施例预测的目标候选分子对接构象的对接稳定性更好,因此极大的提升了分子对接构象预测的准确性。

结合上述实施例所描述的方法,以下将举例作进一步详细说明。

在本实施例中,将以该分子对接构象预测装置具体集成在服务器中为例进行说明。

本申请实施例提供的分子对接构象预测方法即可以根据二维图像的待训练图像样本进行分子对接构象预测,也可以根据三维图像的待训练图像样本进行分子对接构象预测。在本申请实施例中,将该待训练图像样本为医疗图像为例进行说明。

为了更好的说明本申请实施例,请一并参阅图8,图8为本申请实施例提供的分子对接构象预测方法的另一流程示意图。可以包括:

在步骤301中,服务器获取第一分子的第一三维构象以及第二分子的第二三维构象,通过不同旋转角对第一三维构象进行旋转处理,得到旋转处理后每个旋转角下相应的第一目标三维构象。

在本申请实施例中,该第一分子为抗体或者配体,该第二分子为抗原,请继续参阅图4所示,可以获取该第一分子的第一三维构象21以及获取该第二分子的第二三维构象22。

其中,该旋转角可以为三维空间上的所有可能转动的角度的集合,可以为(0°至360°,0°至360°,0°至180°),可以以10度作为旋转角变化步长进行全局搜索,则全局搜索次数为36乘36乘18次,也即具有36乘36乘18个旋转角。以此,可以通过上述不同旋转角对该第一三维构象分别进行旋转处理,得到旋转处理后每个旋转角下相应的第一目标三维构象。

在步骤302中,服务器将每个旋转角下相应的第一目标三维构象进行网格化处理,得到每个旋转角下相应的第一三维网格结构,并将第二三维构象进行网格化处理,得到第二三维网格结构。

请继续参阅图5所示,将某个旋转角下相应的第一目标三维构象进行网格化处理,得到该旋转角下相应的第一三维网格结构23,该第一三维网格结构23中包括第一目标三维构象,即通过该第一三维网格结构23实现对第一目标三维构象进行建模,以此类推,将每个旋转角下相应的第一目标三维构象进行网格化处理,得到每个旋转角下相应的第一三维网格结构。相应的,将该第二三维构象22进行网格化处理,得到第二三维网格结构24,该第二三维网格结构24中包括第二三维构象,即通过该第二三维网格结构24实现对第二三维构象22进行建模。

在步骤303中,服务器依次将每个旋转角下相应的第一三维网格结构平移遍历第二三维网格结构,得到每个旋转角下平移遍历生成的多个分子对接构象。

请继续参阅图5所示,第一三维网格结构23平移遍历第二三维网格结构24的过程中,每一次平移,该第一三维网格结构23会以不同的偏移量与该第二三维网格结构24结合,相应的,该第一三维网格结构23中的第一目标三维构象会和第二三维网格结构中的第二三维构象实现对接,以生成相应的分子对接构象,以此类推,通过平移遍历,可以得到该旋转角下的全部分子对接构象。

在步骤304中,服务器获取每个第一三维网格结构的网格点关联的原子的原子类型,根据原子类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一原子级别作用力参数。

请继续参阅图6所示,可以获取第一三维网格结构31指示的网格点关联的原子的原子类型,例如为第三原子的原子类型,然后根据该原子类型进行向量化处理,即可以对该原子类型进行独热编码,得到该指示的网格点的第一原子级别作用力参数(0,0,1,0,0),以此类推,得到每个第一三维网格结构的网格点上的第一原子级别作用力参数W1。

在步骤305中,服务器获取每个第一三维网格结构的网格点关联的氨基酸残基的第一残基类型,根据第一残基类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一残基级别作用力参数。

其中,获取每个第一三维网格结构的网格点上关联的氨基酸残基的第一残基类型,该关联的判定可以为距离该网格点的空间距离最小的氨基酸残基,并根据该第一残基类型进行向量化处理,该向量化处理也可以为独热编码处理,以此,得到每个第一三维网格结构的网格点上的第一残基级别作用力参数W3,该第一残基级别作用力参数代表该网格点所属的氨基酸残基的类型。

在步骤306中,服务器获取每个第一三维网格结构的网格点关联的第一表面级别作用力集合,根据第一表面级别作用力集合进行向量化处理,得到每个第一三维网格结构的网格点上的第一表面级别作用力参数。

请继续参阅图7所示,可以获取第一三维网格结构31指示的网格点上的第一表面级别作用力集合,即静电力0.2、疏水力0.1和范德华力0.3,进而将该第一表面级别作用力集合进行独热编码处理,得到该指示的网格点上的第一表面级别作用力参数(0.2,0.1,0.3),以此类推,得到每个第一三维网格结构的网格点上的第一表面级别作用力参数W5。

在步骤307中,服务器基于不同原子类型的原子对第二三维网格结构的网格点分别进行作用力测试,得到第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合。

请继续参阅图6所示,可以基于5种原子类型的原子对该第二三维网格结构32指示的网格点分别进行作用力测试,得到该第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合。

在步骤308中,服务器将原子级别作用力集合进行向量化处理,得到第二三维网格结构的网格点上的第二原子级别作用力参数。

请继续参阅图6所示,将该原子级别作用力集合进行向量化处理,该向量化处理可以为独热编码处理,得到该第二三维网格结构的网格点上的第二原子级别作用力参数,例如,请继续参阅图6所示,得到该第二三维网格结构32指示的网格点的第二原子级别作用力参数为(0.2,0.1,0.3,0.5,0.7),以此类推,可以得到第二三维网格结构的全部网格点上的第二原子级别作用力参数W2。

在步骤309中,服务器获取第二三维网格结构的网格点关联的氨基酸残基的第二残基类型,根据第二残基类型进行向量化处理,得到第二三维网格结构的网格点上的第二残基级别作用力参数。

其中,获取每个第二三维网格结构的网格点上关联的氨基酸残基的第二残基类型,该关联的判定可以为距离该网格点的空间距离最小的氨基酸残基,并根据该第二残基类型进行向量化处理,该向量化处理可以为独热编码处理,以此,得到该第二三维网格结构的网格点上的第二残基级别作用力参数W4,该第二残基级别作用力参数代表该网格点所属的氨基酸残基的类型。

在步骤310中,服务器获取第二三维网格结构的网格点关联的第二表面级别作用力集合,根据第二表面级别作用力集合进行向量化处理,得到第二三维网格结构的网格点上的第二表面级别作用力参数W5。

请继续参阅图7所示,可以获取第二三维网格结构32指示的网格点上的第二表面级别作用力集合,即静电力0.3、疏水力0.2和范德华力0.1,进而将该第二表面级别作用力集合进行独热编码处理,得到该指示的网格点上的第二表面级别作用力参数(0.3,0.2,0.1),以此类推,可以得到第二三维网格结构的全部网格点上的第二表面级别作用力参数。

在步骤311中,服务器确定每个分子对接构象中第一三维网格结构和相应对接的第二三维网格结构之间重叠的第一目标网格点。

可以确定在分子对接构象中第一三维网格结构和相应的对接的第二三维网格结构之间发生重叠的第一目标网格点,该第一目标网格点即代表第一目标三维构象和第二三维构象之间发生相互作用的参照点。该同一第一目标网格点可以有多个。

在步骤312中,服务器根据第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行计算,得到每个分子对接构象中的原子级别作用力参数。

请继续参阅图6所示,假设第一三维网格结构31指示的网格点与第二三维网格结构32指示的网格点重叠,可以将该重叠的网格点确定为第一目标网格点,获取该第一目标网格点上的第一原子级别作用力参数(0,0,1,0,0)和第二原子级别作用力参数(0.2,0.1,0.3,0.5,0.7)进行向量运算,可以得到该第一目标网格点上的原子级别作用力参数为0.3,说明第一三维网格结构31在第一目标网格点以第三原子的原子类型对第二网格结构32中的第二三维构象的原子作用力为0.3,以此类推,可以算出每个第一目标网格点上的原子级别作用力参数并进行求和,得到同一分子对接构象的原子级别作用力参数,进而得到每个分子对接构象的原子级别作用力参数。

在步骤313中,服务器根据第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行计算,得到每个分子对接构象中的残基级别作用力参数。

其中,根据该第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行向量运算,将第一残基级别作用力参数和相应的第二残基级别作用力参数组合为(i,j),i表示为某个氨基酸残基类型,j表示为某个氨基酸残基类型,以此,继续参阅表1,可以确定(i,j)对应的残基级别作用力参数,例如i为丙氨基酸残基,j为精氨基酸残基,那么该残基级别作用力参数为1.07,将同一分子对接构象中全部第一目标网格点上的残基级别作用力参数进行求和,得到同一分子对接构象的残基级别作用力参数。

在步骤314中,服务器根据第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行计算,得到每个分子对接构象中的表面级别作用力参数。

请继续参阅图7所示,假设第一三维网格结构31指示的网格点与第二三维网格结构32指示的网格点重叠,可以将该重叠的网格点确定为第一目标网格点,获取该第一目标网格点上的第一表面级别作用力参数(0.2,0.1,0.3)和第二原子级别作用力参数(0.3,0.2,0.1)进行向量运算,可以得到该第一目标网格点上的表面级别作用力参数为0.11,说明第一三维网格结构31的第一目标三维构象与第二网格结构32中的第二三维构象的表面作用力为0.11,以此类推,可以算出每个第一目标网格点上的表面级别作用力参数并进行求和,得到同一分子对接构象的表面级别作用力参数,进而得到每个分子对接构象的表面级别作用力参数。

在步骤315中,服务器根据原子级别作用力参数、残基级别作用力参数和表面级别作用力参数,计算得到每个分子对接构象的作用力参数,依次将每个旋转角下的多个分子对接构象的作用力参数进行对比,并将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象。

其中,将该原子级别作用力参数、残基级别作用力参数和表面级别作用力参数求和统计为作用力参数,该作用力参数可以从三个维度反应分子对接构象的对接稳定性进行打分,相对于相关技术中仅通过表面级作用力的维度进行打分的方案,可以更好保证预测的蛋白质对接构象的稳定性。

进一步的,可以依次将每个旋转角下的多个分子对接构象的作用力参数进行对比,找出每个旋转角下作用力参数最大的分子对接构象作为候选分子对接构象。

在步骤316中,服务器确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数。

其中,由于每个分子对接构象的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数已经计算过,因此,可以直接获取每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数。

将每个候选分子对接构象的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数进行统计求和,计算得到每个候选分子对接构象的目标作用力参数,该目标作用力参数从多个维度出发对每个候选分子对接构象进行打分,可以实现更准确的打分效果。

在步骤317中,服务器根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

其中,可以将目标作用力参数最大的候选分子对接构象作为目标候选分子对接构象,还可以按照目标作用力参数由大至小的顺序,从多个候选分子对接构象中确定预设数量的目标候选分子对接构象,该预设数量可以3个,因此,可以根据目标作用力参数由大至小的顺序,从多个候选分子对接构象中选取3个目标候选分子对接构象,该3个目标候选分子对接构象具有更稳定的蛋白质分子对接结构,以此,提升了蛋白质分子对接构象预测的准确性,该蛋白质分子对接结构中抗体(配体)和抗原之间的对接位置预测更准确。

以下,以实际的实验对比数据来说明本公开提供的方案相对于相关技术中方案对分子对接构象进行打分的差异,具体请参阅表2所示:

表2分子对接构象打分准确度示意表

表2为分子对接构象预测准确度示意表,该AUC就是衡量学习器优劣的一种性能指标。ACC为预测正确的样本数占总样本数的比例。可以看出的是,相对于对分子对接构象进行单维度的原子级别打分的方式,本申请实施例的多尺度(即多维度)打分的方式,对于分子对接构象的打分准确性有明显的上升,即可以明显增加预测的分子对接构象的准确性。

由上述可知,本申请实施例本申请实施例通过获取第一分子的第一三维构象以及第二分子的第二三维构象;将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。以此,通过从目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数的多个维度上,综合对候选分子对接构象的对接稳定性进行预测,相对于相关技术中参照单一维度进行预测的方案,本申请实施例预测的目标候选分子对接构象的对接稳定性更好,因此极大的提升了分子对接构象预测的准确性。

进一步的,本申请实施例还可以通过网格化处理实现分子对接构象的对接形式的遍历,以及后续目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数的计算,进一步的提升了分子对接构象预测的效率。

为便于更好的实施本申请实施例提供的分子对接构象预测方法,本申请实施例还提供一种基于上述分子对接构象预测方法的装置。其中名词的含义与上述分子对接构象预测方法中相同,具体实现细节可以参考方法实施例中的说明。

请参阅图9,图9为本申请实施例提供的分子对接构象预测装置的结构示意图,该分子对接构象预测装置应用于发送设备,其中该分子对接构象预测装置可以包括获取单元401、对接单元402、确定单元403、计算单元404及预测单元405等。

获取单元401,用于获取第一分子的第一三维构象以及第二分子的第二三维构象。

对接单元402,用于将该第一三维构象在不同旋转角的作用下分别与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象。

在一些实施方式中,该对接单元402,包括:

旋转子单元(未标识),用于通过不同旋转角对该第一三维构象进行旋转处理,得到旋转处理后每个旋转角下相应的第一目标三维构象;

遍历对接子单元(未标识),用于将每个旋转角下相应的第一目标三维构象分别与该第二三维构象进行遍历对接,得到每个旋转角下相应的多个分子对接构象;

确定子单元(未标识),用于将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象,该作用力参数由每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数生成。

在一些实施方式中,该遍历对接子单元(未标识),用于:

将每个旋转角下相应的第一目标三维构象进行网格化处理,得到每个旋转角下相应的第一三维网格结构,并将该第二三维构象进行网格化处理,得到第二三维网格结构;

依次将每个旋转角下相应的第一三维网格结构平移遍历该第二三维网格结构,得到每个旋转角下平移遍历生成的多个分子对接构象。

在一些实施例中,该确定子单元(未标识),包括:

确定子模块(未标识),确定每个分子对接构象中不同三维构象之间形成的原子级别作用力参数、残基级别作用力参数和表面级别作用力参数;

计算子模块(未标识),用于根据该原子级别作用力参数、残基级别作用力参数和表面级别作用力参数,计算得到每个分子对接构象的作用力参数;

对比子模块(未标识),用于依次将每个旋转角下的多个分子对接构象的作用力参数进行对比,并将每个旋转角下作用力参数最大的分子对接构象确定为候选分子对接构象。

在一些实施例中,该确定子模块(未标识),用于:

在每个第一三维网格结构的网格点上生成第一原子级别作用力参数、第一残基级别作用力参数和第一表面级别作用力参数,并在该第二三维网格结构的网格点上生成第二原子级别作用力参数、第二残基级别作用力参数和第二表面级别作用力参数;

确定每个分子对接构象中第一三维网格结构和相应对接的该第二三维网格结构之间重叠的第一目标网格点;

根据该第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行计算,得到每个分子对接构象中的原子级别作用力参数;

根据该第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行计算,得到每个分子对接构象中的残基级别作用力参数;

根据该第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行计算,得到每个分子对接构象中的表面级别作用力参数。

在一些实施例中,该确定子模块(未标识),还用于:

获取每个第一三维网格结构的网格点关联的原子的原子类型,根据该原子类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一原子级别作用力参数;

获取每个第一三维网格结构的网格点关联的氨基酸残基的第一残基类型,根据该第一残基类型进行向量化处理,得到每个第一三维网格结构的网格点上的第一残基级别作用力参数;

获取每个第一三维网格结构的网格点关联的第一表面级别作用力集合,根据该第一表面级别作用力集合进行向量化处理,得到每个第一三维网格结构的网格点上的第一表面级别作用力参数;

基于不同原子类型的原子对该第二三维网格结构的网格点分别进行作用力测试,得到该第二三维网格结构的网格点上对应不同原子类型的原子的原子级别作用力集合;

将该原子级别作用力集合进行向量化处理,得到该第二三维网格结构的网格点上的第二原子级别作用力参数;

获取该第二三维网格结构的网格点关联的氨基酸残基的第二残基类型,根据该第二残基类型进行向量化处理,得到该第二三维网格结构的网格点上的第二残基级别作用力参数;

获取该第二三维网格结构的网格点关联的第二表面级别作用力集合,根据该第二表面级别作用力集合进行向量化处理,得到该第二三维网格结构的网格点上的第二表面级别作用力参数;

确定每个分子对接构象中第一三维网格结构和相应对接的该第二三维网格结构之间重叠的第一目标网格点;

根据该第一目标网格点上的第一原子级别作用力参数和相应的第二原子级别作用力参数进行计算,得到每个分子对接构象中的原子级别作用力参数;

根据该第一目标网格点上的第一残基级别作用力参数和相应的第二残基级别作用力参数进行计算,得到每个分子对接构象中的残基级别作用力参数;

根据该第一目标网格点上的第一表面级别作用力参数和相应的第二表面级别作用力参数进行计算,得到每个分子对接构象中的表面级别作用力参数。

在一些实施例中,该对接单元402,用于:

将该第一三维构象和该第二三维构象输入预训练后的构象预测模型,输出多个旋转角以及每个旋转角相应的偏移量;

获取该第一三维构象在每个旋转角的作用下,得到的第二目标三维构象;

将每个旋转角下的第二目标三维构象根据相应的偏移量与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象。

确定单元403,用于确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数。

在一些实施例中,该确定单元403,用于:

将每个旋转角下的候选分子对接构象中的第二目标三维构象进行网格化处理,得到每个旋转角下的第三三维网格结构,并将该第二三维构象进行网格化处理,得到第四三维网格结构;

在每个第三三维网格结构的网格点上生成第三原子级别作用力参数、第三残基级别作用力参数和第三表面级别作用力参数,并在该第四三维网格结构的网格点上生成第四原子级别作用力参数、第四残基级别作用力参数和第四表面级别作用力参数;

确定每个候选分子对接构象中第三三维网格结构和相应对接的该第四三维网格结构之间重叠的第二目标网格点;

根据该第二目标网格点上的第三原子级别作用力参数和相应的第四原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;

根据该第二目标网格点上的第三残基级别作用力参数和相应的第四残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;

根据该第二目标网格点上的第三表面级别作用力参数和相应的第三表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数。

在一些实施例中,该确定单元403,用于:

将每个旋转角下的候选分子对接构象中经过相应旋转角作用下的第一三维构象进行网格化处理,得到每个旋转角下的第五三维网格结构,并将该第二三维构象进行网格化处理,得到第六三维网格结构;

在每个第五三维网格结构的网格点上生成第五原子级别作用力参数、第五残基级别作用力参数和第五表面级别作用力参数,并在该第六三维网格结构的网格点上生成第六原子级别作用力参数、第六残基级别作用力参数和第六表面级别作用力参数;

确定每个候选分子对接构象中第五三维网格结构和相应对接的该第六三维网格结构之间重叠的第三目标网格点;

根据该第三目标网格点上的第五原子级别作用力参数和相应的第六原子级别作用力参数进行计算,得到每个候选分子对接构象中的目标原子级别作用力参数;

根据该第三目标网格点上的第五残基级别作用力参数和相应的第六残基级别作用力参数进行计算,得到每个候选分子对接构象中的目标残基级别作用力参数;

根据该第三目标网格点上的第五表面级别作用力参数和相应的第六表面级别作用力参数进行计算,得到每个候选分子对接构象中的目标表面级别作用力参数。

计算单元404,用于根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数。

预测单元405,用于根据该目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

以上各个单元的具体实施可参见前面的实施例,在此不再赘述。

由上述可知,本申请实施例通过获取单元401获取第一分子的第一三维构象以及第二分子的第二三维构象;对接单元402将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定单元403确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;计算单元404根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;预测单元405根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。以此,通过从目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数的多个维度上,综合对候选分子对接构象的对接稳定性进行预测,相对于相关技术中参照单一维度进行预测的方案,本申请实施例预测的目标候选分子对接构象的对接稳定性更好,因此极大的提升了分子对接构象预测的准确性。

本申请实施例还提供一种计算机设备,如图10所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:

该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图10中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监测。可选的,处理器501可包括一个或多个处理核心;可选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、对象界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。

存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。

计算机设备还包括给各个部件供电的电源503,可选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与对象设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现前述实施例提供的各种方法步骤,如下:

获取第一分子的第一三维构象以及第二分子的第二三维构象;

将该第一三维构象在不同旋转角的作用下分别与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;

确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;

根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;

根据该目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对队列处理方法的详细描述,此处不再赘述。

由上述可知,本申请实施例的计算机设备可以通过获取第一分子的第一三维构象以及第二分子的第二三维构象;将第一三维构象在不同旋转角的作用下分别与第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;根据目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;根据目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。以此,通过从目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数的多个维度上,综合对候选分子对接构象的对接稳定性进行预测,相对于相关技术中参照单一维度进行预测的方案,本申请实施例预测的目标候选分子对接构象的对接稳定性更好,因此极大的提升了分子对接构象预测的准确性。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种分子对接构象预测方法中的步骤。例如,该指令可以执行如下步骤:

获取第一分子的第一三维构象以及第二分子的第二三维构象;

将该第一三维构象在不同旋转角的作用下分别与该第二三维构象进行对接,得到每个旋转角下的候选分子对接构象;

确定每个候选分子对接构象中不同三维构象之间形成的目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数;

根据该目标原子级别作用力参数、目标残基级别作用力参数和目标表面级别作用力参数,计算得到每个候选分子对接构象的目标作用力参数;

根据该目标作用力参数从多个候选分子对接构象中确定目标候选分子对接构象。

根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种分子对接构象预测方法中的步骤,因此,可以实现本申请实施例所提供的任一种分子对接构象预测方法中所能实现的有益效果,详见前面的实施例,在此不再赘述。

以上对本申请实施例所提供的一种分子对接构象预测方法、装置、存储介质及设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 消息化对接处理方法、装置、计算机设备及存储介质
  • 一种网络安全态势预测方法、装置、设备及存储介质
  • 客户稳定性的预测方法、装置、计算机设备和存储介质
  • 软件可靠性预测方法、装置、计算机设备和存储介质
  • 一种进馆档案数量预测方法、装置、电子设备及存储介质
  • 蛋白质构象预测方法、装置、电子设备及存储介质
  • 一种分子环构象的生成方法、装置、电子设备和存储介质
技术分类

06120116486938