掌桥专利:专业的专利平台
掌桥专利
首页

核酸分子溶液浓度推荐方法及装置、计算机设备

文献发布时间:2023-06-19 16:04:54



技术领域

本公开涉及生物技术领域,特别涉及一种核酸分子溶液浓度推荐方法及装置、计算机设备。

背景技术

核酸是细胞中的基本物质之一,确定核酸分子结构的性质有助于对于它们功能的研究。

在相关技术中,对于人体存在的部分基因缺陷,可以采用核酸作为靶向药物进行治疗。通常,在确定基因缺陷后,基于药物开发经验和化学物理常识设计出具有不同化学修饰的多种核酸分子构型,通过对这多种具有不同化学修饰的核酸分子构型进行临床实验,通过确定出效果最好的化学修饰和浓度,进而得到最终的核酸分子构型及其浓度。

但是,上述这种方式通过临床实验完成筛选,实验周期过长,费时费力。

发明内容

本公开实施例提供了一种核酸分子溶液浓度推荐方法及装置、计算机设备,能够提高确定核酸分子浓度的周期,减少耗时。所述技术方案如下:

本公开至少一实施例提供了一种核酸分子溶液浓度推荐方法,所述方法包括:

获取待推荐的多个核酸分子构型及其参数,所述待推荐的多个核酸分子构型是基于不同化学修饰方法针对同一基因疾病设计出的多个核酸分子构型,所述核酸分子构型的参数包括核酸分子化学修饰、在第一环境下所述核酸分子构型的稳定性、以及在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境;

将所述多个核酸分子构型及其参数输入到推荐模型中,获取所述推荐模型推荐的核酸分子构型及核酸分子溶液浓度,所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

可选地,所述方法还包括:

获取训练集,所述训练集包括多个训练样本,所述多个训练样本中的每个训练样本均包括针对同一基因疾病设计出的多个核酸分子构型及其参数;

利用所述多个训练样本训练所述推荐模型。

可选地,所述利用所述多个训练样本训练所述推荐模型,包括:

将所述训练样本输入到所述推荐模型中;

获取所述推荐模型输出的核酸分子构型及核酸分子溶液浓度;

采用已知的针对所述基因疾病的所述核酸分子构型及核酸分子溶液浓度作为反馈,对所述推荐模型的参数进行更新。

可选地,所述核酸分子构型的参数还包括:核酸分子构型对应的产线成本;

所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

可选地,所述方法包括:

确定核酸分子构型在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性。

可选地,所述确定核酸分子构型在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性,包括:

获取待测的核酸分子构型,所述待测的核酸分子构型在水溶液环境下的稳定性符合条件;

对所述待测的核酸分子构型进行物理学模拟试验,模拟所述待测的核酸分子构型在第一环境下的稳定性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境;

获取所述待测的核酸分子构型在所述第一环境下通过实验得到的不同浓度的核酸分子溶液的短期有效性和短期特异性;

根据所述待测的核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性,确定所述待测的核酸分子构型在第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性。

本公开至少一实施例提供了一种核酸分子溶液浓度推荐装置,所述装置包括:

获取模块,用于获取待推荐的多个核酸分子构型及其参数,所述待推荐的多个核酸分子构型是基于不同化学修饰方法针对同一基因疾病设计出的多个核酸分子构型,所述核酸分子构型的参数包括核酸分子化学修饰、在第一环境下所述核酸分子构型的稳定性、以及在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境;

推荐模块,用于将所述多个核酸分子构型及其参数输入到推荐模型中,获取所述推荐模型推荐的核酸分子构型及核酸分子溶液浓度,所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

可选地,所述核酸分子构型的参数还包括:核酸分子构型对应的产线成本;

所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

本公开至少一实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储有至少一条程序代码,所述程序代码由所述处理器加载并执行以实现如前所述的核酸分子溶液浓度推荐方法。

本公开至少一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如前任一项所述的核酸分子溶液浓度推荐方法。

本公开实施例提供的技术方案带来的有益效果是:

在本公开实施例中,通过采用推荐模型对核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,然后利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算不同核酸分子构型及浓度的推荐度,然后根据推荐度高低进行核酸分子溶液浓度进行推荐。该推荐模型可以根据核酸库中海量已知核酸分子数据训练得到,因此采用该推荐模型,能够保证推荐的准确性,而且无需再经过长时间的临床实验,缩短了确定核酸分子构型及浓度的周期,省时省力。

附图说明

为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种核酸分子溶液浓度推荐方法的流程图;

图2是本公开实施例提供的一种核酸分子溶液浓度推荐方法的流程图;

图3是本公开实施例提供的一种核酸分子结构性质确定方法的流程图;

图4是本公开实施例提供的一种核酸分子结构性质确定方法的流程图;

图5是本公开实施例提供的一种核酸分子结构筛选方法的流程图;

图6是本公开实施例提供的一种核酸分子结构筛选方法的流程图;

图7是本公开实施例提供的一种核酸分子溶液浓度推荐装置的结构示意图;

图8是本公开实施例提供的一种计算机设备的结构框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。

除非另作定义,此处使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开专利申请说明书以及权利要求书中使用的“第一”、“第二”、“第三”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现在“包括”或者“包含”前面的元件或者物件涵盖出现在“包括”或者“包含”后面列举的元件或者物件及其等同,并不排除其他元件或者物件。

图1是本公开实施例提供的一种核酸分子溶液浓度推荐方法的流程图。参见图1,该方法包括:

101:获取待推荐的多个核酸分子构型及其参数。

其中,所述待推荐的多个核酸分子构型是基于不同化学修饰方法针对同一基因疾病设计出的多个核酸分子构型,所述核酸分子构型的参数包括核酸分子化学修饰、在第一环境下所述核酸分子构型的稳定性、以及在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境。

其中,基于不同化学修饰方法针对同一基因疾病设计出的多个核酸分子构型是指,针对一段核酸碱基序列,基于不同化学修饰方法,为了达成对前述基因疾病有效的核酸分子药物特性而针对性设计出的多个核酸分子构型。

需要说明的是,如何针对基因疾病设计出多个核酸分子构型并非本公开内容,本公开是在已经设计出多个核酸分子构型的基础上进行进一步地筛选。这多个核酸分子构型的涉及可以由人工事先完成,例如,首先,生物信息专家基于基因疾病确定靶标位点(例如某一段有效的靶标基因),然后,针对确定出的靶标位点,选择核酸分子调节基因表达的策略(提高或降低),再次,进行分子偏向性设计,如偏向药物投递能力或药物富集或药物半衰期等其他性能来设计分子,最后,确定核酸分子的修饰策略,基于设计的需求/偏向性,选择合适的化学合成和修饰方法。通过设计多组,得到待推荐的多个核酸分子构型。

其中,化学修饰是指核酸分子的碱基、中间、五碳糖、两端、磷酸骨架等位置的修饰。修饰方法不同包括修饰位置不同、修饰方式不同等。

其中,稳定性是指在确定环境下,核酸分子的结构构型将不会或极小概率发生改变。这里的极小概率可以是指概率小于某一阈值,例如小于2%或1%等。

其中,有效性是指在某一特定目标下核酸分子构型作用于基因时的效果,例如,核酸分子构型作用于基因时降低脂肪的效果,或者,核酸分子构型作用于基因时提高蛋白的效果等,这里降低脂肪、提高蛋白均是前述特定目标。特异性是指在某一特定目标下核酸分子构型对于特定器官的组织富集度,以及针对特定器官的效果。因此,有效性和特异性就是针对特定器官,在某一特定目标下核酸分子构型作用于基因时的效果。

在本公开实施例中,核酸分子溶液的浓度可以采用多种方式表示,例如,质量百分浓度,也即是指采用核酸分子(核酸分子构型)作为溶质时,核酸分子的质量占整个溶液质量的比值。该溶液的溶剂通常是水、血液或生理盐水。

核酸分子溶液的浓度也可以是每单位溶液中溶质的质量,例如,指每100克的溶液中,溶质的质量。

核酸分子溶液的浓度还可以是按照体积计算的浓度等。

在推荐之前,可以预设多种浓度,例如按照固定差值设置多种质量百分浓度,例如20%、30%、40%、……70%等。

102:将所述多个核酸分子构型及其参数输入到推荐模型中,获取所述推荐模型推荐的核酸分子构型及核酸分子溶液浓度。

其中,所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

在本公开实施例中,通过采用推荐模型对核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,然后利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算不同核酸分子构型及浓度的推荐度,然后根据推荐度高低进行核酸分子溶液浓度进行推荐。该推荐模型可以根据核酸库中海量已知核酸分子数据训练得到,因此采用该推荐模型,能够保证推荐的准确性,而且无需再经过长时间的临床实验,缩短了确定核酸分子构型及浓度的周期,省时省力。

图2是本公开实施例提供的一种核酸分子溶液浓度推荐方法的流程图。参见图2,该方法包括:

201:获取训练集。

其中,所述训练集包括多个训练样本,所述多个训练样本中的每个训练样本均包括针对同一基因疾病设计出的多个核酸分子构型及其参数。

该训练集可以从核酸库中获取,该核酸库中包括已知的核酸分子构型及其参数,通过筛选出针对同一基因疾病设计出的多个核酸分子构型及其参数,形成上述样本。

202:利用所述多个训练样本训练所述推荐模型。

示例性地,所述利用所述多个训练样本训练所述推荐模型,包括:

将所述训练样本输入到所述推荐模型中;

获取所述推荐模型输出的核酸分子构型及核酸分子溶液浓度;

采用已知的针对所述基因疾病的所述核酸分子构型及核酸分子溶液浓度作为反馈,对所述推荐模型的参数进行更新。

在本公开实施例中,推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。因此,这里更新的可以是对核酸分子构型的稳定性、以及不同浓度下的长期有效性和长期特异性进行数值化的参数,和/或利用数值化后的核酸分子构型的稳定性、以及不同浓度下的长期有效性和长期特异性计算核酸分子构型的推荐度的参数。

通过已知的样本对推荐模型进行训练,最终得到稳定的推荐模型。

203:获取待推荐的多个核酸分子构型及其参数,所述待推荐的多个核酸分子构型是基于不同化学修饰方法针对同一基因疾病设计出的多个核酸分子构型,所述核酸分子构型的参数包括核酸分子化学修饰、在第一环境下所述核酸分子构型的稳定性、以及在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境。

其中,核酸分子构型在第一环境下所述核酸分子构型的稳定性、以及在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性可以采用图3或图4所示的方法流程得到。

204:将所述多个核酸分子构型及其参数输入到推荐模型中,获取所述推荐模型推荐的核酸分子构型及核酸分子溶液浓度。

可选地,所述核酸分子构型的参数还包括:核酸分子构型对应的产线成本;

所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

其中,核酸分子构型对应的产线成本可以由人工核算,然后输入到执行该方法的计算机设备中。

例如,核酸人员将核酸分子开发分为多个阶段,如分子设计和研发阶段、分子细胞实验设计和研发阶段、动物实验阶段、临床注册申报阶段、药厂/合成制造阶段等。然后,基于经验评估各个阶段每种核酸分子构型对应的成本,然后综合得出核酸分子构型对应的产线成本。

下面提供一种核酸分子结构性质确定方法,以确定出核酸分子构型的长期有效性和长期特异性。

图3是本公开实施例提供的一种核酸分子结构性质确定方法的流程图。参见图3,该方法包括:

301:获取待测的核酸分子构型,所述待测的核酸分子构型在水溶液环境下的稳定性符合条件。

在该步骤中所指的水溶液中,溶质是核酸分子(核酸分子构型),溶剂是水。

这里,待测的核酸分子构型可以有多个,这多个核酸分子构型是针对同一基因疾病设计出的多个核酸分子构型,例如,针对同一基因疾病设计出一核酸分子,再根据该核酸分子的核酸分子参数预测得到的。

其中,核酸分子参数包括:核酸分子序列、核酸分子序列的长度、核酸分子的化学修饰、以及基于量子力学和分子动力学的计算模拟得到的多个待筛选核酸分子构型及对应的能量和实验数据。

其中,核酸分子的序列是指核酸分子其碱基序列。序列的长度是指核酸分子碱基的数量或长度。基于量子力学和分子动力学的计算模拟得到的数据也可以称为计算物理学结果数据,计算物理学模拟计算核酸分子获得的核酸分子构型(主要包括构型坐标、分子尺寸)、能量大小等数据。实验数据包括实验环境、半衰期、退火温度、药物富集度、透膜能力、吸水率中的至少一项。

在上述参数中,基于量子力学和分子动力学的计算模拟得到的多个待筛选核酸分子构型及对应的能量可以通过量子力学和分子动力学模拟试验得到。实验数据通过对待筛选核酸分子构型进行生物分子实验和动物实验得到。核酸分子序列、核酸分子序列的长度、核酸分子的化学修饰为本申请所处理的核酸分子的基本参数。

其中,稳定性是指在确定环境下,核酸分子的结构构型将不会或极小概率发生改变。这里的极小概率可以是指概率小于某一阈值,例如小于2%或1%等。

这里,稳定性符合条件可以是指稳定性超过阈值,例如60%,或者稳定性在核酸分子的所有构型中排名满足条件,例如属于排名最高的5个。

302:对所述待测的核酸分子构型进行物理学模拟试验,模拟所述待测的核酸分子构型在第一环境下的稳定性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境。

这里,物理学模拟可以是量子力学模拟。量子力学实现基于从头算法(最原始的输入分子初始构型坐标),用密度泛函或者hartree-fock理论来求解薛定谔方程并获得这个体系的波函数,随着对能量的不断收敛和梯度下降从而找到能量收敛后的核酸分子构型。

示例性地,物理学模拟通过物理学模拟软件实现。上述计算物理学模拟软件包括但不限于VASP,Gaussian,GAMESS,NWchem,Q-chem,Spartan,openMM,Amber,NAMD,Lammps,Gromacs,CHARMM等。

303:获取所述待测的核酸分子构型在所述第一环境下通过实验得到的不同浓度的核酸分子溶液的短期有效性和短期特异性。

其中,有效性是指在某一特定目标下核酸分子构型作用于基因时的效果,例如,核酸分子构型作用于基因时降低脂肪的效果,或者,核酸分子构型作用于基因时提高蛋白的效果等,这里降低脂肪、提高蛋白均是前述特定目标。特异性是指在某一特定目标下核酸分子构型对于特定器官的组织富集度,以及针对特定器官的效果。因此,有效性和特异性就是针对特定器官,在某一特定目标下核酸分子构型作用于基因时的效果。

短期有效性和短期特异性,就是在一个较短的时间范围内,针对特定器官,在某一特定目标下核酸分子构型作用于基因时的效果。

示例性地,短期有效性和短期特异性通过实验获得,因此,短期有效性和短期特异性也属于步骤301中提到的实验数据。

可选地,在步骤304中确定核酸分子构型在第一环境下的长期有效性和长期特异性时,除了使用实验数据中的短期有效性和短期特异性,还可以使用实验数据中的其他数据,例如半衰期、退火温度和药物富集度等。

在步骤302和步骤303中,血浆环境、生理盐水环境的具体参数可以事先预设,比如浓度、体积等,本公开对具体参数不做限制。

这里,在实验时,可以对同一核酸分子构型的不同浓度的溶液的短期有效性和短期特异性进行实验。

304:根据所述待测的核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性,确定所述待测的核酸分子构型在第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性。

长期有效性和长期特异性,就是在一个较长的时间范围内,针对特定器官,在某一特定目标下核酸分子构型作用于基因时的效果。

在本公开实施例中,通过对稳定性满足条件的待测的核酸分子构型进行物理学模拟试验,确定出核酸分子构型在第一环境下的稳定性,然后根据这些核酸分子构型在第一环境下的稳定性以及在第一环境下的通过实验得到的短期有效性和短期特异性,确定核酸分子构型在第一环境下的长期有效性和长期特异性。由于实验数据是短期的,因此不会造成耗费时间长的问题。另外该方法结合了核酸分子构型在第一环境下的稳定性以及在第一环境下的通过实验得到的短期有效性和短期特异性,使得确定出的核酸分子构型在第一环境下的长期有效性和长期特异性的准确性有保障。

图4是本公开实施例提供的一种核酸分子结构筛选方法的流程图。参见图4,该方法包括:

400:训练有效性和特异性模型。

其中,有效性和特异性模型用于基于所述核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性,确定所述待测的核酸分子构型在第一环境下的长期有效性和长期特异性。

这里,第一环境下的短期有效性及短期特异性是指第一环境下第一浓度的核酸分子溶液的短期有效性及短期特异性,相应地,第一环境下的长期有效性和长期特异性是指第一环境下第一浓度的核酸分子溶液的长期有效性和长期特异性。

当输入的第一浓度不同,则确定出的长期有效性和长期特异性对应的浓度也不同。因此,该模型可以确定不同浓度的核酸分子溶液的长期有效性和长期特异性。后续描述中,如果没有强调浓度,则可以是指针对不同浓度的短期有效性和短期特异性、或长期有效性和长期特异性。

示例性地,训练有效性和特异性模型的方案如下:

基于所述核酸库获取训练集和测试集;

采用所述训练集和所述测试集训练所述有效性和特异性模型。

其中,训练集和测试集中的数据类型和有效性和特异性模型输入的数据的类型相同。

有效性和特异性模型可以实现从核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性,到核酸分子构型在第一环境下的长期有效性和长期特异性的映射。在训练集中,样本数据包括核酸分子构型在第一环境下的稳定性、短期有效性及短期特异性、长期有效性和长期特异性,将核酸分子构型在第一环境下的稳定性、短期有效性及短期特异性作为输入,模型将映射并输出预测的长期有效性和长期特异性,然后采用样本数据中真实的长期有效性和长期特异性作为反馈,对模型中的参数进行优化。

当然,该模型在设计时还可以采用更多的参数作为输入,例如还包括相似核酸分子结构的长期有效性和长期特异性,和/或核酸分子构型在第一环境下的其他实验数据。

401:获取待测的核酸分子构型,所述待测的核酸分子构型在水溶液环境下的稳定性符合条件。

这里在水溶液环境下的稳定性符合条件的待测的核酸分子构型可以采用图5和图6的方法流程进行筛选。

402:对所述待测的核酸分子构型进行物理学模拟试验,模拟所述待测的核酸分子构型在第一环境下的稳定性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境。

示例性地,当所述第一环境为所述生理盐水环境时,步骤402包括:

采用所述核酸分子构型在物理学模拟软件中进行水溶液环境下的物理学模拟试验,并在所述核酸分子构型所在的三维模型空间内添加盐离子,其中,添加在所述三维模型空间内的盐离子用于模拟所述生理盐水环境中的盐。

示例性地,在核酸分子构型所在的三维模型空间内添加盐离子的步骤包括:

根据需要模拟的生理盐水环境中盐离子浓度计算所需的盐离子摩尔数量;确定盐离子的参数;根据盐离子摩尔数量,在核酸分子构型所在的三维模型空间内,采取随机分布的方法确定盐离子的空间坐标分布;根据盐离子的参数以及盐离子的空间坐标分布,在核酸分子构型所在的三维模型空间内添加盐离子,以使得盐离子模型能够和核酸分子构型之间产生相互作用,模拟出生理盐水环境中的核酸分子构型。

其中,确定盐离子的参数包括盐离子的电荷数,例如Na离子带1个正电荷,Cl离子带1个负电荷。

其中,确定出盐离子摩尔数量后,根据生理盐水浓度和盐离子摩尔数量计算出盐离子数,然后按照盐离子数进行空间坐标分布的确定。

其中,三维模型空间是物理学模拟软件中模拟的核酸分子构型所在的三维模型空间。

在三维模型空间内添加盐离子,可以在物理学模拟软件中指定添加的离子的电荷数,以及分布的空间坐标实现。例如,指定Na

盐离子与核酸分子在同一三维模型空间内产生电磁相互作用,从而影响核酸分子构型,获得核酸分子在生理盐水中的构型。

示例性地,当所述第一环境为所述血浆环境或所述生理盐水环境时,步骤402包括:

采用所述核酸分子构型在物理学模拟软件中进行水溶液环境下的物理学模拟试验,并在试验过程中加入用于模拟所述血浆环境或所述生理盐水环境的相互作用势能,所述相互作用势能是所述核酸分子构型与所述血浆环境中的血液或者所述生理盐水环境中的盐离子的相互作用势能。

由于目前的物理学模拟软件模拟的是水溶液环境或真空环境下的物理学实验,因此,对于第一环境下的模拟,需要通过添加盐离子或者相互作用能修正的方式实现。

示例性地,加入相互作用势能的步骤包括:

对盐离子或血浆在溶液环境下所产生的能量大小或者能量密度分布进行建模;确定核酸分子与盐离子或血浆相互作用的方式,该相互作用的方式可以采用一种能量函数的形式表达,如电荷的库伦相互作用势能的形式;根据该相互作用的方式,对所述的核酸分子与盐离子或血浆的相互作用势能进行计算;将计算出的相互作用势能添加到计算物理学模拟软件的能量计算步骤当中去,进行能量修正。

其中,对盐离子或血浆在溶液环境下所产生的能量大小或者能量密度分布进行建模,得到的模型包括如下物理信息,通过这些物理信息来表征盐离子或血浆在溶液环境下所产生的能量大小或者能量密度分布,物理信息包括电子数、净电荷数、空间坐标等。该建模过程采用Visual Molecular Dynamics(VMD),Discovery studio,Spartan等软件实现。

在建模之后,根据建模得到的模型,对核酸分子和该模型之间的相互作用势能的表达式进行假设,并在假设基础上确定出真实的相互作用势能表达式。经典的相互作用势能表达式可以是:库仑相互作用势能表达式或万有引力相互作用势能表达式。盐离子或血浆溶液对核酸分子的相互作用势能一般情况下都满足一种经典相互作用势能表达式。除上述表达式外,在分子动力学理论中,还有大量的溶液建模形式定义相互作用表达式,例如长程电磁相互作用(库伦相互作用)和短程的范德华力相互作用等,本公开实施例对此不做赘述。

在确定出相互作用势能表达式后,将已知的核酸分子与盐离子或血浆的相关参数代入表达式中,即可计算出相互作用势能。

在该步骤中,可以不考虑核酸分子在溶液中的浓度,也可以按照要确定的长期有效性和长期特异性时核酸分子溶液的浓度来设置,核酸分子在生理盐水或血浆中的浓度。

403:获取所述待测的核酸分子构型在所述第一环境下通过实验得到的短期有效性和短期特异性。

这里的实验是指在第一环境下对待测的核酸分子构型进行实验。

404:将所述核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性输入有效性和特异性模型。

示例性地,在输入前,对所述核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性进行数值化和归一化,将数值化和归一化后的核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性输入到模型中。

可选地,该方法还包括:

在核酸库中搜索所述待测的核酸分子构型中每个核酸分子构型的相似核酸分子结构;

获取所述相似核酸分子结构的长期有效性和长期特异性。

其中,核酸库是指存储已知核酸分子结构数据的数据库,包括核酸分子构型、稳定性、以及核酸分子的各种实验数据。

示例性地,搜索相似核酸分子结构采用相似核酸分子搜索模型实现。

示例性地,步骤404包括:

将所述核酸分子构型在第一环境下的稳定性、所述第一环境下的短期有效性及短期特异性和所述相似核酸分子结构的长期有效性和长期特异性输入有效性和特异性模型,所述有效性和特异性模型用于基于所述核酸分子构型在第一环境下的稳定性、所述第一环境下的短期有效性及短期特异性和所述相似核酸分子结构的长期有效性和长期特异性,确定所述待测的核酸分子构型在第一环境下的长期有效性和长期特异性。

在这种实现方式中,使用相似核酸分子结构的长期有效性和长期特异性作为输入参数作为确定核酸分子构型在第一环境下的长期有效性和长期特异性的参数,能够进一步地提高确定出的核酸分子构型在第一环境下的长期有效性和长期特异性的准确性。

405:获取所述有效性和特异性模型确定出的所述待测的核酸分子构型在第一环境下的长期有效性和长期特异性。

可选地,该方法还包括:计算长期有效性和长期特异性得分,例如将核酸分子构型的稳定性、长期有效性和长期特异性转化为评分,然后进行加权,得到加权得分。采用加权得分评价核酸分子构型的性质。

下面提供一种核酸分子结构筛选方法,以从核酸分子参数确定出步骤301中待测的核酸分子构型。

图5是本公开实施例提供的一种核酸分子结构筛选方法的流程图。参见图5,该方法包括:

501:获取核酸分子参数。

502:在核酸库中搜索所述多个待筛选核酸分子构型中每个核酸分子构型的相似核酸分子结构。

503:基于所述相似核酸分子结构的稳定性、所述多个待筛选核酸分子构型对应的能量和实验数据,进行所述多个待筛选核酸分子构型概率分布计算。

在从核酸库中搜索出相似核酸分子结构后,还可以从核酸库中获取相似核酸分子结构的稳定性,基于相似核酸分子结构的稳定性来进行待筛选核酸分子构型稳定性概率的计算。

其中,多个待筛选核酸分子构型概率分布计算是指计算多个待筛选核酸分子构型的稳定性概率。稳定性概率是指待筛选核酸分子构型不会发生改变的概率,稳定性概率越高,则稳定性越好。

504:根据所述多个待筛选核酸分子构型概率分布,筛选所述多个待筛选核酸分子构型中稳定性符合条件的多个核酸分子构型。

图6是本公开实施例提供的一种核酸分子结构筛选方法的流程图。参见图6,该方法包括:

600:训练相似核酸分子搜索模型和核酸分子构型概率分布计算模型。

其中,相似核酸分子搜索模型用于分别确定所述核酸分子序列和所述核酸库中的各个核酸分子序列的第一相似度、确定所述核酸分子序列的长度和所述核酸库中的各个核酸分子序列的长度的差值、确定所述核酸分子的化学修饰和所述核酸库中的各个核酸分子序列的化学修饰的第二相似度,从所述核酸库中选出所述第一相似度、所述差值和所述第二相似度均满足阈值要求的核酸分子,依次确定选出的核酸分子的构型和所述多个待筛选核酸分子构型的距离,基于所述距离得到所述每个核酸分子构型的相似核酸分子结构。

核酸分子构型概率分布计算模型用于通过对同一所述核酸分子构型的能量、相似核酸分子结构的稳定性和所述核酸分子构型的实验数据的归一化数值进行计算,通过所述计算得到所述每个核酸分子构型的稳定性概率;其中,所述计算过程如下:将所述核酸分子构型的能量、相似核酸分子结构的稳定性和所述核酸分子构型的实验数据的归一化数值组成一个数组,利于训练得到的稳定性概率算法对所述数组进行求解,得到所述每个核酸分子构型的稳定性概率。

示例性地,训练相似核酸分子搜索模型的方案如下:

基于所述核酸库获取第一训练集和第一测试集;

采用所述第一训练集和所述第一测试集训练所述相似核酸分子搜索模型。

其中,训练集和测试集中的数据类型和相似核酸分子搜索模型输入的数据的类型相同。

相似核酸分子搜索模型可以实现第一相似度、差值、第二相似度和距离的计算,第一相似度、差值、第二相似度和距离可以按照一定权重计算两个核酸分子构型的相似度。其中,第一相似度和第二相似度的计算公式可以利用成熟的相似度算法实现。初始时,计算第一相似度的公式中的参数、计算第二相似度的公式中的参数以及计算距离的公式中的参数、以及计算两个核酸分子构型的相似度时的权重都是初始值。在样本集中事先对相似的核酸分子构型进行标注,训练过程中根据标注判断相似核酸分子搜索模型输出的和输入的是否为相似构型,从而实现对上述参数及权重的反馈优化。通过不断反馈优化,完成相似核酸分子搜索模型的训练。当然,在上述过程中,也可以不做样本集的标注,通过人力来判断相似核酸分子搜索模型输出的和输入的是否为相似构型。

同样地,核酸分子构型概率分布计算模型也采用类似的方式训练,比如:

基于所述核酸库获取第二训练集和第二测试集;

采用所述第二训练集和所述第二测试集训练所述核酸分子构型概率分布计算模型。

其中,训练集和测试集中的数据类型和核酸分子构型概率分布计算模型输入的数据的类型相同。

核酸分子构型概率分布计算模型采用稳定性概率算法,对核酸分子构型的能量、相似核酸分子结构的稳定性和核酸分子构型的实验数据进行计算,得到稳定性概率。该稳定性概率算法可以是将能量、相似核酸分子结构的稳定性、实验数据等参数的归一化数值进行加权求和。初始时,稳定性概率算法中的参数(也即加权的权重)为初始值,通过训练对稳定性概率算法中的参数进行调节,从而使得通过该模型计算出的稳定性概率更加准确。

训练时,将所述核酸分子构型的能量、相似核酸分子结构的稳定性和所述核酸分子构型的实验数据的归一化数值组成一个数组,将该数组作为输入值输入到核酸分子构型概率分布计算模型中。根据核酸分子构型概率分布计算模型输出的稳定性概率和该核酸分子构型的实际稳定性,对稳定性概率算法的参数进行反馈调整,从而实现对上述模型参数进行优化。通过不断反馈迭代,完成核酸分子构型概率分布计算模型的训练。

示例性地,有效性和特异性模型、相似核酸分子搜索模型和核酸分子构型概率分布计算模型采用神经网络、决策树、支持向量机,其中,神经网络可以是深度神经网络。

601:获取核酸分子参数。

其中,核酸分子参数包括:核酸分子序列、核酸分子序列的长度、核酸分子的化学修饰、以及基于量子力学和分子动力学的计算模拟得到的多个待筛选核酸分子构型及对应的能量和实验数据。

在本公开实施例中,基于量子力学和分子动力学的计算模拟是指通过计算物理学模拟软件进行核酸分子构型预测,在预测过程中利用软件模拟核酸分子构型的物理试验,通过量子力学和分子动力学确定各个核酸分子构型的能量分布。

602:将所述核酸分子序列、核酸分子序列的长度、核酸分子的化学修饰和多个待筛选核酸分子构型输入相似核酸分子搜索模型。

这里,在输入上述参数时,将对这些参数进行特征化,转换成相似核酸分子搜索模型容易识别和处理的格式,例如对这些参数进行数值化和归一化,然后输入到相似核酸分子搜索模型中。

603:获取所述相似核酸分子搜索模型从核酸库中搜索到的所述多个待筛选核酸分子构型中每个核酸分子构型的相似核酸分子结构。

通过相似核酸分子搜索模型确定出和每个核酸分子构型相似的核酸分子结构,从而为确定每个核酸分子构型的稳定性做准备。

604:将所述相似核酸分子结构的稳定性、所述多个待筛选核酸分子构型对应的能量和实验数据输入核酸分子构型概率分布计算模型。

同样地,在输入上述参数时,可以对这些参数进行特征化,转换成核酸分子构型概率分布计算模型容易识别和处理的格式,例如对这些参数进行数值化和归一化,然后输入到核酸分子构型概率分布计算模型中。

也即,该方法还包括:

对所述核酸分子的实验数据进行数据清理和补全;

对清理和补全后的所述核酸分子的实验数据进行归一化,并对非数值实验数据进行数值化和归一化。

其中,待筛选核酸分子构型的实验数据是指针对具有待筛选核酸分子构型的核酸分子进行实验得到的数据,实验数据包括生物分子实验和动物实验的数据,所述生物分子实验和动物实验的数据包括实验环境、半衰期、退火温度、药物富集度、透膜能力、吸水率中的至少一项。

其中,生物分子实验可以是聚合酶链式反应(Polymerase Chain Reaction,PCR)试验,质谱试验,电镜结构解析试验和细胞试验,动物实验可以是老鼠、猴子试验等。实验环境可以是水,生理盐水,血浆等。

605:获取所述核酸分子构型概率分布计算模型计算出的所述多个待筛选核酸分子构型概率分布,所述多个待筛选核酸分子构型概率分布包括所述每个核酸分子构型的稳定性概率。

606:根据所述多个待筛选核酸分子构型概率分布,筛选所述多个待筛选核酸分子构型中稳定性符合条件的多个核酸分子构型。

图7是本公开实施例提供的一种核酸分子溶液浓度推荐装置的结构示意图。参见图7,该装置包括:获取模块701和推荐模块702。

其中,获取模块701,用于获取待推荐的多个核酸分子构型及其参数,所述待推荐的多个核酸分子构型是基于不同化学修饰方法针对同一基因疾病设计出的多个核酸分子构型,所述核酸分子构型的参数包括核酸分子化学修饰、在第一环境下所述核酸分子构型的稳定性、以及在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境;

推荐模块702,用于将所述多个核酸分子构型及其参数输入到推荐模型中,获取所述推荐模型推荐的核酸分子构型及核酸分子溶液浓度,所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、以及所述不同浓度的核酸分子溶液的长期有效性和长期特异性计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

可选地,所述核酸分子构型的参数还包括:核酸分子构型对应的产线成本;

所述推荐模型用于将所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本进行数值化,利用数值化后的所述核酸分子化学修饰、所述核酸分子构型的稳定性、所述不同浓度的核酸分子溶液的长期有效性和长期特异性、以及所述核酸分子构型对应的产线成本计算核酸分子构型的推荐度,基于所述推荐度选择核酸分子构型及核酸分子溶液浓度进行推荐。

可选地,该装置还包括训练模块703,用于获取训练集,所述训练集包括多个训练样本,所述多个训练样本中的每个训练样本均包括针对同一基因疾病设计出的多个核酸分子构型及其参数;利用所述多个训练样本训练所述推荐模型。

可选地,训练模块703,用于将所述训练样本输入到所述推荐模型中;获取所述推荐模型输出的核酸分子构型及核酸分子溶液浓度;采用已知的针对所述基因疾病的所述核酸分子构型及核酸分子溶液浓度作为反馈,对所述推荐模型的参数进行更新。

可选地,该装置还包括确定模块704,用于确定核酸分子构型在所述第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性。

可选地,确定模块704,用于获取待测的核酸分子构型,所述待测的核酸分子构型在水溶液环境下的稳定性符合条件;对所述待测的核酸分子构型进行物理学模拟试验,模拟所述待测的核酸分子构型在第一环境下的稳定性,所述第一环境包括如下至少一种:血浆环境、生理盐水环境;获取所述待测的核酸分子构型在所述第一环境下通过实验得到的不同浓度的核酸分子溶液的短期有效性和短期特异性;根据所述待测的核酸分子构型在第一环境下的稳定性和所述第一环境下的短期有效性及短期特异性,确定所述待测的核酸分子构型在第一环境下不同浓度的核酸分子溶液的长期有效性和长期特异性。

需要说明的是:上述实施例提供的核酸分子溶液浓度推荐装置在确定核酸分子结构性质时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的核酸分子溶液浓度推荐装置与核酸分子溶液浓度推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图8是本公开实施例提供的一种计算机设备的结构框图。通常,计算机设备包括有:处理器801和存储器802。

处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。

存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的核酸分子溶液浓度推荐方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本公开的可选实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

技术分类

06120114691776