掌桥专利:专业的专利平台
掌桥专利
首页

生成活性肽段的方法、装置、设备及存储介质

文献发布时间:2023-06-19 16:04:54



技术领域

本申请属于生物医药领域,尤其涉及生成活性肽段的方法、装置、设备及存储介质。

背景技术

近年来,许多生物活性肽针对多种复杂疾病,展现出了有效的治疗效果,例如抗病毒、抗细菌以及抗癌症等活性肽。且目前已有多种肽类药物获批上市用于治疗多种疾病,例如,糖尿病、癌症、骨质疏松症、多发性硬化症、人类免疫缺陷病毒(HIV)感染以及慢性疼痛等,均取得了有效成果。因此,对活性肽的研究非常有必要。

现有技术中,主要通过随机突变现有肽的方式,来寻找新的活性肽,然后在突变后的现有肽中寻找新的活性肽段。这种方法过于盲目,无法直接生成有特定活性的肽段,且肽段的多样性不足。

发明内容

有鉴于此,本申请实施例提供了生成活性肽段的方法、装置、设备及存储介质,以解决现有技术中无法直接生成有特定活性的肽段,且肽段的多样性不足的问题。

本申请实施例的第一方面提供了一种生成活性肽段的方法,该方法包括:

获取特定活性对应的肽段生成模型,肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的,通用肽数据集包括多个通用肽段;

利用肽段生成模型生成多个具有特定活性的肽段。

上述方案中,肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的,其在训练过程中可以学习到通用肽段中的潜在特征,和已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

可选地,所述利用所述肽段生成模型生成多个具有所述特定活性的肽段之后,所述方法还包括:

对多个所述肽段进行聚类分析,并根据分析结果生成肽段集,所述肽段集中的各个肽段之间的相似度小于预设相似度。

本实施方式中,对多个肽段进行聚类分析,根据分析结果移除相似度高的肽段,使剩余的各个肽段之间的相似度小于预设相似度,可以理解为剩余的各个肽段各不相同,从而丰富了肽段的多样性。

可选地,所述方法还包括:

获取全新肽段库,所述全新肽段库包括不同的所述特定活性各自对应的多个肽段;

在所述全新肽段库中确定作用于特地靶点的目标肽段。

本实施方式中,由于全新肽段库中包含的肽段是大量具有不同特定活性的肽段,已经明确了每个肽段的活性,不用再花费时间去验证每个肽段的活性,在此基础上可以快速查找到可作用于特定靶点的目标肽段。相比于现有技术中在随机肽段中查找可作用于特定靶点的肽段,本实施方式提升了查找速率,耗费时间短,节省了大量资源,降低了经济成本。

可选地,所述在所述全新肽段库中确定作用于特地靶点的目标肽段,包括:

构建所述全新肽段库中每个肽段对应的3D结构模型;

基于每个所述3D结构模型和所述特定靶点进行蛋白对接,得到对接结果;

基于所述对接结果进行分子动力学模拟,得到各个所述3D结构模型对应的结合自由能;

根据各个所述结合自由能,确定所述目标肽段。

本实施方式中,通过3D建模、蛋白对接、分子动力学模拟等处理,在全新肽段库中确定出目标肽段。一方面,全新肽段库中的肽段是筛选过的,极大的缩小了确定作用于特定靶点的目标肽段的候选范围,提高了准确度;另一方面,全新肽段库中的肽段都是已知其对应的特定活性,明确了每个肽段的作用机制,提升了确定目标肽段的准确度和效率。有利于后续对筛选出的目标肽段进一步研究,大大的节省了研究成本。

可选地,所述获取特定活性对应的肽段生成模型之前,所述方法还包括:

利用所述通用肽数据集对所述LSTM网络训练,得到通用模型;

利用所述活性肽数据集和预设的损失函数对所述通用模型进行微调,得到所述肽段生成模型。

本实施方式中,先利用通用肽数据集对LSTM网络训练,得到通用模,再通过某个特定活性的活性肽数据集对通用模型进行微调,得到该特定活性的肽段生成模型。由于是在通用模型的基础上进行微调,大大地提升了训练肽段生成模型的速度。且利用已知活性肽段作为训练集,使肽段生成模型在训练过程中学习到了已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

且为每种特定活性训练其对应的肽段生成模型,有利于根据每种特定活性对应的肽段生成模型,生成精准的含有该特种活性的全新的肽段。

可选地,所述活性肽数据集包括多个样本肽段,所述利用所述活性肽数据集和预设的损失函数对所述通用模型进行微调,得到所述肽段生成模型,包括:

获取每个所述样本肽段对应的目标矩阵;

将每个所述目标矩阵输入到所述通用模型中处理,得到每个所述目标矩阵对应的样本活性肽段;

基于所述损失函数计算每个所述样本活性肽段和每个所述样本活性肽段对应的样本肽段之间的损失值;

当检测到所述损失值大于预设阈值时,调整训练中的通用模型的模型参数,并利用所述活性肽数据集继续训练所述训练中的通用模型;

当检测到所述损失值小于或等于所述预设阈值时,停止训练所述训练中的通用模型,并将训练后的通用模型确定为所述肽段生成模型。

本实施方式中,在通用模型的基础上进行微调,得到训练好的肽段生成模型,大大地提升了训练肽段生成模型的速度。且利用已知活性肽段作为训练集,使肽段生成模型在训练过程中学习到了已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

本申请实施例的第二方面提供了一种生成活性肽段的装置,包括:

获取单元,用于获取特定活性对应的肽段生成模型,所述肽段生成模型是利用通用肽数据集和预设的与所述特定活性对应的活性肽数据集对LSTM网络进行训练得到的,所述通用肽数据集包括多个通用肽段;

生成单元,用于利用所述肽段生成模型生成多个具有所述特定活性的肽段。

本申请实施例的第三方面提供了一种生成活性肽段的设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面所述的生成活性肽段的方法的步骤。

本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的生成活性肽段的方法的步骤。

本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在生成活性肽段的设备上运行时,使得该生成活性肽段的设备执行上述第一方面所述的生成活性肽段的方法的步骤。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一示例性实施例提供的生成活性肽段的方法的示意性流程图;

图2是本申请示出的不同特定活性对应的肽段数据示意图;

图3是本申请示出的不同特定活性对应肽段的长度示意图;

图4是本申请另一示例性实施例示出的一种生成活性肽段的方法的示意性流程图;

图5是本申请再一示例性实施例示出的一种生成活性肽段的方法的示意性流程图;

图6是本申请示出的肽段不同3D结构模型的示意图;

图7是本申请一示例性实施例示出的训练肽段生成模型的方法的具体流程图;

图8是本申请一示例性实施例示出的通用模型的模型结构示意图;

图9是本申请一实施例提供的一种生成活性肽段的装置的示意图;

图10是本申请另一实施例提供的生成活性肽段的设备的示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

生物活性肽(Bioactive Peptides,BAP)是蛋白质中20种天然氨基酸以不同组成和排列方式构成的从二肽到复杂的线性、环形结构的不同肽类的总称,是源于蛋白质的多功能化合物。

近年来,许多生物活性肽针对多种复杂疾病,展现出了有效的治疗效果,例如抗病毒、抗细菌以及抗癌症等活性肽。且目前已有多种肽类药物获批上市用于治疗多种疾病,例如,糖尿病、癌症、骨质疏松症、多发性硬化症、HIV感染以及慢性疼痛等,均取得了有效成果。

相对于化合物来说,肽更容易合成、成本更低,因此,为了促进肽类药物的发展,对活性肽的研究非常有必要。

现有技术中,肽的生成主要依靠随机突变现有肽实现,然后在突变后的现有肽中寻找新的活性肽段。这种方式没有运用已知的活性肽数据,只是进行盲目的随机突变,无法学习已知活性肽数据中的潜在活性肽规律,也就没法自动生成有特定活性的肽段,且这种随机突变的方式无法保证肽段的多样性。

有鉴于此,本申请实施例提供了一种生成活性肽段的方法,先获取特定活性对应的肽段生成模型,再利用肽段生成模型生成多个具有特定活性的肽段。由于该肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的,其在训练过程中可以学习到通用肽段中的潜在特征,和已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

请参见图1,图1是本申请一示例性实施例提供的生成活性肽段的方法的示意性流程图。本申请提供的生成活性肽段的方法的执行主体为生成活性肽段的设备,其中,该设备包括但不限于车载电脑、平板电脑、计算机、个人数字助理(Personal Digital Assistant,PDA)、等设备,还可以包括各种类型的服务器。例如,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务。

如图1所示的生成活性肽段的方法可包括:S101~S102,具体如下:

S101:获取特定活性对应的肽段生成模型。

特定活性又称指定活性。本实施例中特定活性用于表示用户指定的活性。例如,用户指定某种活性为特定活性,便于后续根据该特定活性,生成具有该特定活性的肽段。

该活性可以包括抗真菌(Antifungal)、抗细菌(Antibacterial)、抗生物膜(Antibiofilm)、抗癌(Anticancer)、抗糖尿病(Anti-diabetic)、抗艾滋病毒(AntiHIV)、抗疟疾(Antimalarial)、耐甲氧西林金黄色葡萄球菌(Anti-MRSA)、抗氧化剂(Antioxidant)、抗寄生虫(Anti_parasite)、抗结合杆菌(Anti_TB)、抗毒素(Anti-toxin)、抗病毒(Antiviral)、杀虫(Insecticidal)、离子通道结合(Ion_channel)、蛋白酶抑制剂(Protease inhibitors)、杀精剂(Spermicidal)、表面固定剂(Surface_immobilized)、伤口愈合(Wound_healing)等多种活性。

示例性地,特定活性的数量可以为一个或多个。也就是说,用户可以根据实际需求,指定上述活性中的任意一个或多个为特定活性。

例如,用户根据实际需求指定抗真菌这一活性为特定活性。具体地,当需要具有抗真菌这一活性的肽段时,用户指定抗真菌这一活性为特定活性,便于后续根据抗真菌这一特定活性,生成多个具有抗真菌这种活性的肽段。

又例如,用户根据实际需求指定抗HIV病毒和抑制蛋白酶分别为特定活性。具体地,当需要具有抗HIV病毒和抑制蛋白酶这两种活性的肽段时,用户指定抗HIV病毒这一活性为特定活性,便于后续根据抗HIV病毒这一特定活性,生成多个具有抗HIV病毒这种活性的肽段。

同时,用户可指定抑制蛋白酶这一活性为特定活性,便于后续根据抑制蛋白酶这一特定活性,生成多个具有抑制蛋白酶这种活性的肽段。

再例如,用户根据实际需求指定上述每种活性分别为特定活性,后续依据每种特定活性生成各自对应的多个具有特定活性的肽段。此处仅为示例性说明,对此不做限定。

不同的特定活性对应不同的肽段生成模型。例如,特定活性为抗真菌,其对应的肽段生成模型可以为抗真菌肽段生成模型;特定活性为抗病毒,其对应的肽段生成模型可以为抗病毒肽段生成模型。此处仅为示例性说明,对此不做限定。

在本实施例中,肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的。其中,通用肽数据集包括多个通用肽段。长短期记忆(Long Short-Term Memory,LSTM)网络是一种特殊的循环神经网络(Recurrent NeuralNetworks,RNN),可以学习长期依赖信息。由于LSTM网络的网络结构能够控制哪些信息通过隐藏状态传递到下一个节点,重要信息可以不变地通过连续的节点,通过这种方式有效学习到通用肽段中的潜在特征和已知活性肽段中的潜在活性规律。

预先根据不同的特定活性,训练不同的肽段生成模型,训练好的每个肽段生成模型对应一种特定活性。可将训练好的不同的肽段生成模型,存储在生成活性肽段的设备的数据库中,或者存储在其他设备中。

当确定特定活性后,在本设备的数据库中查找与该特定活性对应的肽段生成模型。或者,当确定特定活性后,向其他设备发送查询指令,该查询指令用于在其他设备中查找与该特定活性对应的肽段生成模型,其他设备将查找到的肽段生成模型发送至本设备,本设备接收该肽段生成模型。

S102:利用肽段生成模型生成多个具有特定活性的肽段。

例如,当肽段生成模型为抗毒素肽段生成模型时,利用抗毒素肽段生成模型生成的多个肽段均具有抗毒素这一特定活性;当肽段生成模型为抗寄生虫肽段生成模型时,利用抗寄生虫肽段生成模型生成的多个肽段均具有抗寄生虫这一特定活性。此处仅为示例性说明,对此不做限定。

由于肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的,因此,训练好的肽段生成模型的网络结构与LSTM网络的网络结构基本一致。即肽段生成模型可以包括两层LSTM网络和一层全连接层(如密集层Dense),并使用Softmax函数作为输出节点的激活函数(即最终的数据通过Softmax函数输出)。

示例性地,肽段生成模型在启动时可生成多个随机的氨基酸序列,将这些氨基酸序列作为肽段生成模型的输入。具体输入至第一层LSTM网络中进行处理,针对每个氨基酸序列,第一层LSTM网络根据该氨基酸序列生长出多个氨基酸序列,将输入的氨基酸序列和生长出的多个氨基酸序列作为第一层LSTM网络的输出结果,并输入至第二层LSTM网络中处理。

第二层LSTM网络的处理过程与第一层LSTM网络的处理过程类似,此处不再赘述。第二层LSTM网络将处理结果输入到密集层中,密集层对第二层LSTM网络输入的内容进行矩阵运算,并通过Softmax函数分类后输出肽段的下一个氨基酸,随着氨基酸序列的延长,最终输出指定长度的序列。

值得说明的是,生成的多个具有特定活性的肽段中,每个肽段的长度可以相同也可以不相同。可预先设置终止符号,在肽段生成的过程中,初次检测到终止符号时,将该终止符号之前的所有氨基酸序列作为最终的肽段输出;或去除终止符号,并将去除终止符号后的部分输出。

例如,设置序列中的Z为终止符号,设置肽段的指定长度为50。

在肽段生成的过程中,检测到终止符号Z时,去除终止符号Z,在去除终止符号Z之后的部分中截取指定长度内的不同肽段序列并输出。

例如,肽段生成模型在启动时以符号U作为起始序列,一个批次的起始U形成了一列UUU…UUU,肽段生成模型根据起始一列UUU…UUU生成以下肽段:

UNCYNGFFCCRPCNKPGCCNTGCCGYNCGAGKCVVLKZZZZZZZZZZZZZZZ

UYLFGGISSVLGKVVGHLVSHIVPHIVPHIVKLZZZZZZZZZZZZZZZZZZZ

UDTERCSSCCGKNCVLYATCASTMCSSDYKLGLAGHVGQGIGVSVFIPKNPZ

UIGGIVLTCLGTMLGGVLKKVFQKVKEAYRNZZZZZZZZZZZZZZZZZZZZZZ

URIGAKVCYCKCTFCVGVCTNNGPCCYTDVVCGLCKNZZZZZZZZZZZZZZZZ

UGLGATVRSVLGSVAPHVLPHVVPVIAEHLZZZZZZZZZZZZZZZZZZZZZZZ

此处仅为示例性说明,实际使用过程中,氨基酸序列远多于此,相应地,生成的肽段的数量也远多于此。具体地,可自行设定每个肽段生成模型生成肽段的数量,例如,设定生成5000、50000个肽段等,对此不做限定。

上述实现方式中,先获取特定活性对应的肽段生成模型,再利用肽段生成模型生成多个具有特定活性的肽段。由于该肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的,其在训练过程中可以学习到通用肽段中的潜在特征,和已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

示例性地,请参见图2,图2是本申请示出的不同特定活性对应的肽段数据示意图。即图2中所展示的为,不同特定活性对应的肽段生成模型,分别生成的多个具有各个特定活性的肽段的数量。

如图2所示,横轴表示抗真菌(Antifungal)、抗生物膜(Antibiofilm)、抗癌(Anticancer)、抗糖尿病(Anti-diabetic)、抗艾滋病毒(AntiHIV)、抗细菌(Antibacterial)、耐甲氧西林金黄色葡萄球菌(Anti-MRSA)、抗氧化剂(Antioxidant)、抗寄生虫(Anti_parasite)、抗结合杆菌(Anti_TB)、抗毒素(Anti-toxin)、抗病毒(Antiviral)、杀虫(Insecticidal)、离子通道结合(Ion_channel)、蛋白酶抑制剂(Protease inhibitors)、杀精剂(Spermicidal)、表面固定剂(Surface_immobilized)、伤口愈合(Wound_healing)等特定活性。纵轴表示各个特定活性对应的肽段的数量。

由图2可以明显看出,通过不同的特定活性对应的肽段生成模型,生成了各个特定活性对应的大量的肽段,为肽段的多样性提供了保障。

示例性地,请参见图3,图3是本申请示出的不同特定活性对应肽段的长度示意图。

如图3所示,横轴表示抗真菌(Antifungal)、抗生物膜(Antibiofilm)、抗艾滋病毒(AntiHIV)、抗细菌(Antibacterial)、抗氧化剂(Antioxidant)、抗寄生虫(Anti_parasite)、抗结合杆菌(Anti_TB)、抗毒素(Anti-toxin)、抗病毒(Antiviral)、杀虫(Insecticidal)、离子通道结合(Ion_channel)、蛋白酶抑制剂(Proteaseinhibitors)、杀精剂(Spermicidal)、表面固定剂(Surface_immobilized)、伤口愈合(Wound_healing)、抗癌(Anticancer)、抗糖尿病(Anti-diabetic)、耐甲氧西林金黄色葡萄球菌(Anti-MRSA)等特定活性。纵轴表示各个特定活性对应的肽段的长度的均值,每个长条柱上黑色的细线表示各个特定活性对应的肽段的长度的标准差。

由图3的数据可以得知,不同特定活性对应肽段的长度,符合这些特定活性本应该对应的肽段的长度,即图3中各个特定活性对应肽段的长度的均值,与训练集(预设的与特定活性对应的活性肽数据集)中的各个肽段的长度的均值类似,充分说明了通过肽段生成模型生成的各个特定活性对应的肽段的长度的合理性。

请参见图4,图4是本申请另一示例性实施例示出的一种生成活性肽段的方法的示意性流程图;如图4所示的生成活性肽段的方法可包括:S201~S203,其中,S201、S202与图1对应的实施例中的S101、S102完全相同,具体参考图1对应的实施例中的S101、S102的描述,S203具体如下:

S203:对多个肽段进行聚类分析,并根据分析结果生成肽段集。

肽段集中的各个肽段之间的相似度小于预设相似度。

每个肽段包括多个氨基酸序列,两个肽段之间的相似度指的是两个肽段包含的氨基酸序列之间的相似度。预设相似度可由用户根据实际情况进行设置,例如,预设相似度可以设置为90%、80%、60%、45%等,此处仅为示例性说明,对此不做限定。

采用聚类算法对某个特定活性对应的多个肽段进行聚类分析,得到分析结果。该分析结果包括多个群体,每个群体中的各个肽段之间的相似度大于或等于预设相似度。

例如,采用K-means算法、层次聚类方法(Hierarchical Clustering)等方法对某个特定活性对应的多个肽段进行聚类分析,将这些肽段中相似的肽段聚合,得到多个群体。具体的聚类分析过程可参考现有技术,此处不再赘述。

保留每个群体中的一个肽段,将其余肽段移除,根据保留下来的肽段生成肽段集。由于已经移除了大多相似的肽段,使得肽段集中的各个肽段之间的相似度小于预设相似度。

本实施方式中,对多个肽段进行聚类分析,根据分析结果移除相似度高的肽段,使剩余的各个肽段之间的相似度小于预设相似度,可以理解为剩余的各个肽段各不相同,从而丰富了肽段的多样性。

可选地,在一种可能的实现方式中,对于某个特定活性对应的肽段生成模型生成的多个肽段,可先删除多个肽段中完全重复的肽段,和/或,删除多个肽段中与训练该肽段生成模型时用到的活性肽数据集中完全重复的肽段。然后对删除完全重复的肽段后剩余的肽段进行聚类分析,并根据分析结果生成肽段集。

本实施方式中,先删除多个肽段中的完全重复的肽段,即过滤掉了多个肽段中冗余肽段,有助于提升聚类分析的效率,后续在去重冗余肽段的基础上进行聚类分析,根据分析结果移除相似度高的肽段,使剩余的各个肽段之间的相似度小于预设相似度,可以理解为剩余的各个肽段各不相同,从而丰富了肽段的多样性。

为了进一步体现肽段的多样性,请参见表1。

表1是不同的特定活性对应的用于微调训练的活性肽数据集中的肽段数量、经过去冗余后剩余的肽段数量以及去除百分之60相似度的肽段后得到非相似肽段数量。

表1

从表1可以明显看出,用于微调训练的活性肽数据集中的肽段数量较少,而去冗余后剩余的肽段数量以及去除百分之60相似度的肽段后得到非相似肽段数量都很多,证明通过本申请提供的方法生成的肽段的多样性非常丰富。

请参见图5,图5是本申请再一示例性实施例示出的一种生成活性肽段的方法的示意性流程图;如图5所示的生成活性肽段的方法可包括:S301~S304,其中,S301、S302与图1对应的实施例中的S101、S102完全相同,具体参考图1对应的实施例中的S101、S102的描述,S303~S304具体如下:

S303:获取全新肽段库。

全新肽段库包括不同的特定活性各自对应的多个肽段。

在S101、S102中,根据不同特定活性对应的肽段生成模型,生成了各个特定活性对应的多个肽段,将这些肽段全部收集起来存储到数据库中,得到全新肽段库。

可选地,为了提升后续在全新肽段库中确定作用于特地靶点的目标肽段的速度,也可在S203后获取每个特定活性对应的肽段集,将各个肽段集中的肽段收集起来存储到数据库中,得到全新肽段库。

由于在生成肽段集时已经移除了高度相似的肽段,基于该肽段集构建全新肽段库,少了高度相似的肽段的干扰,在后续去顶目标肽段时,大大地提升了速度。

S304:在全新肽段库中确定作用于特地靶点的目标肽段。

靶点,医学上进行某些放射治疗时,放射线从不同方位照射,汇集病变部位,这个病变部位叫做靶点。特定靶点即指定的靶点。例如,特定靶点可以为指定的XX病毒。

特地靶点的数量可以为一个或多个。也就是说,用户可以根据实际需求,指定一个或多个为特定靶点。

可通过对全新肽段库中的每个肽段进行3D建模、蛋白对接、分子动力学模拟、分子模拟等处理,在全新肽段库中确定作用于特地靶点的目标肽段。针对某个特定靶点,在全新肽段库中确定的作用于该特定靶点的目标肽段的数量以实际情况为准,可以是一个也可以是多个。

本实施方式中,由于全新肽段库中包含的肽段是大量具有不同特定活性的肽段,已经明确了每个肽段的活性,不用再花费时间去验证每个肽段的活性,在此基础上可以快速查找到可作用于特定靶点的目标肽段。相比于现有技术中在随机肽段中查找可作用于特定靶点的肽段,本实施方式提升了查找速率,耗费时间短,节省了大量资源,降低了经济成本。

可选地,在本申请一些可能的实现方式中,上述S304可以包括S3041~S3044,具体如下:

S3041:构建全新肽段库中每个肽段对应的3D结构模型。

示例性地,可利用建模工具对全新肽段库中的每个肽段进行3D建模,得到每个肽段的3D结构模型。其中,建模工具可以采用trRosetta、Alphafold2等。

例如,预先安装建模工具trRosetta,将全新肽段库中的各个肽段输入到建模工具中处理,输出每个肽段对应的3D结构模型。具体的建模过程请参考现有技术,此处不再赘述。由于trRosetta利用了丰富的结构数据,输出的每个肽段的3D结构模型具有多样性。

为了进一步体现肽段的3D结构模型的多样性,以具有抗病毒活性的肽段为例进行说明。请参见图6,图6是本申请示出的肽段不同3D结构模型的示意图。

如图6所示,对抗病毒活性的肽段进行3D建模,得到了多个不同的3D结构模型,充分体现了通过肽段生成模型生成的肽段,其对应的3D结构模型具有多样性。可以理解的是,图中仅为展示,实际3D结构模型的类型远多于此。

S3042:基于每个3D结构模型和特定靶点进行蛋白对接,得到对接结果。

蛋白对接是用于验证3D结构模型和特定靶点是否能够产生相互作用的一个操作。蛋白对接可以包括刚性对接和柔性对接。

将每个肽段对应的3D结构模型与特定靶点进行刚性对接,得到刚性对接结果;该刚性对接结果用于为柔性对接提供一个起始复合物构象。基于刚性对接结果进行柔性对接,得到每个肽段的3D结构模型对应的复合物模型。

例如,可通过刚性对接软件(如zdock)实现每个3D结构模型与特定靶点的刚性对接。具体地,特定靶点上设置有对接口袋,在zdock中设置对接口袋的参数。例如将该对接口袋定义为配体周围1纳米的氨基酸。然后将刚性对接对象(每个3D结构模型与特定靶点)上传至zdock中,zdock分别对每个3D结构模型与特定靶点进行刚性对接,并输出每个3D结构模型与特定靶点的刚性对接结果。可以理解为通过zdock为每个肽段和特定靶点的结合构建了一个比较合理的起始结构。

之后,通过柔性对接软件(如rosetta)实现柔性对接。具体地,将刚性对接结果输入到rosetta,rosetta进行小规模的扰动即可找到合适的结合模式,从而输出每个肽段对应的3D结构模型的复合物模型。

S3043:基于对接结果进行分子动力学模拟,得到各个3D结构模型对应的结合自由能。

对每个复合物模型进行分子动力学模拟,得到模拟结果;再通过元动力(metadynamics)模型对该模拟结果进行元动力模拟,输出各个肽段的3D结构模型对应的自由能曲面。通过自由能曲面计算每个肽段对应的结合自由能。具体的计算方法可参考现有技术,此处不再赘述。

S3044:根据各个结合自由能,确定目标肽段。

将各个肽段的3D结构模型对应的结合自由能换算为亲和力,根据各个肽段的3D结构模型对应的亲和力确定目标肽段。亲和力越大,表示该肽段与特定靶点越容易发生反应;亲和力越小,表示该肽段与特定靶点越不发生反应。

具体地,可在网络中获取换算软件,将各个结合自由能输入换算软件中,换算软件输出每个结合自由能对应的亲和力。

根据亲和力的大小对各个肽段进行排序,在排序结果中确定目标肽段。例如,按照亲和力从大到小的顺序,对多个肽段排序,选取排序最前的肽段,将其确定为目标肽段。

又例如,按照亲和力从小到大的顺序,对多个肽段排序,选取排序最后的肽段,将其确定为目标肽段。此处仅为示例性说明,对此不做限定。

本实施方式中,通过3D建模、蛋白对接、分子动力学模拟、分子模拟等处理,在全新肽段库中确定出目标肽段。一方面,全新肽段库中的肽段是筛选过的,极大的缩小了确定作用于特定靶点的目标肽段的候选范围,提高了准确度;另一方面,全新肽段库中的肽段都是已知其对应的特定活性,明确了每个肽段的作用机制,提升了确定目标肽段的准确度和效率。有利于后续对筛选出的目标肽段进一步研究,大大的节省了研究成本。

请参见图7,图7是本申请一示例性实施例示出的训练肽段生成模型的方法的具体流程图;可选地,在本申请一些可能的实现方式中,在执行如图1所示的方法之前,还可包括训练肽段生成模型的方法,训练肽段生成模型的方法可包括:S401~S402,具体如下:

S401:利用通用肽数据集对LSTM网络训练,得到通用模型。

通用肽数据集中包括多个通用肽段。

从肽数据库(如peptideatlas数据库)中获取大量肽,提取获取到的肽对应的肽段。为了提升训练通用模型的效率和准确度,可删除这些肽段中重复的肽段和/或包含非标准氨基酸的肽段,基于删除后剩余的大量(如3,274,675个)肽段生成通用肽数据集。

通用模型是以LSTM网络为基础模型训练得到的,因此通用模型的网络结构与LSTM网络的网络结构类似。即通用模型可以包括两层LSTM网络和一层全连接层(如密集层Dense),并使用Softmax函数作为输出节点的激活函数(即最终的数据通过Softmax函数输出)。

其中,第一层LSTM网络和第二层LSTM网络中都包含节点,每个节点用于输入或输出学习到的肽段中的潜在特征。节点的数量可由用户根据实际情况进行设置,例如本实施方式中,第一层LSTM网络包含256个节点,第二层LSTM网络也包含256个节点。

为了有效缓解肽段生成模型的过拟合问题,为第一层LSTM网络和第二层LSTM网络设置了正则网络(Dropout)。没有添加Dropout的网络层需要对网络中每一个节点都进行学习,而添加了Dropout之后的网络层只需要对该网络层中没有被Mask掉的节点进行训练。

Dropout对应的值可由用户根据实际情况进行设置,例如本实施方式中,第一层LSTM网络中的Dropout对应的值可设置为0.5,第二层LSTM网络中的Dropout对应的值可设置为0.3。

训练通用模型采用的损失函数可以为多分类损失函数(categorical_crossentropy)loss1。迭代次数(epoch)可由用户根据实际情况进行设置,例如本实施方式中,迭代次数可设置为22。

在实际训练过程中,先转换每个通用肽段,得到每个通用肽段对应的矩阵,矩阵中氨基酸以one-hot的形式表示。将每个矩阵输入到LSTM网络中处理,LSTM网络输出每个矩阵对应的活性肽段。

通过多分类损失函数loss1计算LSTM网络对应的损失值,该LSTM网络对应的损失值为,通用肽段和该通用肽段对应的活性肽段之间的损失值。

具体地,在生成该通用肽段对应的活性肽段时,通过依次生成氨基酸序列的方式生成。训练中的LSTM网络会预测下一个氨基酸序列,通过多分类损失函数计算当前实际生成的氨基酸序列和预测的氨基酸序列之间的损失值,得到每个氨基酸序列对应的损失值,将各个氨基酸序列对应的损失值叠加,得到通用肽段和该通用肽段对应的活性肽段之间的损失值。

当检测到该损失值大于预设损失阈值时,判定当前正在训练中的LSTM网络还未达到要求。此时,调整训练中的LSTM网络的网络参数(如权重值),并利用通用肽数据集继续训练该训练中的LSTM网络。

当检测到损失值小于或等于预设损失阈值时,判定当前正在训练中的LSTM网络达到要求。此时,固定LSTM网络中的网络参数,将固定网络参数后的LSTM网络确定为训练好的通用模型。

该通用模型可用于生成全新的活性肽段,为后续利用该通用模型训练肽段生成模型提供了基础。

为了便于理解,结合附图说明训练通用模型的过程。请参见图8,图8是本申请一示例性实施例示出的通用模型的模型结构示意图。

图8中的氨基酸1、氨基酸2以及氨基酸3对应3个通用肽段。针对任意一个通用肽段,将该通用肽段对应的氨基酸序列(如氨基酸1)输入至第一层LSTM网络中进行处理,针对每个氨基酸序列,第一层LSTM网络学习该氨基酸序列中的潜在特征,并将学习到的潜在特征传递至第二层LSTM网络,第二层LSTM网络进一步学习深层的潜在特征,并将处理结果输入到密集层中,密集层对第二层LSTM网络输入的内容进行矩阵运算,并通过Softmax函数分类后输出生成的肽序列(如氨基酸X、氨基酸Y、氨基酸Z),即输出通用肽段对应的活性肽段。

其中,第一层LSTM网络和第二层LSTM网络各包含256个节点。第一层LSTM网络中的Dropout对应的值可设置为0.5,第二层LSTM网络中的Dropout对应的值可设置为0.3。

S402:利用活性肽数据集和预设的损失函数对通用模型进行微调,得到肽段生成模型。

不同的特定活性对应不同的活性肽数据集,每个活性肽数据集中包括多个具有同一种特定活性的样本肽段,进而可以根据每个活性肽数据集对通用模型进行微调,得到该特定活性对应的肽段生成模型。

从活性肽数据库(如Antimicrobial Peptide Database数据库)获取大量已知活性的肽。该数据库中的肽以不同的活性分类为多个肽数据集,例如抗真菌(Antifungal)肽数据集、抗细菌(Antibacterial)肽数据集、抗生物膜(Antibiofilm)肽数据集、抗癌(Anticancer)肽数据集、抗糖尿病(Anti-diabetic)肽数据集、抗艾滋病毒(AntiHIV)肽数据集、抗疟疾(Antimalarial)肽数据集、耐甲氧西林金黄色葡萄球菌(Anti-MRSA)肽数据集、抗氧化剂(Antioxidant)肽数据集、抗寄生虫(Anti_parasite)肽数据集、抗结合杆菌(Anti_TB)肽数据集、抗毒素(Anti-toxin)肽数据集、抗病毒(Antiviral)肽数据集、杀虫(Insecticidal)肽数据集、离子通道结合(Ion_channel)肽数据集、蛋白酶抑制剂(Protease inhibitors)肽数据集、杀精剂(Spermicidal)肽数据集、表面固定剂(Surface_immobilized)肽数据集、伤口愈合(Wound_healing)肽数据集等。

需要训练某种特定活性的肽段生成模型时,在活性肽数据库中获取与该特定活性对应的肽数据集,提取该肽数据集中每个肽对应的样本肽段。

肽段生成模型是以通用模型为基础训练得到的,因此肽段生成模型的网络结构与LSTM网络的网络结构类似。即肽段生成模型可以包括两层LSTM网络和一层全连接层(如密集层Dense),并使用Softmax函数作为输出节点的激活函数(即最终的数据通过Softmax函数输出)。

通过活性肽数据集对通用模型训练,以得到肽段生成模型的过程,与通过通用肽数据集对LSTM网络训练,以得到通用模型的过程类似,可参考S401中的描述。

通过上述方法利用每种特定活性对应的活性肽数据集,对通用模型微调,可得到多个不同特定活性的肽段生成模型,每个肽段生成模型都可用于生成多个具有其对应的特定活性的肽段。

本实施方式中,先利用通用肽数据集对LSTM网络训练,得到通用模,再通过某个特定活性的活性肽数据集对通用模型进行微调,得到该特定活性的肽段生成模型。由于是在通用模型的基础上进行微调,大大地提升了训练肽段生成模型的速度。且利用已知活性肽段作为训练集,使肽段生成模型在训练过程中学习到了已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

且为每种特定活性训练其对应的肽段生成模型,有利于根据每种特定活性对应的肽段生成模型,生成精准的含有该特种活性的全新的肽段。

可选地,在本申请一些可能的实现方式中,上述S402可以包括S4021~S4044,具体如下:

S4021:获取每个样本肽段对应的目标矩阵。

转换每个样本肽段,得到每个样本肽段对应的目标矩阵。每个样本肽段包含若干个氨基酸构成,转换后的目标矩阵中氨基酸以one-hot的形式表示。

S4022:将每个目标矩阵输入到通用模型中处理,得到每个目标矩阵对应的样本活性肽段。

通用模型对目标矩阵的具体处理过程,与LSTM网络对通用肽段对应的矩阵的处理过程相同,具体请参考S401中的描述,此处不再赘述。

S4023:基于损失函数计算样本活性肽段和样本活性肽段对应的样本肽段之间的损失值。

训练肽段生成模型用到的损失函数与训练通用模型时用到的损失函数相同,训练肽段生成模型用到的损失函数也可以为多分类损失函数(categorical_crossentropy)loss2。

具体地,在生成该样本肽段对应的样本活性肽段时,通过依次生成氨基酸序列的方式生成。训练中的通用模型会预测下一个氨基酸序列,通过多分类损失函数loss2计算当前实际生成的氨基酸序列和预测的氨基酸序列之间的损失值,得到每个氨基酸序列对应的损失值,将各个氨基酸序列对应的损失值叠加,得到样本肽段和该样本肽段对应的样本活性肽段之间的损失值。

比较该损失值与预设阈值之间的大小。当损失值大于预设阈值时,执行S4024;当损失值小于或等于预设阈值时,执行S4025。

S4024:当检测到损失值大于预设阈值时,调整训练中的通用模型的模型参数,并利用活性肽数据集继续训练该训练中的通用模型。

当检测到损失值大于预设阈值时,判定当前正在训练中的通用模型还未达到要求。此时,调整训练中的通用模型的模型参数(如权重值),并利用活性肽数据集继续训练该训练中的通用模型。即返回执行S4021~S4043,直至在S4024中检测到损失值小于或等于预设阈值时,执行S4025。

S4025:当检测到损失值小于或等于预设阈值时,停止训练该训练中的通用模型,并将训练后的通用模型确定为肽段生成模型。

当检测到损失值小于或等于预设阈值时,判定当前正在训练中的通用模型达到要求。此时,固定通用模型中的模型参数,将固定模型参数后的通用模型确定为训练好的肽段生成模型。

可以理解的是,通用模型和肽段生成模型可以由生成活性肽段的设备预先训练好,也可以由其他设备预先训练好后将通用模型和肽段生成模型对应的文件移植至生成活性肽段的设备中。

上述实施方式中,在通用模型的基础上进行微调,得到训练好的肽段生成模型,大大地提升了训练肽段生成模型的速度。且利用已知活性肽段作为训练集,使肽段生成模型在训练过程中学习到了已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

可选地,在一种可能的实现方式中,在训练特定活性对应的肽段生成模型时,可利用肽段生成模型生成一批具有特定活性的肽段,将这批肽段作为训练集继续训练该肽段生成模型,重复执行多次。即将一次迭代生成的肽段作为微调训练该肽段生成模型的输入,这样可使最后生成越来越多的有特定活性的肽段,有利于后续得到高亲和力的作用于特定靶点的肽段。

综上可知,本申请提供的技术方案中,肽段生成模型是利用通用肽数据集和预设的与特定活性对应的活性肽数据集对LSTM网络进行训练得到的,其在训练过程中可以学习到通用肽段中的潜在特征,和已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

可选地,对生成的多个肽段进行聚类分析,根据分析结果移除相似度高的肽段,使剩余的各个肽段之间的相似度小于预设相似度,可以理解为剩余的各个肽段各不相同,从而丰富了肽段的多样性。

可选地,基于生成的不同特定活性的肽段生成全新肽段库,在全新肽段库中确定作用于特地靶点的目标肽段。由于全新肽段库中包含的肽段是大量具有不同特定活性的肽段,已经明确了每个肽段的活性,不用再花费时间去验证每个肽段的活性,在此基础上可以快速查找到可作用于特定靶点的目标肽段。相比于现有技术中在随机肽段中查找可作用于特定靶点的肽段,本实施方式提升了查找速率,耗费时间短,节省了大量资源,降低了经济成本。

可选地,通过3D建模、蛋白对接、分子动力学模拟、分子模拟等处理,在全新肽段库中确定出目标肽段。一方面,全新肽段库中的肽段是筛选过的,极大的缩小了确定作用于特定靶点的目标肽段的候选范围,提高了准确度;另一方面,全新肽段库中的肽段都是已知其对应的特定活性,明确了每个肽段的作用机制,提升了确定目标肽段的准确度和效率。有利于后续对筛选出的目标肽段进一步研究,大大的节省了研究成本。

本申请提供的训练肽段生成模型的方法中,先利用通用肽数据集对LSTM网络训练,得到通用模,再通过某个特定活性的活性肽数据集对通用模型进行微调,得到该特定活性的肽段生成模型。由于是在通用模型的基础上进行微调,大大地提升了训练肽段生成模型的速度。且利用已知活性肽段作为训练集,使肽段生成模型在训练过程中学习到了已知活性肽段中的潜在活性规律,进而使得在实际使用该肽段生成模型的过程中,可根据不同的特定活性需求,生成具有不同特定活性的、多样性丰富的肽段。

且为每种特定活性训练其对应的肽段生成模型,有利于根据每种特定活性对应的肽段生成模型,生成精准的含有该特种活性的全新的肽段。

请参见图9,图9是本申请一实施例提供的一种生成活性肽段的装置的示意图。该生成活性肽段的装置包括的各单元用于执行图1、图4、图5、图7对应的实施例中的各步骤。具体请参阅图1、图4、图5、图7各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图9,包括:

获取单元510,用于获取特定活性对应的肽段生成模型,所述肽段生成模型是利用通用肽数据集和预设的与所述特定活性对应的活性肽数据集对LSTM网络进行训练得到的,所述通用肽数据集包括多个通用肽段;

生成单元520,用于利用所述肽段生成模型生成多个具有所述特定活性的肽段。

可选地,所述装置还包括:

聚类单元,用于对多个所述肽段进行聚类分析,并根据分析结果生成肽段集,所述肽段集中的各个肽段之间的相似度小于预设相似度。

可选地,所述装置还包括:

肽段库获取单元,用于获取全新肽段库,所述全新肽段库包括不同的所述特定活性各自对应的多个肽段;

确定单元,用于在所述全新肽段库中确定作用于特地靶点的目标肽段。

可选地,所述确定单元具体用于:

构建所述全新肽段库中每个肽段对应的3D结构模型;

基于每个所述3D结构模型和所述特定靶点进行蛋白对接,得到对接结果;

基于所述对接结果进行分子动力学模拟,得到各个所述3D结构模型对应的结合自由能;

根据各个所述结合自由能,确定所述目标肽段。

可选地,所述装置还包括:

第一训练单元,用于利用所述通用肽数据集对所述LSTM网络训练,得到通用模型;

第二训练单元,用于利用所述活性肽数据集和预设的损失函数对所述通用模型进行微调,得到所述肽段生成模型。

可选地,所述第二训练单元具体用于:

获取每个所述样本肽段对应的目标矩阵;

将每个所述目标矩阵输入到所述通用模型中处理,得到每个所述目标矩阵对应的样本活性肽段;

基于所述损失函数计算每个样本活性肽段和每个样本活性肽段对应的样本肽段之间的损失值;

当检测到所述损失值大于预设阈值时,调整训练中的通用模型的模型参数,并利用所述活性肽数据集继续训练所述训练中的通用模型;

当检测到所述损失值小于或等于所述预设阈值时,停止训练所述训练中的通用模型,并将训练后的通用模型确定为所述肽段生成模型。

请参见图10,图10是本申请另一实施例提供的生成活性肽段的设备的示意图。如图10所示,该实施例的生成活性肽段的设备6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述各个生成活性肽段的方法实施例中的步骤,例如图1所示的S101至S102。或者,所述处理器60执行所述计算机程序62时实现上述各实施例中各单元的功能,例如图9所示单元510至520功能。

示例性地,所述计算机程序62可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器61中,并由所述处理器60执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机指令段,该指令段用于描述所述计算机程序62在所述生成活性肽段的设备6中的执行过程。例如,所述计算机程序62可以被分割为获取单元和生成单元,各单元具体功能如上所述。

所述设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图10仅仅是生成活性肽段的设备6的示例,并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61可以是所述设备的内部存储单元,例如设备的硬盘或内存。所述存储器61也可以是所述设备的外部存储终端,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述设备的内部存储单元也包括外部存储终端。所述存储器61用于存储所述计算机指令以及所述终端所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

本申请实施例还提供了一种计算机存储介质,计算机存储介质可以是非易失性,也可以是易失性,该计算机存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各个生成活性肽段的方法实施例中的步骤。

本申请还提供了一种计算机程序产品,当计算机程序产品在设备上运行时,使得该设备执行上述各个生成活性肽段的方法实施例中的步骤。

本申请实施例还提供了一种芯片或者集成电路,该芯片或者集成电路包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片或者集成电路的设备执行上述各个生成活性肽段的方法实施例中的步骤。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神范围,均应包含在本申请的保护范围之内。

相关技术
  • 生成活性肽段的方法、装置、设备及存储介质
  • 肽段定量模型的训练方法、装置、计算机设备及存储介质
技术分类

06120114692678