掌桥专利:专业的专利平台
掌桥专利
首页

基于深度学习的药物小分子性质预测方法和装置

文献发布时间:2023-06-19 09:24:30


基于深度学习的药物小分子性质预测方法和装置

技术领域

本发明涉及深度学习技术领域,具体涉及一种基于深度学习的药物小分子性质预测方法、一种基于深度学习的药物小分子性质预测装置、一种计算机设备和一种非临时性计算机可读存储介质。

背景技术

新药研发周期十分漫长,包括靶标选择与验证、从苗头化合物(Hit)的发现到先导化合物(Lead)最后到候选药物(Candidate)的发现与优化,层层筛选,成本高昂。我们希望通过计算机进行虚拟筛选,基于现有药物相关的生物化学数据库,充分挖掘药物分子背后的规律,加速发现药物研发的速度,如对新靶标蛋白苗头化合物的发现和评估。

传统的药物小分子性质预测的方法通过使用分子描述符(包括1D/2D/3D/高维描述符,比如分子量等物理化学性质)作为输入特征,进行定量构效关系或构效关系(QSAR/QSPR)建模,目前已经开发了超过5000个分子描述符。然而,这种大量使用分子描述符的建模方法的算法模型预测表现非常取决于是否能选择有效的分子描述符特征。在进行特征工程方面费时费力的同时,算法模型的泛化和通用能力也极大取决于所训练的模型质量。

因此,亟需提出一种方便、高效且准确的药物小分子性质预测方案。

发明内容

本发明为解决上述技术问题,提供了一种基于深度学习的药物小分子性质预测方法和装置,能够方便、高效且准确地实现药物小分子性质预测,从而有效提升药物研发的效率并加快虚拟筛选流程。

本发明采用的技术方案如下:

一种基于深度学习的药物小分子性质预测方法,包括以下步骤:获取包含多个药物小分子数据的数据集,并获取所述数据集中每个药物小分子的结构特征数据,构成样本集;对所述样本集进行预处理;通过多种神经网络基于预处理后的样本集进行集成学习以得到集成预测模型;获取待预测药物小分子数据,并将所述待预测药物小分子数据输入所述集成预测模型,以得到药物小分子性质预测结果。

所述的基于深度学习的药物小分子性质预测方法还包括:获取不同类型的药物数据库;通过所述集成预测模型对所述不同类型的药物数据库中药物小分子数据进行性质预测,以检测所述集成预测模型的通用能力。

获取所述数据集中每个药物小分子的结构特征数据,具体包括:获取每个药物小分子数据对应的SMILES(Simplified molecular input line entry specification,简化分子线性输入规范)字符串;采用独热编码One-hot的形式对每个SMILES字符串进行编码,并统计每个SMILES字符串的字符位置以构建药物小分子特征向量,或者,采用mol2vec学习每个药物小分子数据的分子亚结构向量表示形式以构建药物小分子特征向量。

对所述样本集进行预处理,具体包括:采用SMOTE(Synthetic MinorityOversampling Technique,合成少数类过采样技术)算法对所述样本集中的药物小分子的结构特征数据进行过采样,并将过采样后的数据分为训练集和测试集。

所述多种神经网络包括多层CNN(卷积神经网络)、CNN_GRU和CNN_LSTM。

其中,所述CNN_GRU采用双向GRU(门控单元网络),所述CNN_LSTM采用双向LSTM(长短期记忆网络)。

一种基于深度学习的药物小分子性质预测装置,包括:第一获取模块,所述第一获取模块用于获取包含多个药物小分子数据的数据集,并获取所述数据集中每个药物小分子的结构特征数据,构成样本集;预处理模块,所述预处理模块用于对所述样本集进行预处理;学习模块,所述学习模块用于通过多种神经网络基于预处理后的样本集进行集成学习以得到集成预测模型;预测模块,所述预测模块用于获取待预测药物小分子数据,并将所述待预测药物小分子数据输入所述集成预测模型,以得到药物小分子性质预测结果。

所述的基于深度学习的药物小分子性质预测装置还包括:第二获取模块,所述第二获取模块用于获取不同类型的药物数据库;检测模块,所述检测模块用于通过所述集成预测模型对所述不同类型的药物数据库中药物小分子数据进行性质预测,以检测所述集成预测模型的通用能力。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述基于深度学习的药物小分子性质预测方法。

一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于深度学习的药物小分子性质预测方法。

本发明的有益效果:

本发明通过获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,然后通过多种神经网络基于结构特征数据集进行集成学习以得到集成预测模型,最后将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,由此,能够方便、高效且准确地实现药物小分子性质预测,从而有效提升药物研发的效率并加快虚拟筛选流程。

附图说明

图1为本发明实施例的基于深度学习的药物小分子性质预测方法的流程图;

图2为本发明一个实施例的多层CNN结构示意图;

图3为本发明一个实施例的CNN+RNN结构示意图;

图4为本发明实施例的基于深度学习的药物小分子性质预测装置的方框示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例的基于深度学习的药物小分子性质预测方法包括以下步骤:

S1,获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,构成样本集。

在本发明的一个实施例中,数据集中可包含大量的药物小分子的化学结构数据。应当理解的是,在计算和存储能力允许的条件下,数据集中的药物小分子数量越大,对于后续模型的训练效果越好。

在获取到数据集后,可获取数据集中每个药物小分子数据对应的SMILES字符串,并统计字符串长度最大值和字符的类别个数,然后可采用独热编码One-hot的形式对每个SMILES字符串进行编码,并统计每个SMILES字符串的字符位置以构建药物小分子特征向量。或者,可采用mol2vec学习每个药物小分子数据的分子亚结构向量表示形式以构建药物小分子特征向量。本发明实施例所提供的上述两种特征提取方式,所构建的药物小分子特征向量能够适用于不同的神经网络算法模型。并且,上述两种特征提取方式无需计算额外的分子结构或者物理化学特征和进行特征工程,极大地缩短了特征提取时间,从而降低预测过程后续模型训练的成本。

S2,对样本集进行预处理。

具体地,可采用SMOTE算法对样本集中的药物小分子的结构特征数据进行过采样,并将过采样后的数据分为训练集和测试集。基于SMOTE算法的过采样能够解决数据不平衡问题。

S3,通过多种神经网络基于预处理后的样本集进行集成学习以得到集成预测模型。

在本发明的一个实施例中,多种神经网络包括多层CNN、CNN_GRU和CNN_LSTM,即包括一种单独的CNN结构和两种CNN+RNN结构。

本发明实施例对多种神经网络均进行了网络结构和模型参数的优化,通过调整网络结构,并通过全空间搜索进行学习率、激活函数、维度等重要参数的优化,选择最优的算法模型。比如,通过采用双向RNN(循环神经网络),了解药物小分子结构式当前的输出与之前、之后的状态的共同关心。双向RNN是由两个RNN上下叠加在一起组成。再比如,在嵌入层和RNN层之间添加1D卷积层。

其中,如图2所示,多层CNN采用顺序结构排列,由一层卷积层、一层标准化层、两层卷积层、一层压平层、两层全连接层组成。

如图3所示,CNN_GRU采用双向GRU,采用顺序结构排列,由一层卷积层、一层双向GRU模型、一层标准化层、两层卷积层、一层压平层、两层全连接层组成。CNN_LSTM采用双向LSTM,采用顺序结构排列,由一层卷积层、一层双向LSTM模型、一层标准化层、两层卷积层、一层压平层、两层全连接层组成。

此外,多层CNN、CNN_GRU和CNN_LSTM均加入Dropout,通过正则化来减小模型过拟合。在模型训练时均采用Adam优化器调整学习率,在一定程度上避免了由于学习率引起的随着迭代次数增大Loss没有减小的情况,防止模型欠拟合。

本发明实施例通过集成学习Ensemble Learning将多个不同的神经网络模型组合成一个集成预测模型Ensemble Model,能够同时降低最终模型的偏差Bias和方差Variance,进一步提升预测的准确性和预测效果。集成学习的具体过程可参照现有技术,在此不作赘述。

S4,获取待预测药物小分子数据,并将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果。

通过获取待预测的药物小分子的化学结构数据,并提取其特征向量,以及将其特征向量输入本发明实施例的集成预测模型,能够得到药物小分子诸如靶标结合性质、活性或毒性的预测结果。

此外,在本发明的一个实施例中,还可获取不同类型的药物数据库,并通过集成预测模型对不同类型的药物数据库中药物小分子数据进行性质预测,以检测集成预测模型的通用能力。

具体地,可获取公开的药物数据库,例如DrugBank、BindingDB,将药物数据库中的药物小分子数据输入集成预测模型,得到相应的药物小分子性质预测结果,并利用至少一个评价指标评估集成预测模型预测各类药物数据库的性能,如果性能差别在预设的阈值之内,则该集成预测模型的通用能力较强,满足要求;如果性能差别较大,在预设的阈值之外,则该集成预测模型的通用能力较差,不满足要求。

在本发明的一个实施例中,评价指标包括准确率、精确率、召回率、ROC曲线下的面积、混淆矩阵中的一个或多个。

其中,准确率Accuracy是指预测正确的结果占总样本的百分比,本发明实施例所评估的是历史预测数据库中的真实预测数据,也即本发明实施例模型评估中涉及的样本是指历史真实预测数据的集合。准确率Accuracy的公式如下:

Accuracy=(TP+TN)/(TP+TN+FP+FN)

其中,TP(True Positive,真正例)是指被模型预测为正的正样本,FP(FalsePositive,假正例)是指被模型预测为正的负样本,FN(False Negative,假负例)是指被模型预测为负的正样本,TN(True Negative,真负例)是指被模型预测为负的负样本。

精准率Precision又叫查准率,它是针对预测结果而言的,是指在所有被预测为正的样本中实际为正的样本的概率,意思就是在预测为正样本的结果中,有多少把握可以预测正确。精准率Precision的公式如下:

Precision=TP/(TP+FP)

召回率Recall又叫查全率,它是针对原样本而言的,是指在实际为正的样本中被预测为正样本的概率。召回率Recall的公式如下:

Recall=TP/(TP+FN)

ROC(Receiver Operating Characteristic)曲线,又称接受者操作特征曲线。ROC曲线中的主要两个指标是真正率TPR和假正率FPR,其中横坐标为假正率FPR,纵坐标为真正率TPR。

真正率TPR(True Positive Rate),又称灵敏度,公式如下:

TPR=TP/(TP+FN)

假正率FPR(False Positive Rat),又称特异度,公式如下:

FPR=FP/(TN+FP)

ROC曲线具有当正负样本的分布变化的时候,ROC曲线能够保持不变的良好特性,能够很好地消除样本类别不平衡对指标结果产生的影响。

ROC曲线下的面积AUC(Area Under Curve),是处于ROC曲线下方的那部分面积的大小。ROC曲线下方面积越大表明模型性能越好,AUC就是由此产生的评价指标。通常,AUC的值介于0.5到1.0之间,较大的AUC代表了较好的预测表现。如果模型是完美的,那么它的AUC=1,证明所有正例排在了负例的前面,如果模型是个简单的二类随机猜测模型,那么它的AUC=0.5,如果一个模型好于另一个,则它的曲线下方面积相对较大,对应的AUC值也会较大。

混淆矩阵(Confusion Matrix)又被称为错误矩阵,通过它可以直观地观察到算法的效果。它的每一列是样本的预测分类,每一行是样本的真实分类(反过来也可以),它反映了分类结果的混淆程度。

本发明实施例可以以上述任一评价指标来评估集成预测模型预测各类药物数据库的性能,进而得到其通用能力,也可以以多个评价指标来评估集成预测模型预测各类药物数据库的性能,进而得到其通用能力。

在本发明的优选实施例中,以ROC曲线下的面积AUC来评估集成预测模型预测各类药物数据库的性能,若各类药物数据库对应的AUC之间的差距在预设面积阈值之内,则该集成预测模型的通用能力满足要求。

当以多个评价指标来评估集成预测模型预测各类药物数据库的性能时,每个评价指标可具有相应的权重,以多个评价指标所得结果的加权平均值作为预测各类药物数据库的性能的评估依据,若各类药物数据库对应的加权平均值在预设阈值之内,则该集成预测模型的通用能力满足要求。优选地,ROC曲线下的面积AUC的权重最高。

在本发明的一个实施例中,上述检测模型通用能力的步骤可在步骤S4之前执行,如果检测到集成预测模型的通用能力满足要求,例如对于大部分或全部种类的药物小分子性质预测准确率均大于预设阈值,则后续直接执行步骤S4,以该集成预测模型对待预测的药物小分子进行性质预测。

如果检测到集成预测模型的通用能力不满足要求,则可返回步骤S1,即重新执行步骤S1-S3和该检测模型通用能力的步骤,直至集成预测模型的通用能力满足要求后,执行步骤S4。或者,可根据对不同类型的药物数据库的预测数据得到集成预测模型适用的药物小分子种类,例如通过对各药物数据库中药物小分子性质预测,得出集成预测模型对于某类或某些种类的药物小分子性质预测准确率大于预设阈值,则在步骤S4中,获取待预测药物小分子数据后,可判断该待预测药物小分子是否属于上述预测准确率大于预设阈值的种类,如果属于,则将该待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,如果不属于,则返回步骤S1,重新集成学习得到集成预测模型,直至集成预测模型的通用能力满足要求,或集成预测模型对于该待预测药物小分子所属种类的预测准确率大于预设阈值。

根据本发明实施例的基于深度学习的药物小分子性质预测方法,通过获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,然后通过多种神经网络基于结构特征数据集进行集成学习以得到集成预测模型,最后将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,由此,能够方便、高效且准确地实现药物小分子性质预测,从而有效提升药物研发的效率并加快虚拟筛选流程。

对应上述实施例的基于深度学习的药物小分子性质预测方法,本发明还提出一种基于深度学习的药物小分子性质预测装置。

如图4所示,本发明实施例的基于深度学习的药物小分子性质预测装置包括:第一获取模块10、预处理模块20、学习模块30和预测模块40。其中,第一获取模块10用于获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,构成样本集;预处理模块20用于对样本集进行预处理;学习模块30用于通过多种神经网络基于预处理后的样本集进行集成学习以得到集成预测模型;预测模块40用于获取待预测药物小分子数据,并将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果。

在本发明的一个实施例中,数据集中可包含大量的药物小分子的化学结构数据。应当理解的是,在计算和存储能力允许的条件下,数据集中的药物小分子数量越大,对于后续模型的训练效果越好。

第一获取模块10在获取到数据集后,可获取数据集中每个药物小分子数据对应的SMILES字符串,并统计字符串长度最大值和字符的类别个数,然后可采用独热编码One-hot的形式对每个SMILES字符串进行编码,并统计每个SMILES字符串的字符位置以构建药物小分子特征向量。或者,可采用mol2vec学习每个药物小分子数据的分子亚结构向量表示形式以构建药物小分子特征向量。本发明实施例所提供的上述两种特征提取方式,所构建的药物小分子特征向量能够适用于不同的神经网络算法模型。并且,上述两种特征提取方式无需计算额外的分子结构或者物理化学特征和进行特征工程,极大地缩短了特征提取时间,从而降低预测过程后续模型训练的成本。

预处理模块20具体可采用SMOTE算法对样本集中的药物小分子的结构特征数据进行过采样,并将过采样后的数据分为训练集和测试集。基于SMOTE算法的过采样能够解决数据不平衡问题。

在本发明的一个实施例中,多种神经网络包括多层CNN、CNN_GRU和CNN_LSTM,即包括一种单独的CNN结构和两种CNN+RNN结构。

本发明实施例对多种神经网络均进行了网络结构和模型参数的优化,通过调整网络结构,并通过全空间搜索进行学习率、激活函数、维度等重要参数的优化,选择最优的算法模型。比如,通过采用双向RNN,了解药物小分子结构式当前的输出与之前、之后的状态的共同关心。双向RNN是由两个RNN上下叠加在一起组成。再比如,在嵌入层和RNN层之间添加1D卷积层。

其中,如图2所示,多层CNN采用顺序结构排列,由一层卷积层、一层标准化层、两层卷积层、一层压平层、两层全连接层组成。

如图3所示,CNN_GRU采用双向GRU,采用顺序结构排列,由一层卷积层、一层双向GRU模型、一层标准化层、两层卷积层、一层压平层、两层全连接层组成。CNN_LSTM采用双向LSTM,采用顺序结构排列,由一层卷积层、一层双向LSTM模型、一层标准化层、两层卷积层、一层压平层、两层全连接层组成。

此外,多层CNN、CNN_GRU和CNN_LSTM均加入Dropout,通过正则化来减小模型过拟合。在模型训练时均采用Adam优化器调整学习率,在一定程度上避免了由于学习率引起的随着迭代次数增大Loss没有减小的情况,防止模型欠拟合。

集成模块40通过集成学习Ensemble Learning将多个不同的神经网络模型组合成一个集成预测模型Ensemble Model,能够同时降低最终模型的偏差Bias和方差Variance,进一步提升预测的准确性和预测效果。集成学习的具体过程可参照现有技术,在此不作赘述。

预测模块50通过获取待预测的药物小分子的化学结构数据,并提取其特征向量,以及将其特征向量输入本发明实施例的集成预测模型,能够得到药物小分子诸如靶标结合性质、活性或毒性的预测结果。

此外,在本发明的一个实施例中,基于深度学习的药物小分子性质预测装置还可包括第二获取模块和检测模块,第二获取模块用于获取不同类型的药物数据库,检测模块用于通过集成预测模型对不同类型的药物数据库中药物小分子数据进行性质预测,以检测集成预测模型的通用能力。

具体地,第二获取模块可获取公开的药物数据库,例如DrugBank、BindingDB,检测模块将药物数据库中的药物小分子数据输入集成预测模型,得到相应的药物小分子性质预测结果,并利用至少一个评价指标评估集成预测模型预测各类药物数据库的性能,如果性能差别在预设的阈值之内,则该集成预测模型的通用能力较强,满足要求;如果性能差别较大,在预设的阈值之外,则该集成预测模型的通用能力较差,不满足要求。

在本发明的一个实施例中,评价指标包括准确率、精确率、召回率、ROC曲线下的面积、混淆矩阵中的一个或多个。

本发明实施例可以以上述任一评价指标来评估集成预测模型预测各类药物数据库的性能,进而得到其通用能力,也可以以多个评价指标来评估集成预测模型预测各类药物数据库的性能,进而得到其通用能力。

在本发明的优选实施例中,以ROC曲线下的面积AUC来评估集成预测模型预测各类药物数据库的性能,若各类药物数据库对应的AUC之间的差距在预设面积阈值之内,则该集成预测模型的通用能力满足要求。

当以多个评价指标来评估集成预测模型预测各类药物数据库的性能时,每个评价指标可具有相应的权重,以多个评价指标所得结果的加权平均值作为预测各类药物数据库的性能的评估依据,若各类药物数据库对应的加权平均值在预设阈值之内,则该集成预测模型的通用能力满足要求。优选地,ROC曲线下的面积AUC的权重最高。

在本发明的一个实施例中,检测模块可在预测模块40之前执行其功能,如果检测模块检测到集成预测模型的通用能力满足要求,例如对于大部分或全部种类的药物小分子性质预测准确率均大于预设阈值,则后续预测模块40直接以该集成预测模型对待预测的药物小分子进行性质预测。

如果检测模块检测到集成预测模型的通用能力不满足要求,则可再次由第一获取模块10、预处理模块20和学习模块30重新得到集成预测模型,直至集成预测模型的通用能力满足要求后,由预测模块40对待预测的药物小分子进行性质预测。或者,可根据对不同类型的药物数据库的预测数据得到集成预测模型适用的药物小分子种类,例如通过对各药物数据库中药物小分子性质预测,得出集成预测模型对于某类或某些种类的药物小分子性质预测准确率大于预设阈值,则预测模块40在获取待预测药物小分子数据后,可判断该待预测药物小分子是否属于上述预测准确率大于预设阈值的种类,如果属于,则将该待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,如果不属于,则再次由第一获取模块10、预处理模块20和学习模块30重新得到集成预测模型,直至集成预测模型的通用能力满足要求,或集成预测模型对于该待预测药物小分子所属种类的预测准确率大于预设阈值。

根据本发明实施例的基于深度学习的药物小分子性质预测装置,通过获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,然后通过多种神经网络基于结构特征数据集进行集成学习以得到集成预测模型,最后将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,由此,能够方便、高效且准确地实现药物小分子性质预测,从而有效提升药物研发的效率并加快虚拟筛选流程。

对应上述实施例,本发明还提出一种计算机设备。

本发明实施例的计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该计算机程序时,可实现根据本发明上述实施例所述的基于深度学习的药物小分子性质预测方法。

根据本发明实施例的计算机设备,处理器执行存储在存储器上的计算机程序时,通过获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,然后通过多种神经网络基于结构特征数据集进行集成学习以得到集成预测模型,最后将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,由此,能够方便、高效且准确地实现药物小分子性质预测,从而有效提升药物研发的效率并加快虚拟筛选流程。

对应上述实施例,本发明还提出一种非临时性计算机可读存储介质。

本发明实施例的非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时可实现根据本发明上述实施例所述的基于深度学习的药物小分子性质预测方法。

根据本发明实施例的非临时性计算机可读存储介质,处理器执行存储在其上的计算机程序时,通过获取包含多个药物小分子数据的数据集,并获取数据集中每个药物小分子的结构特征数据,然后通过多种神经网络基于结构特征数据集进行集成学习以得到集成预测模型,最后将待预测药物小分子数据输入集成预测模型,以得到药物小分子性质预测结果,由此,能够方便、高效且准确地实现药物小分子性质预测,从而有效提升药物研发的效率并加快虚拟筛选流程。

在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 基于深度学习的药物小分子性质预测方法和装置
  • 基于自监督学习的药物小分子性质预测方法、装置及设备
技术分类

06120112150528