掌桥专利:专业的专利平台
掌桥专利
首页

一种高效药物筛选方法、装置、存储介质及电子设备

文献发布时间:2024-04-18 19:52:40


一种高效药物筛选方法、装置、存储介质及电子设备

技术领域

本申请属于生物分选设备用配件技术领域,特别是一种高效药物筛选方法、装置、存储介质及电子设备。

背景技术

目前,在药物研发阶段,对于药物筛选的准确性要求越来越高。以黄嘌呤氧化酶为例,尿酸是人类嘌呤及核酸分解代谢的最终产物,尿酸来源有内源性尿酸和外源性尿酸,内源性尿酸主要是谷氨酸在肝内合成,但也有体内核蛋白分解;外源性尿酸主要是摄入海鲜等富含嘌呤的食物。近年来,随着人们生活水平的提高,国内外大量流行病学研究表明高尿酸血症/痛风的患病率正逐年升高。而黄嘌呤氧化酶是体内尿酸生成反应的关键酶,它的主要功能为催化黄嘌呤生成尿酸及次黄嘌呤。为了治疗痛风及高尿酸血症,当代医学经常通过抑制黄嘌呤氧化酶表达来来进行治疗。目前,别嘌呤醇和非嘌呤类黄嘌呤氧化酶抑制剂非布索坦作为主要的抗痛风药物,但两者的副作用较多,长期服用对人体伤害较大。2013年国家食品药品监督管理总局曾发布《药品不良反应信息通报》提示别嘌呤醇引起重症药疹的安全问题。因此研究开发新型低毒高效的黄嘌呤氧化酶抑制剂具有重要的现实意义。

目前大多数的药物筛选方式都是基于人工分析结构,分析碎片以及DNA编码等,这些方法的主要手段是通过人工来实现的,这种方法效率低,速度慢,不符合当今高通量发展的趋势。

发明内容

有鉴于此,本申请的目的在于提出一种高效药物筛选方法、装置、存储介质及电子设备,以解决现有技术中药物筛选方案存在的效率低下需要大量人力物力的问题。

第一方面,本申请技术方案提供一种高效药物筛选方法,包括:

获取用于药物筛选的待筛选药物分子;

获取所述待筛选药物分子的SMILES格式信息;

获取模板药物分子的SMILES格式信息;

将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度;

筛选出相似度大于设定阈值的所述待筛选药物分子作为最终筛选出的药物分子。

一些方案中所述的高效药物筛选方法,所述将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度,包括:

将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对;

根据整体比对结果确定所述相似度。

一些方案中所述的高效药物筛选方法,所述将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对,包括:

为所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置;

以设定滑动窗口依序沿所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息滑动,并比较所述滑动窗口内的组成元素是否相同;

在所述滑动窗口移动过程中,组成元素相同的位置设置第一标记,组成元素不同的位置设置第二标记;

以所述第一标记的数量占标记总数的比例作为所述相似度。

一些方案中所述的高效药物筛选方法,所述将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度,包括:

将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行局部比对;

根据局部比对结果确定所述相似度。

一些方案中所述的高效药物筛选方法,所述将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行局部比对,包括:

从所述待筛选药物分子的SMILES格式信息中切分出待比对待筛选药物分子模块;

将待比对待筛选药物分子模块和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置;

以设定滑动窗口依序沿所述待比对待筛选药物分子模块和所述模板药物分子的SMILES格式信息滑动,并比较所述滑动窗口内的组成元素是否相同;

若所述滑动窗口中存在相同组成元素,则将相同组织元素对应的位置作为起点,进行后续组成元素的比较并确定连续相同组成元素的数量;

在所述滑动窗口滑动的过程中,若连续相同组成元素的数量与所述待比对待筛选药物分子模块中的元素数量相同,则将该待比对待筛选药物分子模块作为目标待筛选药物分子模块,否则重新确定起点位置;

获取目标待筛选药物分子模块的数量占总分子模块数量的比值作为所述相似度。

一些方案中所述的高效药物筛选方法,所述将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度,包括:

采用整体比对和局部比对相结合的方式将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行比对;

根据整体比对和局部比对结果确定所述相似度。

一些方案中所述的高效药物筛选方法,所述采用整体比对和局部比对相结合的方式将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行比对,包括:

先将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对,以整体比对得到的相似度大于第一设定阈值的待筛选药物分子作为预选药物分子;

将所述预选药物分子与所述模板药物分子的SMILES格式信息进行局部比对,以局部比对得到的相似度大于第二设定阈值的预选药物分子作为最终筛选出的药物分子。

第二方面,本申请技术方案提供一种高效药物筛选装置,包括:

待筛选药物分子获取模块,被配置为获取用于药物筛选的待筛选药物分子;

第一信息获取模块,被配置为获取所述待筛选药物分子的SMILES格式信息;

第二信息获取模块,被配置为获取模板药物分子的SMILES格式信息;

比对模块,被配置为将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度;

筛选模块,被配置为筛选出相似度大于设定阈值的所述待筛选药物分子作为最终筛选出的药物分子。

第三方面,本申请技术方案提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行第一方面任一项所述的高效药物筛选方法。

第四方面,本申请技术方案提供一种电子设备,包括至少一个处理器和至少一个存储器,至少一个所述存储器中存储有程序指令,至少一个所述处理器读取所述存储器中的所述程序指令后执行第一方面任一项所述的高效药物筛选方法。

本申请实施例提供的上述方案,与现有技术相比,具有以下优点:

本申请提供的高效药物筛选方法、装置、存储介质及电子设备,其方法包括获取用于药物筛选的待筛选药物分子;获取待筛选药物分子的SMILES格式信息;获取模板药物分子的SMILES格式信息;将模板药物分子与待筛选药物分子进行比较,并获取模板药物分子与待筛选药物分子的相似度;筛选出相似度大于设定阈值的待筛选药物分子作为最终筛选出的药物分子。通过本申请的方案,利用待筛选药物分子的SMILES格式信息与模板药物分子的SMILES格式信息进行比对,确定相似度大于设定阈值的待筛选药物分子作为最终筛选出的药物分子,能通过自动化的方式实现,不必依靠人力资源,且消除了主观因素对筛选结构准确度的影响,极大的提高了药物筛选的效率和精度。

附图说明

通过下面结合附图对其实施例进行描述,本申请的上述特征和技术优点将会变得更加清楚和容易理解。

图1为本申请一个实施例所述高效药物筛选方法的流程图;

图2为本申请一个实施例所述高效药物筛选方法的运行界面示意图;

图3为本申请一个实施例所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息的显示方式示意图;

图4为本申请一个实施例所述高效药物筛选装置的结构框图;

图5为本申请一个实施例所述执行高效药物筛选方法的电子设备的硬件连接关系示意图。

实施方式

为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。其中相同的零部件用相同的附图标记表示。需要说明的是,下面描述中使用的词语“前”、“后”、“左”、“右”、“上”和“下”指的是附图中的方向。使用的词语“内”和“外”分别指的是朝向或远离特定部件几何中心的方向。

本申请实施例提供一种高效药物筛选方法,如图1所示,包括:

S10:获取用于药物筛选的待筛选药物分子。

以抑制黄嘌呤氧化酶(xanthine oxidase)的催化作用的抑制剂为例进行说明,作为参与人体代谢的酶,是催化产生尿酸的主要作用酶。在具体实现时,可以通过专家经验确定与模板药物分子可能存在相似性的待筛选药物分子。

如图2所示为药物分子筛选程序截图,在分子输入框中输入已有药物分子的SMILES格式,如果筛选多个分子则使用英文逗号隔开。或者使用“来自文件”按钮录入本地或者网络文件中的分子信息。然后在阈值选项选择分子相似度阈值,可选区间为:0-100%,优选为70%-90%。在确定了筛选阈值后,接下来可以在筛选模式中选择整体以及部分筛选两种模式,如果选择了部分筛选则需要在后面的药效团模块中填写正确的药效团信息。整体筛选模式是通过对比药物分子整体结构来进行的筛选,该模式可以精准地在分子角度从数据库中筛选出与待选药物分子结构具有相似性的分子。部分筛选模式即药效团筛选模式可以在筛选过程中准确分析分子所拥有基团--药效团信息进行比对,对比筛选的结果针对的是分子的部分结构。

在全部信息都正确录入后就可以点击开始查找按钮进行筛选。构建的包含了近2亿分子的筛选数据库。为了提高筛选效率,我们将两亿分子的信息分别储存在5000多个表格中,平均每个表格储存了40000余分子。筛选系统为了可以高效的处理数量庞大的分子基团采取了多核处理的方式,可以调动计算机的多个核来同步进行比对筛选,目前的最高速度为每秒对比筛选3000个分子,数量为两亿分子的数据库全部筛选结束耗时仅为20小时左右。

S20:获取所述待筛选药物分子的SMILES格式信息;获取模板药物分子的SMILES格式信息。

如图3所示,上列为待筛选药物分子,下列为模板药物分子,二者的SMILES格式信息可以不对齐,通过在比对的过程中确定相同的组成元素后来确定起点。

S30:将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度。

S40:筛选出相似度大于设定阈值的所述待筛选药物分子作为最终筛选出的药物分子。

进一步地,筛选过程会实时在界面显示例如:已完成筛选的库,筛选成功的分子数量,已经筛选出符合要求的分子等,在筛选比对过程中筛选成功以及异常的数据也会被记录在程序中,这里面记录的异常数据指的是分子数据库中储存的分子结构出现的异常,比如发生断裂等异常。异常数据并不会影响程序的正常运行,也不会影响筛选速度。程序运行开始后,储存分子的全部表格,以及正在进行筛选的以及已完成筛选的表格都会在界面显示出来。在“筛选列表”模块会实时显示已完成筛选中符合阈值要求的分子,以及相似度信息,并且还会同步显示相似的模板药物分子以及相似的药效团信息。当全部分子筛选结束后点击“导出数据”按钮选择合适的储存位置就可以在合适的位置导出筛选分子的结构文件以及通过表格文件形式呈现的分子SMILES格式信息以及分子的相似度信息。

本实施例的以上方案,利用待筛选药物分子的SMILES格式信息与模板药物分子的SMILES格式信息进行比对,确定相似度大于设定阈值的待筛选药物分子作为最终筛选出的药物分子,能通过自动化的方式实现,不必依靠人力资源,且消除了主观因素对筛选结构准确度的影响,极大的提高了药物筛选的效率和精度。

进一步地,以上方案中步骤S30中包括:

S311:将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对;

S312:根据整体比对结果确定所述相似度。

具体实现时,为所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置;根据设定滑动窗口依序沿所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息,并比较所述滑动窗口内的组成元素是否相同;在所述滑动窗口移动过程中,组成元素相同的位置设置第一标记,组成元素不同的位置设置第二标记;以所述第一标记的数量占标记总数的比例作为所述相似度。

参考图3,依次给所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置,待筛选药物分子的组成元素定义位置是1,2,3,4...10,同样的原理所述模板药物分子的SMILES格式信息中每一个组成元素定义位置为1-19,然后,以滑动的方式从一端依次逐个移动模板药物分子的SMILES格式信息的组成元素,找到第一个和待筛选药物分子相同的元素的位置,然后以此元素为起点,逐个位置进行比较,位置上元素相同的,记为1(即第一标记),位置上元素不同的,记为0(即第二标记),比较结束后,统计1的数目,然后再计算这个数目占整个待筛选药物分子元素数目的比例,定义为相似度。

在另一些方案中,步骤S30中包括:

S321:将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行局部比对。

S322:根据局部比对结果确定所述相似度。

具体实现时,从所述待筛选药物分子的SMILES格式信息中切分出待比对待筛选药物分子模块;将待比对待筛选药物分子模块和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置;根据设定滑动窗口依序沿所述待比对待筛选药物分子模块和所述模板药物分子的SMILES格式信息,并比较所述滑动窗口内的组成元素是否相同;若所述滑动窗口中存在相同组成元素,则将相同组织元素对应的位置作为起点,进行后续组成元素的比较并确定连续相同组成元素的数量;在所述滑动窗口滑动的过程中,若连续相同组成元素的数量与所述待比对待筛选药物分子模块中的元素数量相同,则将该待比对待筛选药物分子模块作为目标待筛选药物分子模块,否则重新确定起点位置;获取最终筛选出的药物分子模块的数量总分子模块数量的比值作为所述相似度。

依然以图3为例,取待筛选药物分子中的一部分作为一个比较的模块作为待比对待筛选药物分子模块,例如图3中标记方框的部分,以待比对待筛选药物分子模块来进行比较,其余的元素可以忽略。具体地,先通过和整体比较相同的方法,找到模板药物分子的SMILES格式信息和待比对待筛选药物分子模块中相同的元素,然后以此为起点进行后续的元素比较,位置上元素相同的,记为1,位置上元素不同的,记为0。和整体比较的模式不同的是:整体比较模式是可以出现间断的相同元素,如第5位元素相同,而第6位的元素不同,这种情况允许,而局部比较模式中,在确定比较起点后,必须在连续位置的元素都相同,而且要求连续相同元素的个数与模板中定义的待比对待筛选药物分子模块的元素的个数完全相同。有任何一个位置上的元素不相同,则记为0。若待筛选药物分子中只定义一个待比对待筛选药物分子模块,且获得了0标记,那么该待比对待筛选药物分子模块会被舍弃。如果模板中定义了几个待比对待筛选药物分子模块,则记为1的待比对待筛选药物分子模块的数目和模板中总的模块数目的比例记为相似度。在待比对待筛选药物分子模块选择的时候,程序可以选择预置的小分子药效团作为局部比较的模块,也可以根据实验者的经验进行自行定义。

作为另一种方案,所述步骤S30还可以通过如下方式实现:

S331:采用整体比对和局部比对相结合的方式将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行比对。

S332:根据整体比对和局部比对结果确定所述相似度。

具体地,先将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对,以整体比对得到的相似度大于第一设定阈值的待筛选药物分子作为预选药物分子;将所述预选药物分子与所述模板药物分子的SMILES格式信息进行局部比对,以局部比对得到的相似度大于第二设定阈值的预选药物分子作为最终筛选出的药物分子。

依然以图3为例,先进行整体比较,比较的方法和比较结果的判定方法与整体比较模式相同,然后将整体比较的结果中相似度达到既定阈值的结果作为输入文件,然后根据待筛选药物分子中定义的模块,将这些分子与待筛选药物分子进行局部比较。比较的方法和比较结果的判定方法与局部比较模式相同。

以上方案中,根据具体比较的分子和专家经验,可以设定各个阈值的给定结果,各阈值设定后,根据该阈值,对比较的结果进行筛选,如设定为0.9,则是比较结果相似度大于90%的分子会被输出,相似度小于90%的将会被舍弃。

在进行筛选操作的过程中,上述方法还可以实时显示筛选过程运行的时间﹑已经筛选的分子数目﹑已经经历筛选比较的分子中出现异常的分子数目以及进行正常比较筛选的分子数目。其中,判断异常分子的标准是待比较分子中出现了待筛选药物分子中没有出现的元素类型或者待比较分子中的结构出现异常等。

本申请以上方案通过模板监督﹑多种比较筛选模式有机结合﹑辅助专家经验的机器学习方式相结合,有效实现了高通量筛选药物分子速度快,准确度高,计算资源能耗小的良好效果。该程序进行对比筛选药物分子的速度是每秒3000个分子,数量为两亿分子的数据库全部筛选结束耗时仅为20小时左右。

在实际应用时,为了证明上述方法的可行性,申请人以治疗痛风的上市药物Febuxostat作为模板按照筛选流程进行了实验验证,经过多轮筛选验证获得了一定数量的具有明显的抑制黄嘌呤氧化酶表达的药物分子。经验证,使用上述方法筛选出了具有明显针对黄嘌呤氧化酶抑制效果的分子。以此可以证明上述方法针对药物筛选方面行之有效,并且由于大部分分子药物都是通过药效团与靶点相互作用起效的,而该发明的高效药物筛选方法就是以药效团为基础进行的。因此该方法可以有效的适用于小分子药物,多肽药物及抗体药物的开发当中,并且可以根据筛选的内容不同合理地使用不同的筛选模式或者多种筛选模式有机结合。

本申请实施例还提供一种高效药物筛选装置,如图4所示,包括:

待筛选药物分子获取模块10,被配置为获取用于药物筛选的待筛选药物分子;

第一信息获取模块20,被配置为获取所述待筛选药物分子的SMILES格式信息;

第二信息获取模块,被配置为获取模板药物分子的SMILES格式信息;

比对模块30,被配置为将所述模板药物分子与所述待筛选药物分子进行比较,并获取所述模板药物分子与所述待筛选药物分子的相似度;

筛选模块40,被配置为筛选出相似度大于设定阈值的所述待筛选药物分子作为最终筛选出的药物分子。

一些方案中,所述比对模块30,还被配置为将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对;根据整体比对结果确定所述相似度。具体地,为所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置;根据设定滑动窗口依序沿所述待筛选药物分子的SMILES格式信息和所述模板药物分子的SMILES格式信息,并比较所述滑动窗口内的组成元素是否相同;在所述滑动窗口移动过程中,组成元素相同的位置设置第一标记,组成元素不同的位置设置第二标记;以所述第一标记的数量占标记总数的比例作为所述相似度。

一些方案中,所述比对模块30,还被配置为将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行局部比对。根据局部比对结果确定所述相似度。具体实现时,从所述待筛选药物分子的SMILES格式信息中切分出待比对待筛选药物分子模块;将待比对待筛选药物分子模块和所述模板药物分子的SMILES格式信息中的每一个组成元素定义位置;根据设定滑动窗口依序沿所述待比对待筛选药物分子模块和所述模板药物分子的SMILES格式信息,并比较所述滑动窗口内的组成元素是否相同;若所述滑动窗口中存在相同组成元素,则将相同组织元素对应的位置作为起点,进行后续组成元素的比较并确定连续相同组成元素的数量;在所述滑动窗口滑动的过程中,若连续相同组成元素的数量与所述待比对待筛选药物分子模块中的元素数量相同,则将该待比对待筛选药物分子模块作为目标待筛选药物分子模块,否则重新确定起点位置;获取最终筛选出的药物分子模块的数量总分子模块数量的比值作为所述相似度。

一些方案中,所述比对模块30,还被配置为采用整体比对和局部比对相结合的方式将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行比对。根据整体比对和局部比对结果确定所述相似度。具体地,先将所述待筛选药物分子的SMILES格式信息与所述模板药物分子的SMILES格式信息进行整体比对,以整体比对得到的相似度大于第一设定阈值的待筛选药物分子作为预选药物分子;将所述预选药物分子与所述模板药物分子的SMILES格式信息进行局部比对,以局部比对得到的相似度大于第二设定阈值的预选药物分子作为最终筛选出的药物分子。

本申请一些实施例提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行以上实施例中任一项实施例中提出的所述的高效药物筛选方法。

本申请一些实施例提供一种电子设备,如图5所示,所述电子设备包括至少一个处理器51和至少一个存储器52,至少一个所述存储器52中存储有程序信息,至少一个所述处理器51读取所述程序信息后执行以上方法实施例任一项方案所述的高效药物筛选方法。所述设备还可以包括:输入装置53和输出装置54。处理器51、存储器52、输入装置53和输出装置54可以通信连接。存储器52作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器51通过运行存储在存储器52中的非易失性软件程序、指令以及模块,从而执行各种功能应用以及数据处理,即实现上述任一方案提供的高效药物筛选方法。存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据高效药物筛选方法的使用所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至执行高效药物筛选方法的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。输入装置53可接收输入的用户点击,以及产生与高效药物筛选方法的用户设置以及功能控制有关的信号输入。输出装置54可包括显示屏等显示设备。在所述一个或者多个模块存储在所述存储器52中,当被所述一个或者多个处理器51运行时,执行上述任意方法实施例中的高效药物筛选方法。

所属领域的普通技术人员应当理解:以上所述仅为本申请的具体实施例而已,并不用于限制本申请,凡在本申请的主旨之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

技术分类

06120116334822