掌桥专利:专业的专利平台
掌桥专利
首页

基于遗传算法和分子对接模拟的分子优化模型

文献发布时间:2024-04-18 19:44:28



技术领域

本发明涉及分子优化和分子生成技术领域,具体为一种基于遗传算法和分子对接模拟的分子优化模型。

背景技术

一个有效的药物设计流程会产生符合特定标准的药物小分子,如对特定靶标的疗效、药物的安全性、理想的理化性质等。发现具有理想理化性质的新药是一项具有挑战性的任务,事实上,在可合成分子的空间中进行搜索是非常困难的,在化学空间中大约有10

发明内容

本发明的目的是为了解决上述药物发现领域所面临的困难和挑战,提供一种基于遗传算法和分子对接模拟的分子优化模型。能够优化现有药物分子的结构,提高药物分子和靶标的结合亲和力,为药物发现提供新的思路。本发明的技术方案如下:

一种基于遗传算法和分子对接模拟的分子优化模型,其包括专家策略模块、学徒策略模块和分子对接模拟模块:

专家策略模块,专家策略通过对一组分子应用遗传算法(包括变异和交叉),从而产生具有理想理化性质分布的分子。遗传算法主要为基于图的变异和交叉,它们在从头分子设计中展现出了最佳性能。首先从一组分子中随机选择两个亲代分子,然后,根据设定的概率进行环形交叉或非环形交叉,最后,在原子或键的水平上以小概率进行变异。新生成的分子存储于专家策略优先奖励队列中进行评估。

学徒策略模块,学徒策略是一个深度神经网络,经过训练可以生成新的分子。该策略采用Transformer深度神经网络架构,并使用ZINC-250K数据集进行预训练。学徒策略在每个优化步骤中逐一生成新的候选分子,新生成的分子存储于学徒策略优先奖励队列中进行评估,最后用分子对接模拟模块对候选分子进行评估,并选择最优分子作为最终输出。

分子对接模拟模块,分子对接模拟计算专家策略优先奖励队列和学徒策略优先奖励队列中的新分子与特定靶标的对接分数,构建3D结合构象,并更新队列,保留最优对接分数的分子,并为对接姿势的生成和对接后的分析提供一个灵活的模块化框架。

进一步的,所述基于遗传算法和分子对接模拟的分子优化模型的专家策略模块具体包括:

1)对随机选取一组分子随机应用遗传算法,包括变异和交叉操作;

2)变异操作包括原子删除、原子增加、原子插入、原子类型改变、键序改变、环键删除和环键增加七种,交叉操作包括非环交叉和环交叉;

3)将优化后的分子通过RDkit工具进行合法化检验,确保新分子为有效药物分子;

4)通过合法化检验的新分子存储于专家策略优先奖励队列中等待分子对接模拟。

进一步的,所述基于遗传算法和分子对接模拟的分子优化模型的学徒策略模块具体包括:

1)由于SELFIES的鲁棒性更高且可快速优化和调整分子结构,因此首先将数据集中的SMILES字符串转换为SELFIES表示;

2)使用ZINC-250K数据集对Transformer深度神经网络进行预训练并保存最优模型;

3)学徒策略模块根据数据集分布生成新的药物分子,存储于学徒策略优先奖励队列中;

4)根据分子对接模拟模块反馈的对接分数,不断优化学徒策略优先奖励队列并指导模型生成。

进一步的,所述基于遗传算法和分子对接模拟的分子优化模型的分子对接模拟模块具体包括:

1)从RCSBProteinDataBank(PDB)数据库获取特定靶标晶体结构的pdb文件;

2)确定对接程序需要的基本参数,包括对接盒子的中心坐标和体积;

3)进行分子对接模拟,计算新分子与特定靶标的对接分数,构建3D结合构象,并将对接分数反馈给专家策略模块和学徒策略模块。

本发明的有益效果如下:

本发明针对传统的药物发现方法在识别有前景的先导化合物结构方面效率低下,而且费用昂贵的局限性。设计了一种基于遗传算法和分子对接模拟的分子优化模型,借助遗传算法和分子对接模拟,优化现有药物分子结构,提高药物分子和对应靶标的结合亲和力,为药物发现提供新的思路。

本发明具有如下优点:

1)利用深度神经网络和遗传算法,结合分子对接模拟,优化现有药物分子结构,提高药物分子和对应靶标的结合亲和力;

2)利用专家策略和学徒策略相结合的方式,逐步优化分子结构,迭代筛选最优分子队列,最终得到具有最优亲和力分数的分子。

结果表明,所述基于遗传算法和分子对接模拟的分子优化模型可以探索更复杂的分子空间结构,进一步加速药物发现过程。

附图说明

图1是基于遗传算法和分子对接模拟的分子优化模型的生成和验证过程图

具体实施方式

以下结合具体实施方式进一步对本发明的技术方案进行阐述。

本发明为基于遗传算法和分子对接模拟的分子优化模型,能够优化现有药物分子的结构,提高药物分子和靶标的结合亲和力,为药物发现提供新的思路。一种基于遗传算法和分子对接模拟的分子优化模型,专家策略模块、学徒策略模块和分子对接模拟模块,基本步骤如下:

1)专家策略模块,专家策略通过对一组随机选取的分子应用遗传算法(包括变异和交叉),从而产生具有理想理化性质分布的分子。遗传算法主要为基于图的变异和交叉,主要包括7种变异操作和2种交叉操作。首先随机选择两个亲代分子,然后,根据设定的概率进行环形交叉或非环形交叉,最后,在原子或键的水平上以小概率进行变异。

2)学徒策略模块,学徒策略是一个深度神经网络,经过训练可以生成新的分子。该策略采用Transformer深度神经网络架构,并使用ZINC-250K数据集进行预训练。学徒策略选择最优的预训练模型逐一生成新的分子,新生成的分子存储于学徒策略优先奖励队列中进行评估,最后用分子对接模拟模块对候选分子进行评估,并选择最优分子作为最终输出。

3)分子对接模拟模块,计算专家策略优先奖励队列和学徒策略优先奖励队列中的新分子与特定靶标的对接分数,构建3D结合构象,并更新队列,保留最优对接分数的分子,并为对接姿势的生成和对接后的分析提供一个灵活的模块化框架。

具体的,所述基于遗传算法和分子对接模拟的分子优化模型的专家策略模块具体包括:

1)对随机选取的一组分子随机应用遗传算法,包括变异和交叉操作;

2)变异操作包括原子删除、原子增加、原子插入、原子类型改变、键序改变、环键删除和环键增加七种,交叉操作包括非环交叉和环交叉;

3)将优化后的分子通过RDkit工具进行合法化检验,确保新分子为有效药物分子;

4)通过合法化检验的新分子存储于专家策略优先奖励队列中等待分子对接模拟。

具体的,所述基于遗传算法和分子对接模拟的分子优化模型的学徒策略模块具体包括:

1)由于SELFIES的鲁棒性更高且可快速优化和调整分子结构,因此首先将数据集中的SMILES字符串转换为SELFIES表示;

2)使用ZINC-250K数据集对Transformer深度神经网络进行预训练并保存最优模型;

3)学徒策略模块根据数据集分布生成新的药物分子,存储于学徒策略优先奖励队列中;

4)根据分子对接模拟模块反馈的对接分数,不断优化学徒策略优先奖励队列并指导模型生成。

具体的,所述基于遗传算法和分子对接模拟的分子优化模型的分子对接模拟模块具体包括:

1)从RCSBProteinDataBank(PDB)数据库获取特定靶标晶体结构的pdb文件;

2)确定对接程序需要的基本参数,包括对接盒子的中心坐标和体积;

3)进行分子对接模拟,计算生成分子与特定靶标的对接分数,构建3D结合构象,并将对接分数反馈给专家策略模块和学徒策略模块。

所述基于遗传算法和分子对接模拟的分子优化模型,接受药物SELFIES序列作为输入,利用Transformer深度神经网络预训练,所生成的分子利用遗传算法和分子对接模拟进行进一步的优化,以优化现有药物分子得到具有更优亲和力分数的新药物分子。随着后续药物理化性质信息、药物-靶标相互作用信息的扩充,将有更多数据用于所述模型的训练,从而进一步探索更有效的新药设计方法。

以上所述仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载内容之后,技术人员可以对本发明作各种改动与修改,这些等效变化和修饰同样落入本发明权利要求所定的范围。

相关技术
  • 基于遗传算法和分子对接模拟的分子优化模型
  • 基于分子模拟的交联网状结构模型优化方法和装置
技术分类

06120116302789