一种基于归经的中药药方模型建立方法、介质及系统

文献发布时间：2024-04-18 19:58:21

技术领域

本发明属于中药药方技术领域，具体而言，涉及一种基于归经的中药药方模型建立方法、介质及系统。

背景技术

中医学认为,人体经络系统是气血运行和各脏腑功能活动的重要基础,经络学说是中医学特有的理论体系。经络学说把人体看成一个有机统一的整体,通过经络联系脏腑、肢体、皮肤、津液、精气等,组成一个有机的网络系统。因此,研究中药药效与人体经络的关系,对于指导中药的临床应用意义重大。

中医学认为,中药进入人体后,会通过经络而产生远程作用,不同的中药有不同的归经特点。例如苍耳子性寒味甘,能清热消暑,宣肺止咳,主治肺热咳嗽,其归经为肺经。当中药进入人体后,会先从入口处进入相应的经络,再通过经络传导作用到相应脏腑经络,发挥治疗作用。

随着计算机技术的发展,人工智能技术在中医药领域得到广泛应用。如何利用人工智能技术研究中药药效与经络之间的关系,实现智能化的中药处方设计,是当前中医药信息化研究的热点和难点。已有一些研究开始利用机器学习算法探索中药组方规律。例如,有学者采用关联规则挖掘的方法分析中药组方规律；也有学者建立药物相似度模型,用于中药组方设计。例如公开号为CN108899072A的中国发明专利(申请号CN201810546633.0)公开了中药药方推荐方法、装置、计算机设备和存储介质，包括：获取拟诊疾病、拟诊证候和患者信息；查找与拟诊疾病和拟诊证候匹配的中药基本方，获取中药基本方对应的第一方剂数据；查找与患者信息匹配的中药配伍方，获取中药配伍方对应的第二方剂数据；根据第一方剂数据和第二方剂数据生成推荐中药药方。

但是,现有研究大多局限于分析中药组方中的药物组合规律，很少考虑中药的归经作用特点，以致于根据症状生成的药方缺乏归经的考虑，生成的药方治疗效果不佳。

发明内容

有鉴于此，本发明提供一种基于归经的中药药方模型建立方法、介质及系统，解决了根据症状生成的药方缺乏归经的考虑，生成的药方治疗效果不佳的技术问题。

本发明是这样实现的：

本发明的第一方面提供一种基于归经的中药药方模型建立方法，其中，包括如下步骤：

S10、获取全部中药材数据，包括编号、名称、以及属性，其中属性包括四气、五味、归经、功效、毒性、采集部位、加工方法以及使用禁忌；

S20、对所述每一种中药材的属性进行量化；

S30、对完成属性量化后的每一种中药材数据生成中药材向量；

S40、获取多组中药配方及其对应的症状，并将所述中药配方按照中药材使用量及中药材向量形成配方矩阵；

S50、对于每一种症状，利用预先训练好的症状归经模型输出症状归经向量；

S60、对于每一种症状利用其症状归经向量进行分类，得到多组不同症状归经分类的症状数据集；

S70、对于每一组症状数据集，训练一个卷积神经网络模型，作为这一个症状归经分类的药方模型；

S80、建立基于归经的中药药方模型，包括第一模型和第二模型，其中第一模型和第二模型为串联关系，所述第一模型为预先训练好的症状归经模型，所述第二模型包括多个不同症状归经分类对应的药方模型，所述基于归经的中药药方模型使用时，输入数据为症状描述，所述症状描述首先通过第一模型进行归经分类，然后按照归经分类选择对应的药方模型输出药方。

在上述技术方案的基础上，本发明的一种基于归经的中药药方模型建立方法还可以做如下改进:

其中，将所述中药配方按照中药材使用量及中药材向量形成配方矩阵的具体步骤包括：

获取所述中药配方中每个中药材的使用量；

对中药材的向量进行降维，得到中药低维向量；

利用每个中药材的使用量及向量构建配方矩阵,配方矩阵第一列为中药使用量,其余列为中药低维向量；

对得到的配方矩阵进行标准化处理。

其中，所述症状归经模型的建立和训练的步骤，具体包括：

构建症状数据集、收集包含症状描述的病案数据,对症状进行标注和提取,构建症状数据集；

文本特征提取、对于每个症状描述文本,提取文本特征向量；

模型构建和训练、将文本特征向量和对应标注经络作为训练集训练对SVM模型进行训练，得到症状归经模型。

其中，所述对于每一种症状利用其症状归经向量进行分类，得到多组不同症状归经分类的症状数据集的步骤，具体为：比较每一种症状的症状归经向量的元素值,以最大元素对应的维度作为所述症状的归经标签，利用得到的归经标签将对全部的症状数据集进行分类。

其中，所述对于每一组症状数据集，训练一个卷积神经网络模型，作为这一个症状归经分类的药方模型的步骤，具体包括：

针对每一组症状数据集，获取所述症状对应的中药配方数据集；

将所述中药配方数据集表示为配方矩阵；

针对每一组症状数据集，利用卷积神经网络建立药方模型雏形，并进行训练，其中训练的输入为症状数据集中每一种症状，训练的输出为治疗组横装对应的配方矩阵，训练完成后，得到每一组症状数据集对应的药方模型。

其中，所述中药材数据中的编号采用的方法为按照中药材官方名称的拼音顺序，从1开始自增编号。

其中，所述步骤S60中，得到多组不同症状归经分类的症状数据集的组数为12组。

其中，所述第二模型包括12个不同症状归经分类对应的药方模型。

本发明的第二方面提供一种计算机可读存储介质，其中，所述计算机可读存储介质中存储有程序指令，所述程序指令运行时用于执行上述的一种基于归经的中药药方模型建立方法。

本发明的第三方面提供一种基于归经的中药药方模型建立系统，其中，包含上述的计算机可读存储介质。

与现有技术相比较，本发明提供的一种基于归经的中药药方模型建立方法、介质及系统的有益效果是：本发明通过构建症状归经模型,对不同症状进行归经分类,再建立针对不同归经的药方模型,可以充分利用中药的经络作用特点,使处方设计更符合中医药学理论。与现有仅考虑中药组合规律的方法相比,本发明处方设计更能发挥中药的经络特性,更科学合理。解决了根据症状生成的药方缺乏归经的考虑，生成的药方治疗效果不佳的技术问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种基于归经的中药药方模型建立方法的流程图。

具体实施方式

中药归经的原理可以归纳为以下几点:

中医学认为人体存在经脉系统,经脉在体表和体内形成网络循环,连接五脏六腑及全身组织。经络运行状况影响着气血运转和身体各系统的生理功能。

中药进入人体后,会随着经脉网络在体内各处传播,对经脉网路相关部位产生功效。不同的中药有不同的归经倾向性。

中药的归经具有一定的规律性,一般与中药的性味、功效相关。如性寒的中药多归肝经,性热的中药多归心经。能清热的中药多归肺经,能补血的中药多归肝经。

中医认为,选择合适归经特点的中药,可以使中药直接作用于病变部位,发挥治疗作用。如咳嗽症状归属肺经,那么选择归经肺经的止咳平喘药来治疗,效果较好。

中医处方根据不同症状的归经特点采用不同归经倾向的中药组方,可以增强治疗作用。

中医认为,经络系统影响着中药的药效发挥和作用定位。研究中药的归经规律,可以更好地指导临床用药。

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述。

如图1所示，是本发明第一方面提供一种基于归经的中药药方模型建立方法的流程图，本方法包括如下步骤：

S10、获取全部中药材数据，包括编号、名称、以及属性，其中属性包括四气、五味、归经、功效、毒性、采集部位、加工方法以及使用禁忌；

S20、对每一种中药材的属性进行量化；

S30、对完成属性量化后的每一种中药材数据生成中药材向量；

S40、获取多组中药配方及其对应的症状，并将中药配方按照中药材使用量及中药材向量形成配方矩阵；

S50、对于每一种症状，利用预先训练好的症状归经模型输出症状归经向量；

S60、对于每一种症状利用其症状归经向量进行分类，得到多组不同症状归经分类的症状数据集；

S70、对于每一组症状数据集，训练一个卷积神经网络模型，作为这一个症状归经分类的药方模型；

S80、建立基于归经的中药药方模型，包括第一模型和第二模型，其中第一模型和第二模型为串联关系，第一模型为预先训练好的症状归经模型，第二模型包括多个不同症状归经分类对应的药方模型，基于归经的中药药方模型使用时，输入数据为症状描述，症状描述首先通过第一模型进行归经分类，然后按照归经分类选择对应的药方模型输出药方。

针对步骤S20的具体实施方式,可以考虑采用以下方法进行中药材属性的量化:

20.1.四气量化

首先定义四气的量化范围:气值∈[-1,1],其中:

-寒性:-1

-凉性:-0.5

-平性:0

-温性:0.5

-热性:1

对于中药材i,其四气属性用变量气值

20.2.五味量化

定义五味的量化范围:味值∈[0,1],其中:

-酸味:0

-甜味:0.25

-苦味:0.5

-辛味:0.75

-咸味:1

对于中药材i,其五味属性用变量味值

20.3.归经量化

根据中医学,人体主要经络有12条,分别记为:经络

定义归经的量化方式:

如果中药材i不归经,则其所有经络的归经值为0。

如果中药材i归于某经络j,则:

归经值

即中药材i对归经j的归经值设为1,对其他经络的归经值设为0。

归经量化用一个12维向量表示,记为:归经

20.4.功效量化

在中医学中,中药材功效较为复杂,可以考虑选取主要功效分类,每类功效定义一个0-1变量表示中药材是否具有该功效。

例如定义以下功效分类:

-清热功效:功效

-消炎功效:功效

-安神功效:功效

如果中药材i具有该功效,对应变量设为1,否则设为0。

中药材i的功效量化可以用一个向量表示:功效

20.5.毒性量化

根据中医毒性分类,可以定义以下量化:

-无毒:0

-微毒:1

-低毒:2

-中毒:3

-高毒:4

中药材i的毒性用变量毒性

20.6.采集部位量化

可以直接使用one-hot编码对采集部位进行量化。one-hot编码，又称独热编码、一位有效编码。其方法是使用N位状态寄存器来对N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效。

假设采集部位有n种,则中药材i的采集部位量化为一个n维0-1向量:部位

如果中药材i的采集部位为j,则部位

20.7.加工方法量化

同采集部位,可以使用one-hot编码对加工方法进行量化。

假设加工方法有m种,则中药材i的加工方法量化为一个m维0-1向量:加工

如果中药材i的加工方法为k,则加工

20.8.使用禁忌量化

使用禁忌可以由药学专家进行标注,分为若干类别。每类禁忌定义一个0-1变量表示中药材是否有该禁忌。

假设禁忌分类有p种,则中药材i的使用禁忌量化为:禁忌

其中,如果中药材i有第j类禁忌,禁忌

20.9.综合表示，也就是S30对完成属性量化后的每一种中药材数据生成中药材向量：

将上述量化结果综合,可以得到中药材i的属性向量:

属性

该向量综合反映了中药材i的全部属性信息。

在实际应用中,可以根据中医药学专家意见,确定每个量化的具体范围和划分,使其能够合理反映中药材属性特点。同时,也可以采用一些权重对不同属性赋予不同重要性。

其中，在上述技术方案中，将中药配方按照中药材使用量及中药材向量形成配方矩阵的具体步骤包括：

获取中药配方中每个中药材的使用量；

对中药材的向量进行降维，得到中药材低维向量；

利用每个中药材的使用量及向量构建配方矩阵,配方矩阵第一列为中药材使用量,其余列为中药材低维向量；

对得到的配方矩阵进行标准化处理。

对于步骤S40的具体实施方式,可以考虑采用以下方法将中药配方转换为配方矩阵:

40.1.获取配方中每个中药材的使用量

对于配方中中药材i,获取其在该配方中的使用量为：

用量

使用量可以用重量或者剂量表示。

40.2.构建中药材向量

在S30中,每个中药材i已构建了属性向量：

属性

可选的，为简化计算,可以对属性向量进行降维,得到低维的中药材向量：药向量

降维可以采用主成分分析(PCA)等方法。设降维后向量维度为d。

关于降维的步骤，取决于计算机的处理能力，一般的，具有独显的计算机不需要进行降维处理，直接以属性

40.3.构建配方矩阵

对于一个包含n味中药材的配方,提取每个中药材的使用量和中药材向量:

{用量

将中药材向量按照使用量进行加权求和,可以得到该配方的特征表示:

即配方向量是中药材向量的加权和。

转换为矩阵形式,可以构建一个n×(d+1)的配方矩阵:

其中第一列为中药材使用量,后d列为中药材向量。

40.4.构建配方数据集

按照上述方法,可以将收集的多组治疗配方及其症状转换为配方数据集:

数据集＝{配方矩阵

其中标签表示配方对应的症状。

40.5.配方矩阵标准化

考虑不同配方中药材使用量差异较大的情况,可以对配方矩阵进行列归一化,即对除第一列外的其余向量列进行标准化:

这可以消除每个中药材向量维度的量纲影响。

第一列用量可以保留原值,或进行归一化至[0,1]范围。

40.6.引入注意机制

可选的，由于不同中药材在配方症状中的重要性不同,可以考虑在配方矩阵中加入注意机制,通过注意向量自动学习不同中药材的重要性权重。

具体是在配方矩阵基础上,加入一个注意向量:

注意向量通过神经网络优化学习得到,表示每个中药材在配方治疗当前症状中的作用权重。

40.7.多实例学习

可选的，考虑到每个症状可能对应多个治疗配方,可以构建以症状为中心的多实例样本:

样本

即每个样本包含多个治疗该症状的不同配方。

这符合多实例学习设置,可以训练出明确区分不同症状的模型。

上述是构建中药配方矩阵的一种可行方法。实际应用中,配方的表示可以根据需求进行设计,要保证最大程度保留配方的组成信息。关键是学习配方中不同中药材的组合规律和作用机理。配方矩阵提供一种定量表达配方的方式,为基于机器学习的中医药方研究提供了重要支撑。

其中，在上述技术方案中，症状归经模型的建立和训练的步骤，具体包括：

构建症状数据集、收集包含症状描述的病案数据,对症状进行标注和提取,构建症状数据集；

文本特征提取、对于每个症状描述文本,提取文本特征向量；

模型构建和训练、将文本特征向量和对应标注经络作为训练集训练对SVM模型进行训练，得到症状归经模型。

针对步骤S50中症状归经模型的建立和训练,可以考虑采用以下方法:

50.1.构建症状数据集

收集包含症状描述的病案数据,对症状进行标注和提取,构建症状数据集:

D＝{(症状描述

其中症状描述为自然语言文本，标注归经为根据中医理论由专家标注的该症状所属的主要经络。

50.2.文本特征提取

对于每个症状描述文本x

-词袋模型：基于词频构建定长向量x

(1)将症状描述文本进行分词，提取出所有词；

(2)统计每个词在整个症状描述文本数据集中的词频，构建一个大小为词汇表大小N的向量，其中每个元素为对应词的词频；

(3)对于一个症状描述x

(4)x

-TF-IDF向量：基于TF-IDF权重构建定长向量x

(1)计算每个词的TF-IDF权重，设词ζ的TF-IDF权重为tfidf(ζ)；

(2)对于一个症状描述x

(3)x

-词向量：通过Word2Vec等方法构建词向量并求均值得到句向量x

(1)通过Word2Vec等方式预训练词向量，每个词j的词向量为w(ζ)；

(2)对于一个含m个词的症状描述x

(3)x

拼接各文本特征，得到症状文本的语义文本特征向量：

50.3.模型构建

-多分类模型

将文本特征向量x

可以选择适当的多分类模型进行训练，如Softmax回归或支持向量机SVM模型。

其中，支持向量机(SVM)

使用one-vs-rest策略构建12个二分类SVM模型，第k个模型区分类别k和其他类别。最终通过12个SVM模型进行投票得到预测经络。

-处理类别不平衡

由于12个经络类别分布可能不平衡，可以采用过/欠采样处理：

(1)随机过采样增多少数类样本。

(2)欠采样删除多数类样本。

(3)SMOTE算法合成少数类样本。

使不同经络类别样本数量接近,以减少类别不平衡对模型训练的影响。

通过上述方法,可以构建出合理的症状文本多分类模型,实现对症状描述的自动归经。

50.4.模型集成

可选的，可以构建多个基学习器,进行模型集成,提高归经预测的稳定性。

例如采用Bootstrap集成多个决策树模型，具体是：

(1)使用Bootstrap采样方法从训练集中有放回的采样形成多个新训练集。

(2)在每个新训练集上训练决策树模型,得到多个基学习器。

(3)在测试时,多个决策树基学习器进行投票,选择投票数最多的类别作为最终预测。

(4)模型集成可以提高准确率,并减少过拟合。

其中，Bootstrap的定义是利用有限的样本经由多次重复抽样，建立起充足的样本，在机器学习中解决了样本不足的问题。Bootstrap是非参数统计方法，其实质是对观测信息进行再抽样，进而对总体的分布特性进行统计推断。

50.5.注意机制

可选的，可以引入注意机制,允许模型自动学习不同词对归经预测的重要性权重。

具体是：

(1)输入层到隐层加入注意层,学习注意向量α

(2)对输入文本特征向量做加权:x

(3)通过注意机制学习不同词对于分类的重要性权重。

50.6.知识图谱引导

可选的，根据中医知识图谱,引入症状之间的关系知识来约束和指导模型训练。

结合医学本体知识,构建基于知识图谱的症状归经模型，具体是：

(1)构建症状关系知识图谱,连接同经络症状。

(2)图谱中连接的症状加入类内损失,迫使模型预测结果与知识图谱保持一致。

(3)知识图谱通过远程监督引导模型训练。

(4)结合医学本体知识进行症状表示学习。

也可以使用市场上已经构件号的只是图片模型。

50.7.模型迭代

可选的，通过增量训练等方式持续从新数据中学习,迭代优化症状归经模型。

其中，在上述技术方案中，对于每一种症状利用其症状归经向量进行分类，得到多组不同症状归经分类的症状数据集的步骤，具体为：比较每一种症状的症状归经向量的元素值,以最大元素对应的维度作为症状的归经标签，利用得到的归经标签将对全部的症状数据集进行分类。

其中，在上述技术方案中，对于每一组症状数据集，训练一个卷积神经网络模型，作为这一个症状归经分类的药方模型的步骤，具体包括：

针对每一组症状数据集，获取症状对应的中药配方数据集；

将中药配方数据集表示为配方矩阵；

其中，在上述技术方案中，中药材数据中的编号采用的方法为按照中药材官方名称的拼音顺序，从1开始自增编号。

其中，在上述技术方案中，步骤S60中，得到多组不同症状归经分类的症状数据集的组数为12组。

其中，在上述技术方案中，第二模型包括12个不同症状归经分类对应的药方模型。

本发明的第三方面提供一种基于归经的中药药方模型建立系统，其中，包含上述的计算机可读存储介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：青岛市市立医院;

上一篇：一种房屋建设施工除尘装置
下一篇：基于卷积图注意力深度神经网络的短期风功率预测方法