一种华法林给药剂量预测方法及系统

文献发布时间：2024-04-18 19:59:31

技术领域

本发明涉及计算机技术领域，具体来说涉及一种华法林给药剂量预测方法及系统。

背景技术

血管栓塞是一种常见的导致心血管疾病患者致死致残的因素。临床上，采用华法林给药治疗是一种较为有效的抗凝治疗手段。而华法林是一种典型的窄治疗指数药物(NTIDs)，如用药量不当易导致抗凝效果差或者导致出血等不良症状，因此临床操作上需要通过监测凝血水平：PT和INR，以保证稳定的抗凝效果。现有技术中，对华法林给药剂量的预测模型建立方法包括：国际华法林基因组学联合会建立的华法林给药算法(IWPC模型)，以及通过多元线性回归分析、统计学分析等方法构建的Huang、Ohno、Gage模型。目前的华法林剂量智能预测模型大多采用简单的模型结构进行训练，这样的选择能让网络快速收敛，避免梯度爆炸的可能，但是非线性拟合能力受到了限制，在对华法林剂量的预测过程中容易受到数据集中特殊样本的影响：具体来说，在若干模型中服用常规剂量华法林的抗凝患者者占数据集的大多数，而对华法林敏感度相对更低或更高的抗凝患者预测得到的结果准确度要远低于中剂量组。因此，现有的预测方法在针对抗凝患者所形成的剂量预测尚不可靠，不利于辅助医生做出正确的治疗决策。因此，如何开发出一种新的华法林给药剂量预测方法及系统，以克服上述问题是本领域技术人员需要研究的方向。

发明内容

本发明的第一个技术目的在于提供一种华法林给药剂量预测方法，能够提升对抗凝患者得华法林给药剂量得预测准确性，以帮助医生做出正确的治疗决策。

本发明的第二个技术目的在于提供一种实现上述预测方法的华法林给药剂量预测系统。

本发明提供的第一种技术方案是一种华法林给药剂量预测方法，其包括：

步骤100：采集患者数据，所述患者数据包括临床数据和药物数据，所述药物数据包括患者的华法林用药剂量和INR检测值；

步骤200：对所述患者数据进行预处理、形成预处理数据；所述预处理包括缺失值处理及数值归一化处理；

步骤300：将所述预处理数据中除所述患者的华法林剂量和INR检验值以外的所有变量作为输入、进行华法林剂量值预测，并将取得的预测剂量值按照其数值大小进行分组，根据分组结果确定患者对应的虚拟剂量；

步骤400：根据分组结果将所述预处理数据中除INR检验值以外的所有变量以及所述虚拟剂量输入到对应于分组结果的INR预测组、并基于BP神经网络进行INR值预测，确定患者对应的INR预测值。

优选的是，所述临床数据包括：

临床定性数据，所述临床定性数据包括：患者性别、患者吸烟情况及患者饮酒情况；

临床定量数据，所述临床定量数据包括：患者年龄数据、患者身高、患者体重、患者血常规数据、患者尿常规数据、患者肾功能数据、患者肝功能数据以及患者微生物检验数据；

所述药物数据包括：CYP2C9、CYP4F2、V433M和VKORC1的药物检测数据。

优选的是，所述步骤200包括：

步骤210：将所述患者数据进行汇总、建立患者的原始数据库；

步骤220：将所述临床定性数据进行数值化处理；

步骤230：将所述原始数据库中的缺失值进行填充处理。

优选的是，所述步骤230包括：

步骤231：对缺失信息的患者进行标记，将数据库划分为数据未缺失部分和数据存在缺失部分，并将缺失同一类数据的患者编为一组；

步骤232：将每组缺失值的各个患者的数据作为所述数据未缺失部分的数据中心进行聚类算法：设身高数据缺失组中有n例患者，则所述数据未缺失部分以所述n例患者为中心分为n个组别，使所有组别的各个数据与数据中心的欧氏距离总和达到最小；

步骤233：取得各组别中距离所述数据中心最近的一半数量的数据的平均值，将所述平均值作为缺失值进行填充处理。

优选的是，所述步骤300包括：

将所述预处理数据中除所述患者的华法林剂量和INR检验值以外的所有变量作为输入、基于径向基函数神经网络，

进行华法林剂量值预测，并将取得的预测剂量值按照其数值大小进行分组，根据分组结果确定患者对应的剂量组别；

其中，所述径向基函数神经网络的核函数采用高斯函数，其数据中心设定为3、其宽度基于患者数据根据σ

为实现上述预测方法，本发明提供的第二种技术方案是一种华法林给药剂量预测系统。

其包括：

数据采集模块，所述数据采集模块用于采集患者数据，所述患者数据包括临床数据和药物数据，所述药物数据包括患者的华法林用药剂量和INR检测值；

数据处理模块，所述数据处理模块用于对所述患者数据进行预处理、形成预处理数据；所述预处理包括缺失值处理及数值归一化处理；

预测分组模块，所述预测分组模块用于将所述预处理数据中除所述患者的华法林剂量和INR检验值以外的所有变量作为输入、进行华法林剂量值预测，并将取得的预测剂量值按照其数值大小进行分组，根据分组结果确定患者对应的虚拟剂量；

INR预测模块，所述INR预测模块用于根据分组结果将所述预处理数据中除INR检验值以外的所有变量以及所述虚拟剂量输入到对应于分组结果的INR预测组、并基于BP神经网络进行INR值预测，确定患者对应的INR预测值。

与现有技术相比，本发明取得了如下技术进步：

首先，本发明通过预测患者的华法林药物剂量，减少了患者前期调整药量和反复血液化验的环节，缩短了患者的治疗周期，

其次，本发明在进行INR预测之前，利用径向基函数网络的局部逼近能力建立一个分类模型对患者可能所需的剂量水平进行预测分组，进一步提升了可靠性和准确性。

附图说明

图1为实施例1的模块示意图。

图中，各附图标记对应部件名称如下：

500、数据采集模块；600、数据处理模块；700、预测分组模块；800、INR预测模块。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

实施例1，请参考图1：

一种华法林给药剂量预测系统。其包括：数据采集模块500，数据处理模块600，预测分组模块700和INR预测模块800。其中：

所述数据采集模块500用于采集患者数据，所述患者数据包括临床数据和药物数据，所述药物数据包括患者的华法林用药剂量和INR检测值；

所述数据处理模块600用于对所述患者数据进行预处理、形成预处理数据；所述预处理包括缺失值处理及数值归一化处理；

所述预测分组模块700用于将所述预处理数据中除所述患者的华法林剂量和INR检验值以外的所有变量作为输入、进行华法林剂量值预测，并将取得的预测剂量值按照其数值大小进行分组，根据分组结果确定患者对应的虚拟剂量；

所述INR预测模块800用于根据分组结果将所述预处理数据中除INR检验值以外的所有变量以及所述虚拟剂量输入到对应于分组结果的INR预测组、并基于BP神经网络进行INR值预测，确定患者对应的INR预测值。

基于上述系统，实现一种华法林给药剂量预测方法，其包括以下步骤：

第一步，采集患者的临床数据与药物数据。其中，

所述患者的临床数据是指：患者的性别、年龄、身高、体重、吸烟情况、饮酒情况、血常规、尿常规、肾功能、肝功能、微生物检验等检验数据，其中，定性的数据：包括性别、吸烟情况、饮酒情况。定量的数据包括：年龄、身高、体重、血常规、尿常规、肾功能、肝功能、微生物检验数据。

所述药物数据包括从患者电子病历获得患者的每日用药量，INR检验值；还包括由患者的基因检测报告收集得到遗传数据，其具体包括：CYP2C9、CYP4F2、V433M和VKORC1的药物检测数据。

第二步，对采集到的上述数据进行预处理、形成预处理数据；

首先，将上述采集到的临床数据与药物数据汇总，建立原始患者数据库。

将性别参量转为二实数值；

将患者年龄、身高、体重、血常规、尿常规、肾功能、肝功能、微生物检验数据等定量数据进行归一化；

对遗传数据进行数值化处理，如基因型数据进行数值化处理，例如某位服药者的CYP2C9*2基因型为野生型输入100，杂合突变型输入010，纯合突变型输入001，否则为0。性别男则设为1，性别女则设置为2，吸烟及饮酒情况，存在则为1，不存在则为0。

对数据库中的缺失值进行填补处理：

首先，对缺失信息的患者进行标记，将数据库划分为数据未缺失部分和数据存在缺失部分，并将缺失同一类数据的患者编为一组；将每组缺失值的各个患者的数据作为所述数据未缺失部分的数据中心进行聚类算法：设身高数据缺失组中有n例患者，则所述数据未缺失部分以所述n例患者为中心分为n个组别，使所有组别的各个数据与数据中心的欧氏距离总和达到最小；取得各组别中距离所述数据中心最近的一半数量的数据的平均值，将所述平均值作为缺失值进行填充处理。

第三步，进行分组预测：

将性别、年龄、身高、体重、吸烟情况、饮酒情况、血常规、尿常规、肾功能、肝功能、微生物检验等检验数据、CYP2C9、CYP4F2、VKORC1等基因数据共同作为输入变量，将患者所需华法林日剂量作为预测量，基于径向基函数神经网络进行华法林剂量值预测；

根据预测得到的华法林日剂量的数值划分为低剂量、中剂量和高剂量三个组别；

将患者依据其预测华法林日剂量值所属的剂量组别，赋予患者所述分为所在组别区间赋予该患者对应的虚拟华法林剂量，以作为下一步INR预测的输入值。

第四步，INR值预测：

根据患者所处剂量组别情况，将此时需要预测的患者的数据输入到对应剂量水平的INR预测模块800，此模块的输入数据为性别、年龄、身高、体重、吸烟情况、饮酒情况、血常规、尿常规、肾功能、肝功能、微生物检验等检验数据、CYP2C9、CYP4F2、VKORC1基因型数据，赋予该患者对应的虚拟华法林剂量，基于BP神经网络进行INR值预测，以确定患者对应的INR预测值。

本例中：分组预测基于预测组选择器基于径向基函数神经网络，华法林剂量的INR预测基于BP神经网络。其中：

所述径向基函数神经网络的核函数采用高斯函数，其数据中心设定为3、其宽度基于患者数据根据σ

所述INR预测模块800的权重与偏置在训练前通过正态随机值初始化，激活函数选用sigmoid函数，损失函数使用弹性网络正则化，一种用于线性回归的正则化技术，用于克服套索回归(Lasso Regression)和岭回归(Ridge Regression)技术的局限性。它结合了L1(Lasso)和L2(Ridge)正则化损失，以实现稀疏性和偏差—方差权衡之间的平衡。通过添加L1和L2损失，鼓励系数估计中的稀疏性，从而产生更简单、更易于解释的模型。

具体计算方法为：

其中，n为样本数量，y_i样本i真实值，x_i为样本i的输入，w为需要正则化的回归系数，λ和ρ为控制L1与L2正则化强度的弹性系数，取值范围[0,1]，‖w‖_1和‖w‖_2分别为向量w的L1与L2正则化范数。

网络超参数的设置为：隐含层的层数为2层，各层神经元数量分别为128和32个，学习率为0.0001，迭代次数为5000次。

取真实患者样本200人，分别采用本发明所述预测方法及传统的多元回归模型进行华法林剂量值预测的比对实验。

实验结果为：采用本发明所述预测方法在测试集的最终预测结果能够达到68.7％的准确率，相比现有技术中多元回归模型准确率平均提高66.9％，因此本发明的华法林给药剂量预测系统相对于现有技术进一步提升了INR预测的准确率，有利于实现辅助医生进行治疗决策。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：上海市杨浦区市东医院;

上一篇：一种便于对元件维修的电力柜
下一篇：一种带有压力测试结构的胶管总成成型机