掌桥专利:专业的专利平台
掌桥专利
首页

面向SRS联合用药不良反应信号的强信号筛选方法

文献发布时间:2023-06-19 09:54:18


面向SRS联合用药不良反应信号的强信号筛选方法

技术领域

本发明涉及信号筛选技术领域,尤其涉及一种面向SRS联合用药不良反应信号的强信号筛选方法,SRS表示药物不良事件自发呈报系统。

背景技术

受限于实验范围、研究对象及时间等因素,上市前阶段不可能完成所有联合用药相互作用的研究,许多潜在的药物相互作用只有在药品上市后大范围、长时间使用过程中才发现。药物不良事件自发呈报系统(Spontaneous Reporting System,SRS)为上市后药物相互作用信号筛选提供了重要的数据来源。例如美国FDA不良事件报告系统(FDA AdverseEvent Reporting System,FAERS)等,真实反应了现实生活中用药安全的复杂性,据调查,其60%的不良事件报告中患者用药多于一种,70%的报告中患者发生的不良事件多于一种,84%的报告中患者用药或发生不良事件的总数至少3种。这些特点给联合用药不良反应信号筛选带来机遇和挑战。

为了突破“数据海量、信息匮乏”的困境,主流研究利用计算机在自发呈报系统数据中批量发掘联合用药不良反应信号。信号包含两个要素:药物组合D及目标不良反应AE。药物组合是一个药品集合,也可称为组合用药或联合用药。若药物组合D是不良反应AE的信号,则意味着当病患同时服用D中的全部药品时可能会产生目标不良反应AE。当AE确定时,信号可表述为药物组合。需要指出的是,信号只是一种线索,并不能证明药物组合与不良反应之间存在因果关系,这需要更完备的医药实验及机制分析来确认,能够被确认的信号称为阳性信号,不能被确认的称为假阳性信号。信号中阳性信号占比越高,则说明信号挖掘的质量越高。其中,信号强度度量是信号筛选的关键。非均衡性测量是信号度量的基本思路,即所关注事件与其他事件相比较而言的“非均衡性”或“不相称性”。包括频数法和贝叶斯法两大类,频数法包括相对危险比(RR),比例报告比值(PRR)、报告比值比(ROR)等,贝叶斯法包括贝叶斯置信度递进神经网络(BCPNN),经验贝叶斯伽玛泊松分布缩减法(MGPS)、BCPNN高维扩展版、以及Ω收缩测量法等。上述方法各有优势,但整体而言,存在信号线索量大且准确率低(4%)的共性问题,无法真正发挥大数据优势,这个缺陷在高阶联合用药不良反应信号筛选时会更加凸显。这是因为现实生活中的药物联用模式非常复杂,,而已知的非均衡性测量方法评估信号不良反应风险时假设用药独立不相关,只评价其药物组合本身,不考虑其他联合用药的影响,这使得与阳性信号日常联用的其他药物(组合)也可能被评估为假阳性信号。此缺陷会导致信号强度(不良反应风险评估结果)不能反应信号的可信度,信号强度高不代表信号被核实成功的概率高。如何从这些信号中筛选可信度更高的信号,对提升信号筛选质量、加速药物不良反应信号的确认和发现具有重要意义。目前尚无类似研究工作可借鉴。

发明内容

(一)要解决的技术问题

针对上述问题,本发明提供一种面向SRS联合用药不良反应信号的强信号筛选方法,综合分析信号之间共有的不良反应病患报告对信号强度的影响,将在一定数量病患中信号强度(不良反应风险)高于其他全部信号的信号标记为强信号,以提高信号推荐的质量。

(二)技术方案

基于上述的技术问题,本发明提供一种面向SRS联合用药不良反应信号的强信号筛选方法,所述方法包括以下步骤:

S1、令待处理集合Z=X,循环轮次t=1,第t轮循环时的已知强信号集合Y

S2、判断Z是否为空集,若是,则进入步骤S7,否则进入步骤S3;

S3、遍历Z,基于SRS数据和Y

S4、判断Z是否为空集,若是,则进入步骤S7,否则进入步骤S5;

S5、遍历Z,令第t轮循环的最强信号

S6、令Z=Z-{D

S7、令S=Y

进一步的,所述步骤S3包括:

S3.1、令Max_CI

S3.2、针对Z中未遍历过的信号D,基于SRS数据计算CC(D,Y

其中,

S3.3、令Z=Z-{D},进入步骤S3.6;

S3.4、以D作为索引将QQ(D,Y

S3.5、判断是否QQ(D,Y

S3.6、判断遍历Z是否结束,若是,则进入步骤S4,否则进入步骤S3.2。

进一步的,步骤S5包括:

S5.1、令Max_CI=Max_CI

S5.2、针对Z中未遍历过的信号D,判断是否

S5.3、以D为索引从信号强度字典R读取QQ(D,Y

S5.4、判断遍历Z是否结束,若是,则进入步骤S6,否则进入步骤S5.2。

进一步的,所述支持剔除若干信号病患数据的信号度量函数

进一步的,所述数据获取自药物不良事件自发呈报系统SRS的人口学信息、用药信息、药物不良反应的信息。

进一步的,所述判定为不良反应信号的药物组合的方法包括:若来自药物组合D的用药病患上报的目标不良反应信号AE的次数大于支持度阈值;药物组合D的长度不大于联合用药信号长度阈值MAX_D;根据病患集合PS的SRS数据得到的D作为目标不良反应信号AE的信号强度置信区间的下界Q(PS,D,AE).CI

进一步的,所述Q(PS,D,AE)为非均衡度量类的信号度量函数,采用的度量方法包括RR、PRR、RoR、BCPNN、MGPS。

进一步的,所述预处理包括对数据去重,对药物名称进行规范化。

本发明还公开了一种服务器,包括:

至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行所述的面向SRS联合用药不良反应信号的强信号筛选方法。

本发明还公开了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行所述的面向SRS联合用药不良反应信号的强信号筛选方法。

(三)有益效果

本发明的上述技术方案具有如下优点:

(1)本发明假定第t轮循环时的信号排除集为Y

(2)本发明以置信区间的上下界的加和作为评价指标,相比于仅以置信区间的下界作为评价指标,选择的强信号更为准确;

(3)本发明通过不良反应报告数阈值θ和强信号强度阈值β首先剔除不可能成为强信号的信号,减少了运算量,提高运算效率。

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:

图1为本发明实施例的面向SRS数据的联合用药不良反应强信号筛选方法的整体流程示意图;

图2为本发明实施例面向SRS联合用药不良反应信号的强信号筛选方法的流程示意图;

图3为本发明实施例步骤S3的流程示意图;

图4为本发明实施例步骤S5的流程示意图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

本发明以FAERS发布的不良事件报告文件分析联合用药出血的不良反应强信号的筛选方法,如图1所示,包括:

第I阶段通过药物不良事件自发呈报系统SRS获取数据并预处理:通过药物不良事件自发呈报系统SRS获取数据,对数据去重,对药物名称进行规范化,选定目标不良反应AE。这是所有信号筛选工作的基础和前提。数据预处理之后,用于后两个阶段的信号分析。为便于下文表述,定义以下符号:令SRS中全部病患集合记为PS={p

获取FAERS 2018年三季度数据发布的不良事件报告文件,得到420,915个病例报告,1,651,966条用药记录(包括51083种药物名称),以及1,329,530条不良反应事件记录(涵盖11,944种不良反应事件),整合其中的通过病例ID关联的人口学信息、用药信息、药物不良反应,将药物不良反应名称和药品名称进行规范化处理。选定出血事件为目标不良反应AE,涉及194中不良反应事件(均可归纳为出血事件,但表述不同),共有19,067条出血事件记录。

第II阶段筛选联合用药不良反应信号:对于选定的SRS数据和目标不良反应AE,筛选联合用药不良反应信号,获得联合用药不良反应信号集合X={D

表1典型信号度量方法及其置信区间选择

使用FAERS 2018年三季度数据筛选联合用药出血事件信号,令支持度阈值Support=20,长度阈值MAX_D=2,信号度量函数Q(.)采用报告比值比RoR,信号强度阈值δ=2,共得到419个联合用药出血事件信号。

第III阶段从所述联合用药不良反应信号集合中筛选强信号,将一定数量病患中信号强度(导致药物不良反应的风险)高于其他全部信号的信号标记为强信号。该阶段有两个关键参数:不良反应报告数阈值θ、强信号强度阈值β。

鉴于信号之间共有的不良反应病患报告对信号强度评估的影响,信号强度并不适合作为筛选信号的依据。经分析,本发明认为高强度信号与低强度信号之间共有的不良反应病患报告会抬高低强度信号的信号强度评估值,这是造成假阳性信号(事实上与药物不良反应无关的信号)的重要原因。对此,本发明将一定数量病患中信号强度(导致药物不良反应的风险)高于其他全部信号的信号标记为强信号。将强信号集合记为S。尽管强信号难以识别。但是,在强信号集合S及其中各个强信号的强度已知的情况下,可得到以下推论:

假定信号D为强信号,且给定强信号子集Y,Y包含了信号强度大于D的强信号,则在病患集合

根据此推论,本申请设计了基于贪心求解策略的强信号筛选方法。假定求解过程中已累计发现t个强信号,当前的强信号集合记为Y

为了便于介绍强信号的选取方法,进行以下函数定义。对于给定信号D,及信号集合Y

本发明使用QQ(.,.)评估信号强度。通过QQ(.,.)得到信号强度置信区间[CI

对信号D

对于给定信号集合Y

(i)对Z中每个信号D评估QQ(D,Y

(a)CC(D,Y

(b)QQ(D,Y

(ii)以CI

(iii)以CI

综上,针对前两个阶段得到的SRS数据、信号集合X,本阶段设定信号度量方法Q、不良反应报告数阈值θ、以及强信号强度阈值β等参数后进行分析,输出为强信号集合S。具体实施流程如下,如图2所示:

S1、令待处理集合Z=X,循环轮次t=1,第t轮循环时的已知强信号集合Y

S2、判断Z是否为空集,若是,则进入步骤S7,否则进入步骤S3;

若Z为空集,则信号集合X已全部处理;

S3、遍历Z,基于SRS数据和Y

如图3所示,包括以下步骤:

S3.1、令Max_CI

S3.2、针对Z中未遍历过的信号D,基于SRS数据计算CC(D,Y

S3.3、令Z=Z-{D},进入步骤S3.6;

S3.4、以D作为索引将QQ(D,Y

S3.5、判断是否QQ(D,Y

S3.6、判断遍历Z是否结束,若是,则进入步骤S4,否则进入步骤S3.2;

步骤S3.2、S3.3根据上述求解当前信号强度最高的信号的步骤(i),剔除不具备评定强信号资格的信号,减少步骤S3.2中的计算;步骤S3.5根据上述求解当前信号强度最高的信号的步骤(ii),以CI

S4、判断Z是否为空集,若是,则进入步骤S7,否则进入步骤S5;

S5、遍历Z,令第t轮循环的最强信号

步骤S5根据上述求解当前信号强度最高的信号的步骤(iii),以CI

S5.1、令Max_CI=Max_CI

S5.2、针对Z中未遍历过的信号D,判断是否

S5.3、以D为索引从信号强度字典R读取QQ(D,Y

S5.4、判断遍历Z是否结束,若是,则进入步骤S6,否则进入步骤S5.2;

S6、令Z=Z-{D

从而将第t轮循环的最强信号并入第t+1轮循环时的信号排除集。

S7、令S=Y

假定第t轮循环时的信号排除集为Y

针对上一阶段得到的419个联合用药出血事件信号,令信号度量函数Q(.)采用报告比值比RoR、不良反应报告数阈值θ=4、以及强信号强度阈值β=1,共得到63个强信号。选取药品知识库DrugBank及科研文库PubMed、Medline中提示的出血事件信号作为阳性信号库,鉴于阳性信号库并未在联合用药不良反应信号筛选和本发明中使用,因此,在同等零知识条件下,阳性信号占比可用于评价信号质量。来自二阶段的419个信号中有阳性信号53个(占比12.7%),而来自本发明的63个强信号中有阳性信号29个(占比46%)。可见,本发明提出的强信号筛选方法,显著提高了信号推荐的质量。

该方法可以单独用于联合用药不良反应信号分析,也可以结合面向SRS联合用药不良反应信号的存疑信号挖掘方法和/或面向SRS联合用药不良反应信号的等价信号挖掘方法协同使用。三种方法均是分析信号与信号之间的关系,但目标各有侧重,强信号筛选是找出阳性信号线索,存疑信号挖掘是找出假阳性信号线索,等价关系信号挖掘是找出数据高度一致的信号线索,这些线索各自有利于提升信号分析质量。建议先进行等价关系信号挖掘再进行强信号筛选、存疑信号挖掘执行。等价关系信号挖掘方法得到最大等价组集合,每个最大等价组中仅需选择一个信号参与后续分析,可降低整个分析流程的计算开销。

最后需要说明的是,上述的方法可以转换为软件程序指令,既可以使用包括处理器和存储器的控制系统来运行实现,也可以通过非暂态计算机可读存储介质中存储的计算机指令来实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

综上可知,通过上述的一种面向SRS联合用药不良反应信号的强信号筛选方法,具有以下优点:

(1)本发明假定第t轮循环时的信号排除集为Y

(2)本发明以置信区间的上下界的加和作为评价指标,相比于仅以置信区间的下界作为评价指标,选择的强信号更为准确;

(3)本发明通过不良反应报告数阈值θ和强信号强度阈值β首先剔除不可能成为强信号的信号,减少了运算量,提高运算效率。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

相关技术
  • 面向SRS联合用药不良反应信号的强信号筛选方法
  • 面向SRS联合用药不良反应信号的存疑信号挖掘方法
技术分类

06120112343813