掌桥专利:专业的专利平台
掌桥专利
首页

药品评审结果的预测方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 09:30:39


药品评审结果的预测方法、装置、电子设备和存储介质

技术领域

本申请涉及数据处理技术领域,尤其涉及一种药品评审结果的预测方法、装置电子设备和存储介质。

背景技术

企业需要对市场和自身项目提前预测,方便做更周密的战略规划。企业在调研竞争情报、产品立项及药品注册时,总要回答一个问题:目标药品在注册申报之后获取审评通过(即获批临床、获批上市等)的概率有多大?什么时间能完成审评?而药品获得审评结论受很多主客观因素的影响,例如:药品本身的研发难度、企业研发工作的规范程度、审评受理号的排队积压数量、各专业审评部门的人力资源与任务饱满状况、药品注册材料的完善程度、企业在审评部门提出补充资料要求后的回复速度,以及医药相关政策及变化等等,都会影响审评通过率及审评结论。目前尚无有效公开方法,可以回答上述问题。

因此,鉴于企业缺乏有效评估方法,且难以获得全部数据研究与评估数据,相关人员在预测药品审评通过概率及评估审评结束日期时,只能依赖个人有限经验,花费大量的精力和时间来主观判断,尚不能得到客观可靠的理想结果。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本申请的第一个目的在于提出一种药品评审结果的预测方法,以实现减少药品评审结果的预测成本,提高预测准确度,解决现有技术中在预测药品审评通过概率及评估审评结束日期时,只能依赖个人有限经验,花费大量的精力和时间来主观判断,尚不能得到客观可靠的理想结果的技术问题。

本申请的第二个目的在于提出一种药品评审结果的预测装置。

本申请的第三个目的在于提出一种计算机设备。

本申请的第四个目的在于提出一种非临时性计算机可读存储介质。

本申请的第五个目的在于提出一种计算机程序产品。

为达上述目的,本申请第一方面实施例提出了一种药品评审结果的预测方法,包括:

获取目标时间段内与n个字段值相同的原始数据总数;其中,所述n为大于1的正整数;

获取所述目标时间段内与所述n个字段值相同的通过药品审评的历史数据总数;

根据所述原始数据总数和所述历史数据总数计算药品评审结果。

本申请实施例的药品评审结果的预测方法,通过获取目标时间段内与n个字段值相同的原始数据总数;其中,n为大于1的正整数;获取目标时间段内与n个字段值相同的通过药品审评的历史数据总数;根据原始数据总数和历史数据总数计算药品评审结果。由此,减少药品评审结果的预测成本,提高预测准确度。

在本申请的一个实施例中,所述获取目标时间段内与n个字段值相同的原始数据总数,包括:

获取所述目标时间段内的所有数据;

根据所述n个字段值对所述所有数据进行分组,将与所述n个字段值均相同的数据划分为一组,得到同类药品品种数据;

对分组后的各个同类药品品种数据进行求取总数,得到所述原始数据总数。

在本申请的一个实施例中,所述获取所述目标时间段内与所述n个字段值相同的通过药品审评的历史数据总数,包括:

获取所述目标时间段内的通过评审的所有数据;

根据所述n个字段值对所述通过评审的所有数据进行分组,将与所述n个字段值均相同的数据划分为一组,得到同类药品品种通过评审的数据;

对分组后的各个同类药品品种通过评审的数据进行求取总数,得到所述通过药品审评的历史数据总数。

在本申请的一个实施例中,所述根据所述原始数据总数和所述历史数据总数计算药品评审结果,包括:

获取每个同类药品品种的原始数据总数和通过审评的历史数据总数;

计算所述每个同类药品品种的通过审评的历史数据总数与所述原始数据总数的比值,获取所述药品评审结果。

在本申请的一个实施例中,所述药品评审结果的预测方法,还包括:

计算每个同类药品品种中每条数据的审评周期;

根据所述每条数据的审评周期计算获取审评结论日期。

在本申请的一个实施例中,在所述获取目标时间段内与n个字段值相同的原始数据总数之前,还包括:

从数据库获取公开原数据;

根据预先建立的数据字典对所述公开原数据进行处理,获取与药品审评预测相关的标准字段值。

在本申请的一个实施例中,所述药品评审结果的预测方法,还包括:

获取每个标准字段值的属性值;

根据相关性分析公式对所述每个标准字段值的属性值进行计算,获取标准字段值之间的相关数值;

根据所述标准字段值之间的相关数值与预设阈值,从所述标准字段值中获取所述n个字段值。

为达上述目的,本申请第二方面实施例提出了一种药品评审结果的预测装置,包括:

第一获取模块,用于获取目标时间段内与n个字段值相同的原始数据总数;其中,所述n为大于1的正整数;

第二获取模块,用于获取所述目标时间段内与所述n个字段值相同的通过药品审评的历史数据总数;

计算模块,用于根据所述原始数据总数和所述历史数据总数计算药品评审结果。

本申请实施例的药品评审结果的预测装置,通过获取目标时间段内与n个字段值相同的原始数据总数;其中,n为大于1的正整数;获取目标时间段内与n个字段值相同的通过药品审评的历史数据总数;根据原始数据总数和历史数据总数计算药品评审结果。由此,减少药品评审结果的预测成本,提高预测准确度。

为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行第一方面实施例所述的药品评审结果的预测方法。

为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请第一方面实施例所述的药品评审结果的预测方法。

为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如本申请第一方面实施例所述的药品评审结果的预测方法。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请实施例一所提供的一种药品评审结果的预测方法的流程示意图;

图2为本申请实施例一所提供的相关性分析的示例图;

图3为本申请实施例二所提供的一种药品评审结果的预测方法的流程示意图;

图4为本申请实施例所提供的一种药品评审结果的预测装置的结构示意图;以及

图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的药品评审结果的预测方法、装置、电子设备和存储介质。

图1为本申请实施例一所提供的一种药品评审结果的预测方法的流程示意图。

如图1所示,该药品评审结果的预测方法包括以下步骤:

步骤101,获取目标时间段内与n个字段值相同的原始数据总数;其中,n为大于1的正整数。

在本申请实施例中,n个字段值是对针对公开原数据进行处理后,获取与药品审评预测相关且相关性比较高的多个字段值。

在本申请实施例中,从数据库获取公开原数据,根据预先建立的数据字典对公开原数据进行处理,获取与药品审评预测相关的标准字段值。

具体地,从国家药品监督管理局药品审评中心网站、公司自建数据库获取公开原始数据。

在本申请实施例中,获取每个标准字段值的属性值,根据相关性分析公式对每个标准字段值的属性值进行计算,获取标准字段值之间的相关数值,根据标准字段值之间的相关数值与预设阈值,从标准字段值中获取n个字段值。

具体地,通过公司自建的数据字典,对公开原始数据进行清洗,得到与药品审评预测相关的标准字段值,比如为药品在中国最高注册进度、不同企业在该药品的最高进度、疾病领域、适应症、临床科室、剂型、注册分类、审评结论、受理号、一致性评价情况、创新类型、国产/进口、药品类别、是否优先审评、是否特殊审批、是否重大专项、是否突破性疗法、标准药品名称、标准企业名称、审评结束日期、国家药监局受理日期、国家药品审评中心承办日期、同药品既往审评数据、同企业既往审评数据等中的一种或者多种。

进一步地,对上述标准字段值进行相关性分析,根据相关系数公式对两两数据求相关性;其中,相关系数公式如下:r=Cov(X,Y)/(σX*σY);其中,X为变量;Y为变量;Cov(X,Y)为X与为的协方差;σX为X的标准差;σY为Y的标准差。

根据计算可以获取相关度最高的n个字段值,一般|r|>0.95认为存在显著性相关;|r|≥0.8认为高度相关;0.5≤|r|<0.8认为中度相关;0.3≤|r|<0.5认为低度相关;|r|<0.3关系极弱,认为不相关;所以以|r|≥0.5为基准,选取参与计算的n个字段值,其中,预设阈值可以根据应用场景选择设置。

举例而言,如图2所示,字段值x1和x2,获取x1的各个属性值比如化学药品1、中药3等,获取x2的各个属性值比如申请一致性评价2等,以及字段值y,获取y的属性值通过评审1、未通过评审2等,从而通过上述公式进行计算,可以获取x1和x2和y的相关分数值。

最后,获取目标时间段内与n个字段值相同的原始数据总数,其中,目标时间段可以根据应用场景需要进行选择,比如1年、3年等。

在本申请实施例中,获取目标时间段内的所有数据,根据n个字段值对所有数据进行分组,将与n个字段值均相同的数据划分为一组,得到同类药品品种数据,对分组后的各个同类药品品种数据进行求取总数,得到原始数据总数。

举例而言,先获取目标时间段比如近三年上述n个字段值相同所有数据总数:首先获取所有数据总数,接着根据上述相关性分析得到的n个字段值对数据进行分组,将n个字段值均相等的数据分为一组,得到同类药品品种,对分组后的数据分别求取总数。

步骤102,获取目标时间段内与n个字段值相同的通过药品审评的历史数据总数。

在本申请实施例中,获取目标时间段内的通过评审的所有数据,根据n个字段值对通过评审的所有数据进行分组,将与n个字段值均相同的数据划分为一组,得到同类药品品种通过评审的数据,对分组后的各个同类药品品种通过评审的数据进行求取总数,得到通过药品审评的历史数据总数。

举例而言,获取近三年上述n个字段值相同的通过审评的所有数据总数,首先获取通过审评的所有数据,接着根据上述相关性分析得到的n个字段值对数据进行分组,将n个字段值均相等的数据分为一组,得到同类药品品种,最后对分组后的数据分别求取总数。

步骤103,根据原始数据总数和历史数据总数计算药品评审结果。

在本申请实施例中,获取每个同类药品品种的原始数据总数和通过审评的历史数据总数,计算每个同类药品品种的通过审评的历史数据总数与原始数据总数的比值,获取药品评审结果。

具体地,依次遍历所有数据,获取相同品种的所有数据总数和相同品种通过审评的数据总数;每个品种的获批通过率=通过审评总数/所有总数。

本申请实施例的药品评审结果的预测方法,通过获取目标时间段内与n个字段值相同的原始数据总数;其中,n为大于1的正整数;获取目标时间段内与n个字段值相同的通过药品审评的历史数据总数;根据原始数据总数和历史数据总数计算药品评审结果。由此,减少药品评审结果的预测成本,提高预测准确度。

基于上述实施例的描述,如图3所示,在步骤103之后,还可以包括:

步骤201,计算每个同类药品品种中每条数据的审评周期。

步骤202,根据每条数据的审评周期计算获取审评结论日期。

具体地,根据上述相关性分析得到的n个字段值对数据进行分组,将n个字段值均相等的数据分为一组,得到同类药品品种后,可以计算同类药品品种中每条数据的审评周期,审评周期=审评结束日期-注册申报日期,对这些同类品种审评周期进行排序,计算获取审评结论日期,比如获取审评结论日期=同类品种审评周期的中位数。

由此,减少预测获得审评结论的日期花费精力和时间,提高预测准确度。

为了实现上述实施例,本申请还提出一种药品评审结果的预测装置。

图4为本申请实施例提供的一种药品评审结果的预测装置的结构示意图。

如图4所示,该药品评审结果的预测装置包括:第一获取模块410、第二获取模块420和计算模块430。

第一获取模块410,用于获取目标时间段内与n个字段值相同的原始数据总数;其中,所述n为大于1的正整数。

第二获取模块420,用于获取所述目标时间段内与所述n个字段值相同的通过药品审评的历史数据总数。

计算模块430,用于根据所述原始数据总数和所述历史数据总数计算药品评审结果。

本申请实施例的药品评审结果的预测装置,通过获取目标时间段内与n个字段值相同的原始数据总数;其中,n为大于1的正整数;获取目标时间段内与n个字段值相同的通过药品审评的历史数据总数;根据原始数据总数和历史数据总数计算药品评审结果。由此,减少药品评审结果的预测成本,提高预测准确度。

需要说明的是,前述对药品评审结果的预测方法实施例的解释说明也适用于该实施例的药品评审结果的预测装置,此处不再赘述。

为了实现上述实施例,本申请还提出一种计算机设备,包括:处理器,以及用于存储所述处理器可执行指令的存储器。

其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如本申请前述实施例提出的药品评审结果的预测方法。

为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得处理器能够执行本申请前述实施例提出的药品评审结果的预测方法。

为了实现上述实施例,本申请还提出一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行实现本申请前述实施例提出的药品评审结果的预测方法。

图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图5显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的药品评审结果的预测方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 药品评审结果的预测方法、装置、电子设备和存储介质
  • 药品需求量的预测方法、装置、电子设备及存储介质
技术分类

06120112193645