掌桥专利:专业的专利平台
掌桥专利
首页

一种人工智能模型预测结果的复审方法及装置

文献发布时间:2023-06-19 11:45:49


一种人工智能模型预测结果的复审方法及装置

技术领域

本发明涉及设备检测技术领域,具体涉及一种人工智能模型预测结果的复审方法及装置。

背景技术

目前,人工智能模型在多个行业内得到应用。例如,输电巡检领域,无人机对输电杆塔等设备进行拍摄,基于目标检测模型筛查出拍摄照片中可能存在的问题;安防领域,基于人脸检测和人脸比对模型,找到可能的在逃犯罪嫌疑人;互联网领域,基于文本分类模型,找到涉黄、涉政、涉暴的用户言论等;工业领域,基于图片目标检测模型,找到有缺陷的产品。然而,由于人工智能模型并非完全准确,在应用人工智能模型找到潜在问题后,往往需要进行人工复审或人工复查,因此需要对哪些样本进行复查做出决策。目前的通用方法为:基于验证集对模型在不同置信度条件下的误检和漏检率进行估计,并结合实际需求设置人工复审/人工复查的置信度阈值。

但是,在模型预测、人工复审的系统实际应用时,由于样本采集方式、样本来源、样本特征等与训练集存在差异,模型预测结果在不同置信度水平上的误检率与漏检率与基于验证集估计的值存在偏差,因此基于事先设置的置信度阈值进行的人工复审方案会造成人力的浪费:一方面,人工复审的样本数量可能会超出/低于预计,导致复审成本超出预计或问题检出数量偏低;另一方面,对于多类别的预测结果,人工复审的工作量可能会集中于少数几个频繁误报的类别,并因复审资源错配导致复审找出的问题样本或过滤掉的误报样本数量偏低。

发明内容

有鉴于此,本发明实施例提供了一种人工智能模型预测结果的复审方法及装置,以解决现有技术中,人工复检的方式对人工智能模型的预测结果进行复审存在的复检数量低、复检准确率低等问题。

本发明实施例提供了一种人工智能模型预测结果的复审方法,所述复审方法包括:获取人工智能模型的预测结果及所述预测结果对应的预测类别及置信度;根据所述预测类别及置信度确定复审顺序及复审范围;基于预设的优化条件、所述复审顺序及复审范围对所述预测结果进行复审,得到复审结果。

可选地,所述复审方法还包括:根据所述复审结果对所述预测结果的复审顺序和/或复审范围进行调整。

可选地,所述根据所述复审结果对所述预测结果的复审顺序和/或复审范围进行调整,包括:根据所述复审结果,确定已完成复审的预测结果样本;计算所述已完成复审的预测结果样本中,在预设范围内预测正确、错误的样本数量及对应的占比;所述预设范围包括:预设置信度区间、预设预测类别的结果、所述预测结果样本所标注的类别中的至少之一。

可选地,所述预设的优化条件包括以下三项中的至少之一:总体复审量确定的情况下,问题样本的检出数量达到最大;问题样本的检出数量确定时,总体复审数量达到最小;总体复审量确定的情况下,通过复审确定的人工智能模型的误报数量达到最大。

可选地,所述基于预设的优化条件及所述复审顺序对所述预测结果进行复审,包括:基于所述人工智能模型的预测置信度,从高到低进行复审,或,从预设阈值开始,从低到高进行复审;当复审数量达到预设数量时,或检出的问题数量达到给预设问题数量时,终止复审。

可选地,所述基于预设的优化条件及所述复审顺序对所述预测结果进行复审,包括:基于贝叶斯方法,使用验证集数据设定所述人工智能模型在各类别不同置信度精确率的先验分布;基于多臂老虎机方法,确定所述复审顺序,并在复审过程中计算模型精确率的后验分布;基于所述优化条件,确定复审的终止条件,所述终止条件包括:当复审数量达到预设数量时,或检出的问题数量达到给预设问题数量时,终止复审;基于所述先验分布、后验分布及终止条件对上述预测结果进行复审。

可选地,所述基于预设的优化条件及所述复审顺序对所述预测结果进行复审,包括:选取所述预测类别中未复审的置信度最高的预测结果样本进行复审。

可选地,所述复审方法还包括:对于处于所述复审范围之外的预测结果样本,将置信度比人工复审样本置信度低的预测结果样本判定为无问题;将置信度比人工复审样本置信度高的预测结果样本视为有问题。

本发明实施例还提供了一种人工智能模型预测结果的复审装置,所述复审装置包括:预测结果获取模块,用于获取人工智能模型的预测结果及所述预测结果对应的预测类别及置信度;复审顺序及范围确定模块,用于根据所述预测类别及置信度确定复审顺序及复审范围;复审模块,用于基于预设的优化条件、所述复审顺序及复审范围对所述预测结果进行复审,得到复审结果。

本发明实施例还提供了一种电子设备/移动终端/服务器,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的人工智能模型预测结果的复审方法。

本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的人工智能模型预测结果的复审方法。

本发明实施例的有益效果在于,通过本发明实施例的复审方法,针对人工智能模型的预测结果进行复审,避免了人工复审的过程,能有效规避基于预设方案进行样本人工复审的缺点,复审结果更加准确,并且,能够实时根据数据特点调整复审策略,更准确地预估复审工作量、更有效率地寻找问题样本或误报样本。

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:

图1示出了本发明实施例的人工智能模型预测结果的复审方法的流程示意图;

图2示出了本发明实施例的人工智能模型预测结果的复审装置的结构示意图;

图3示出了本发明实施例的计算机设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种人工智能模型预测结果的复审方法,如图1所示,该复审方法包括:

步骤S101:获取人工智能模型的预测结果及所述预测结果对应的预测类别及置信度。在本实施例中,该复审方法主要是针对人工智能模型的预测结果进行复审的方案,因此,首先需获取到人工智能模型的预测结果及该预测结果对应的预测类别及置信度。可选地,在本实施例中,该人工智能模型的预测结果所针对的对象,并不做限制,可以例如是应用在输电巡检领域的缺陷检测结果,也可以是应用在互联网领域,对网络中出现的数据、信息等进行识别的识别结果等。

步骤S102:根据所述预测类别及置信度确定复审顺序及复审范围。

步骤S103:基于预设的优化条件、所述复审顺序及复审范围对所述预测结果进行复审,得到复审结果。在本实施例中,该预设的优化条件可以主要包括以下三项中的至少之一:总体复审量确定的情况下,问题样本的检出数量达到最大;问题样本的检出数量确定时,总体复审数量达到最小;总体复审量确定的情况下,通过复审确定的人工智能模型的误报数量达到最大。

通过本发明实施例的复审方法,针对人工智能模型的预测结果进行复审,能有效规避基于预设方案进行样本人工复审的缺点,复审结果更加准确,并且,能够实时根据数据特点调整复审策略,更准确地预估复审工作量、更有效率地寻找问题样本或误报样本。

可选地,在本发明的一些实施例中,该复审方法还包括:根据所述复审结果对所述预测结果的复审顺序和/或复审范围进行调整。具体地,这个调整过程主要包括:

根据所述复审结果,确定已完成复审的预测结果样本;计算所述已完成复审的预测结果样本中,在预设范围内预测正确、错误的样本数量及对应的占比;所述预设范围包括:预设置信度区间、预设预测类别的结果、所述预测结果样本所标注的类别中的至少之一。

通过这个过程,能有效规避基于预设方案进行样本复审的缺点,实时根据数据特点调整复审策略,更准确地预估复审工作量、更有效率地寻找问题样本或误报样本。

可选地,在本发明的一些实施例中,上述步骤S103,基于预设的优化条件及所述复审顺序对所述预测结果进行复审的过程,包括:基于所述人工智能模型的预测置信度,从高到低进行复审,或,从预设阈值开始,从低到高进行复审;当复审数量达到预设数量时,或检出的问题数量达到给预设问题数量时,终止复审。基于这个过程,能够实现优化条件:问题样本的检出数量确定时,总体复审数量达到最小;总体复审量确定的情况下,通过复审确定的人工智能模型的误报数量达到最大。

可选地,在本发明的一些实施例中,上述步骤S103,基于预设的优化条件及所述复审顺序对所述预测结果进行复审的过程,包括:基于贝叶斯方法,使用验证集数据设定所述人工智能模型在各类别不同置信度精确率的先验分布;基于多臂老虎机方法,确定所述复审顺序,并在复审过程中计算模型精确率的后验分布;基于所述优化条件,确定复审的终止条件,所述终止条件包括:当复审数量达到预设数量时,或检出的问题数量达到给预设问题数量时,终止复审;基于所述先验分布、后验分布及终止条件对上述预测结果进行复审。

在此实施例中,使用验证集数据设定模型在各类别不同置信度精确率的先验分布(假设对于不同类别,在不同置信度水平上,模型精确率与验证集精确率的比值不变,并假设置信度为P0时模型精确率的先验服从Beta(tA,(1-t)A),其中t为验证集精确率,A为事先确定的整数,通常为10至50);基于多臂老虎机方法,确定复审顺序(选择精确率上90%分位点估计值最大的类别,将该类别中未复审的、置信度最大的样本作为下一张待复审的样本),并在复审过程中计算模型精确率的后验分布(对每个类别,选择未复审样本中置信度最大的图片,记其置信度为P,并根据已复审图片,计算该类别置信度为P时的模型精确率的上90%分位点)。

通过该过程,能够实现优化条件:总体复审量确定的情况下,问题样本的检出数量达到最大;问题样本的检出数量确定时,总体复审数量达到最小。

可选地,在本发明的一些实施例中,上述步骤S103,基于预设的优化条件及所述复审顺序对所述预测结果进行复审的过程,包括:选取所述预测类别中未复审的置信度最高的预测结果样本进行复审。

对于多类别问题,预先设定n(n>=1)个条件,其中条件i为连续ki(ki>=1)个该类别的复审样本,模型预测结果正确的样本数量不超过ri。首先选择一个类别,选取该类别中未复审的置信度最高的样本进行复审。若满足至少一个条件,则切换至下一个类别;否则继续该类别的复审。若复审总量或检出问题/缺陷样本数量达到给定值,则停止复审。其中,对每个预设条件,ki和ri均为预先设定的正整数,例如:可预先设定两个条件,k1=3,r1=0,k2=10,r2=4,即如果对某个类别,复审到的前3个样本中不存在问题样本(r1=0),或连续10个样本中问题样本数量不超过4,则切换至下个类别。

通过该过程,能够实现优化条件:总体复审量确定的情况下,问题样本的检出数量达到最大;问题样本的检出数量确定时,总体复审数量达到最小。

此外,对于优化条件:总体复审量确定的情况下,通过复审确定的人工智能模型的误报数量达到最大。可以按照置信度从低往高复检,从而尽量找出误报情况,此时,预先设定n(n>=1)个条件,其中条件i为连续ki(ki>=1)个该类别的复审样本,模型预测结果正确的样本数量不低于ri。

可选地,在本发明的一些实施例中,该复审方法还包括:对于处于所述复审范围之外的预测结果样本,将置信度比人工复审样本置信度低的预测结果样本判定为无问题;将置信度比人工复审样本置信度高的预测结果样本视为有问题。

以下结合具体应用实例,对本发明实施例的人工智能模型预测结果的复审方法做进一步说明。

应用实例1:应用于输电巡检领域,对于输电设备进行缺陷智能检测的缺陷智能检测系统。该系统主要包括如下模块:

(1)图片采集模块。可以通过用户远程手动上传、无人机采集图像后通过wifi或移动通信网络上传、使用移动存储设备拷贝等方式,将待检测图片录入系统。待检测图片可以为一条输电线路全部或部分杆塔的巡检拍摄图片。

(2)缺陷智能检测模块。使用目标检测模型(即本发明实施例所述的人工智能模型),预测图片中可能包含的输电设备隐患的目标框位置、类别和置信度,得到预测结果。

(3)复审模块。基于验证集得到缺陷智能检测模型各类别在不同置信度水平上的精确率。假设对于不同类别,在不同置信度水平上,模型精确率与验证集精确率的比值不变,并假设置信度为P0时模型精确率的先验服从Beta(tA,(1-t)A),其中t为验证集精确率,A为事先确定的整数,通常为10至50。在对图片进行复审时,若已复审样本数量(或已复审样本中的误报数量)与总图片数量之比达到给定值,则结束复审;否则,首先,对每个类别,选择未复审样本中置信度最大的图片,记其置信度为P,并根据已复审图片,计算该类别置信度为P时的模型精确率的上90%分位点;选择精确率上90%分位点估计值最大的类别,将该类别中未复审的、置信度最大的样本作为下一张待复审的样本返回,将其展示给用户;当用户完成复审后,收集并记录其对所述样本的复审结果。

(4)报告生成模块。基于复审结果得到缺陷列表,并生成缺陷报告。

应用实例2:应用于互联网领域,进行网络传输数据的数据审核系统。该系统包括如下模块:

(1)初审模块。初审模块调用AI分类模型(即人工智能模型),对传入的数据分析请求进行预测,根据分类结果和置信度,将涉黄、涉暴等违规类别且置信度超过对应类别给定阈值2的请求认定为审核不通过,将类别违规且置信度不低于对应阈值1且不高于对应阈值2之间的请求认定为需人工复查,将其它类别的分类结果认定为审核通过。将初审结果返回,同时将需进行复查的请求发送至复审模块,等待复审。

(2)复审模块。将收到的复审请求包含的文本提供给复审模块,置于待复审列表。每隔固定时间,计算(a)复审速度;(b)估计每个类别每个置信度区间的复审请求产生速度;(c)估计每个类别每个置信度区间的模型误报率。置信度区间的长度为预先设定的值,可以为1%,5%等。根据(a)、(b)和预定条件计算最大复审工作量。然后根据最大复审工作量计算每个类别的阈值2,使得位于阈值1和2之间的各类别请求的模型误报数量达到最大。根据计算结果重新设置初审模块的阈值2,并将待复审请求中,置信度超过阈值2的样本移出待复审列表,将其状态设置为审核通过。将待复审列表中的样本按照进入列表的时间顺序依次向审核人员展示,并根据审核人员对样本的判定结果,将对应样本的状态设置为审核通过或审核不通过。

本发明实施例还提供了一种人工智能模型预测结果的复审装置,如图2所示,该复审装置包括:

预测结果获取模块1,用于获取人工智能模型的预测结果及所述预测结果对应的预测类别及置信度;详细内容可参见上述方法实施例的步骤S101的相关描述,在此不再赘述。

复审顺序及范围确定模块2,用于根据所述预测类别及置信度确定复审顺序及复审范围;详细内容可参见上述方法实施例的步骤S102的相关描述,在此不再赘述。

复审模块3,用于基于预设的优化条件、所述复审顺序及复审范围对所述预测结果进行复审,得到复审结果。详细内容可参见上述方法实施例的步骤S103的相关描述,在此不再赘述。

通过本发明实施例的复审装置,针对人工智能模型的预测结果进行复审,能有效规避基于预设方案进行样本人工复审的缺点,复审结果更加准确,并且,能够实时根据数据特点调整复审策略,更准确地预估复审工作量、更有效率地寻找问题样本或误报样本。

本发明实施例还提供了一种计算机设备,如图3所示,该计算机设备可以包括处理器31和存储器32,其中处理器31和存储器32可以通过总线或者其他方式连接,图3中以通过总线连接为例。

处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。

存储器32作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的人工智能模型预测结果的复审方法对应的程序指令/模块(例如,图2所示的预测结果获取模块1、复审顺序及范围确定模块2及复审模块3)。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的人工智能模型预测结果的复审方法。

存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器31所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至处理器31。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器32中,当被所述处理器31执行时,执行如图1所示实施例中的人工智能模型预测结果的复审方法。

上述计算机设备具体细节可以对应参阅图1至图2所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。

本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。

虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

相关技术
  • 一种人工智能模型预测结果的复审方法及装置
  • 一种人工智能模型发布方法及装置
技术分类

06120113046460