掌桥专利:专业的专利平台
掌桥专利
首页

图像处理方法、图像处理模型的训练方法

文献发布时间:2024-04-18 19:57:31


图像处理方法、图像处理模型的训练方法

技术领域

本说明书实施例涉及计算机技术领域,特别涉及一种图像处理方法。

背景技术

随着人民生活水平的提升,越来越多的人重视自身的健康,而肿瘤是影响人健康的重大因素之一,在医学图像中识别肿瘤是需要专业医生根据经验进行识别,受限于医生的经验,借助医学图像的进行图像识别分析称为一个重要课题。

在目前根据医学图像中的病灶分割和分类涉及到多个器官的处理,因此改进病灶分割和分类的精度就成为了技术发展的关键问题,目前的图像处理算法仅仅是对图像本身进行处理和预测,如何可以在此基础上进一步提升预测病灶分割和分类的精度就称为技术人员亟待解决的问题。

发明内容

有鉴于此,本说明书实施例提供了一种图像处理方法。本说明书一个或者多个实施例同时涉及一种图像处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面,提供了一种图像处理方法,包括:

接收图像处理任务,其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;

将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

根据本说明书实施例的第二方面,提供了一种CT图像处理方法,包括:

接收CT图像处理任务,其中,所述CT图像处理任务携带目标检测区域对应的多个CT图像,所述CT图像处理任务用于检测所述目标检测区域内是否存在异常组织;

将所述多个CT图像输入至CT图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述CT图像处理模型基于各CT图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

根据本说明书实施例的第三方面,提供了一种图像处理模型的训练方法,应用于云侧设备,包括:

获取训练样本对,其中,所述训练样本对包括针对目标检测区域的多个训练样本图像和所述目标检测区域的样本检测结果,训练样本图像中包括异常对象或不包括异常对象;

将所述多个训练样本图像输入至图像处理模型,获得所述目标检测区域对应的预测检测结果;

根据所述预测检测结果和所述样本检测结果计算模型损失值;

根据所述模型损失值调整所述图像处理模型的模型参数,直至达到模型训练停止条件,获得图像处理模型的模型参数;

向端侧设备发送所述图像处理模型的模型参数。

根据本说明书实施例的第四方面,提供了图像处理方法,包括:

接收用户发送的图像处理请求,其中,所述图像处理请求包括图像处理任务,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;

将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果;

向用户发送所述目标待检测分区对应的检测结果。

根据本说明书实施例的第五方面,提供了一种图像处理装置,包括:

接收模块,被配置为接收图像处理任务,其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;

检测模块,被配置为将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

根据本说明书实施例的第六方面,提供了一种计算设备,包括:

存储器和处理器;

所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。

根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述方法的步骤。

根据本说明书实施例的第八方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述方法的步骤。

本说明书一个实施例提供的图像处理方法,接收图像处理任务,其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

通过本说明书实施例提供的方法,根据目标图像生成图像预测信息,同时根据目标图像生成用户预测信息,再结合图像预测信息和用户预测信息生成最终的检测结果,结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导预测结果的一致性,提升了检测结果的准确率。

附图说明

图1是本说明书一个实施例提供的一种图像处理系统的架构图;

图2是本说明书一个实施例提供的一种图像处理方法的流程图;

图3是本说明书一个实施例提供的一种图像处理模型的结构图;

图4是本说明书一个实施例提供的异常预测单元的结构示意图;

图5是本说明书一个实施例提供的一种CT图像处理方法的流程图;

图6是本说明书一个实施例提供的一种图像处理模型的训练方法的流程图;

图7是本说明书一个实施例提供的一种图像处理方法的流程图;

图8是本说明书一个实施例提供的一种在检测目标器官中是否存在恶性肿瘤场景下的图像处理方法的处理过程流程图;

图9是本说明书一个实施例提供的一种图像处理装置的结构示意图;

图10是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。

首先,对本说明书一个或多个实施例涉及的名词术语进行解释。

CT(Computed Tomography):电子计算机断层扫描,它是利用精确准直的X线束,与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描,具有扫描时间快,图像清晰等特点,可用于多种疾病的检查。

CNN(convolutional neural network):卷积神经网络,是计算机视觉领域常用的一种深度学习模型。

NC CT(non-contrast CT):平扫CT,CT中的普通扫描,一般用于某些部位的常规检查。

DCE CT(Dynamic contrast-enhanced CT):动态增强CT,是指血管内注射对比剂后再行扫描的方法,目的是提高病变组织同正常组织的密度差,以显示平扫CT上未被显示或显示不清楚的病变,通过有无强化及强化类型,有助于病变的定性。

CAD(computer aided diagnosis):计算机辅助诊断,是指通过影像学、医学图像处理技术以及其他可能的生理、生化手段,结合计算机的分析计算,辅助发现病灶,提高诊断的准确率。

随着计算机技术的不断发展,各种学习模型逐渐被应用于各种应用场景的预测,相应的,深度学习模型在医学影像计算机辅助诊断(CAD)任务中也取得了显著成功。从医学图像中进行病灶分割和分类是计算机辅助诊断中的一个重要课题。

关于平扫CT图像中识别多个器官的肿瘤分割和分类是目前研究的一个重点方向,因此,如何改进病灶分割和分类的精度就称为了关键问题,传统算法仅仅在像素级别进行预测,预测的方式也仅仅依靠CT图像,预测出来的结果很难有精度上的提升。

基于此,在本说明书中,提供了一种图像处理方法,本说明书同时涉及一种图像处理装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。

参见图1,图1示出了本说明书一个实施例提供的一种图像处理系统的架构图,图像处理系统可以包括客户端100和服务端200;

客户端100,用于向服务端200发送图像处理任务。其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;

服务端200,用于接收图像处理任务,将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果;向客户端100发送图像处理任务的检测结果;

客户端100,还用于接收服务端200发送的图像处理任务的检测结果。

应用本说明书实施例的方案,接收图像处理任务,其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

通过本说明书实施例提供的方法,根据目标图像生成图像预测信息,同时根据目标图像生成用户预测信息,再结合图像预测信息和用户预测信息生成最终的检测结果,结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导预测结果的一致性,提升了检测结果的准确率。

实际应用中,图像处理系统可以包括多个客户端100以及服务端200。多个客户端100之间通过服务端200可以建立通信连接,在图像处理场景中,服务端200即用来在多个客户端100之间提供信息抽取服务,多个客户端100可以分别作为发送端或接收端,通过服务端200实现通信。

用户通过客户端100可与服务端200进行交互以接收其它客户端100发送的数据,或将数据发送至其它客户端100等。在图像处理场景中,可以是用户通过客户端100向服务端200发布数据流,服务端200根据该数据流生成检测结果,并将检测结果推送至其他建立通信的客户端中。

其中,客户端100与服务端200之间通过网络建立连接。网络为客户端100与服务端200之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。客户端100所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端200。

客户端100可以为浏览器、APP(Application,应用程序)、或网页应用如H5(HyperText Markup Language5,超文本标记语言第5版)应用、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,客户端100可以基于服务端200提供的相应服务的软件开发工具包(SDK,Software Development Kit),如基于实时通信(RTC,Real TimeCommunication)SDK开发获得等。客户端100可以部署在电子设备中,需要依赖设备运行或者设备中的某些APP而运行等。电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等端侧设备。在电子设备中通常还可以配置各种其它类应用,例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

服务端200可以包括提供各种服务的服务器,例如为多个客户端提供通信服务的服务器,又如为客户端上使用的模型提供支持的用于后台训练的服务器,又如对客户端发送的数据进行处理的服务器等。需要说明的是,服务端200可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,Content DeliveryNetwork)以及大数据和人工智能平台等基础云计算服务的云服务器(云侧设备),或者是带人工智能技术的智能云计算服务器或智能云主机。

值得说明的是,本说明书实施例中提供的图像处理方法一般由服务端执行,但是,在本说明书的其它实施例中,客户端也可以与服务端具有相似的功能,从而执行本说明书实施例所提供的图像处理方法。在其它实施例中,本说明书实施例所提供的图像处理方法还可以是由客户端与服务端共同执行。

参见图2,图2示出了本说明书一个实施例提供的一种图像处理方法的流程图,具体包括以下步骤:

步骤202:接收图像处理任务,其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象。

实际应用中,可以通过服务端也可以通过客户端接收用户发送的图像处理任务。

具体地,图像处理任务是用于检测所述目标检测区域内是否存在异常对象的任务,图像处理任务中携带目标检测区域对应的多个目标图像。进一步地,目标检测区域可以理解为用于预测是否存在异常对象的分区,异常对象具体是指目标检测区域内的异物,例如,异常对象可以是人体内的恶性肿瘤,目标检测区域可以是人体内的任一器官,如肝脏、肺、胃等等。通过对目标检测区域是否存在异常对象进行预测,可以根据预测结果进一步判断待检测对象的状态,从而对异常对象的定位和精准治疗提供帮助。

需要说明的是,本说明书一个或多个实施例中,图像处理任务可以应用于对各类医学图像的识别,并根据图像特征判断医学图像中的目标检测区域中是否存在异常对象。示例性地,在治疗骨折的应用场景中,可以根据目标检测区域的医学图像,预测目标检测区域是否发生了骨折,从而对骨折部位进行定位。在肝癌检测的应用场景中,可以根据肝脏部位的医学图像,预测肝脏内是否发生了肿瘤,从而帮助医生对发生异常的部位进行精准定位,便于后续的治疗。

示例性地,在检测肝癌的应用场景中,获取的目标图像即肝脏的图像,具体的,获取的多个目标图像即为肝脏的CT图像,多个目标图像可以组成肝脏的3D图像。异常对象可以理解为肝脏中的恶性肿瘤。获取肝脏的多个CT图像,通过对多个CT图像进行图像检测处理,检测在肝脏中是否存在恶性肿瘤。

在实际应用中,异常对象可以为某一种细胞,某一种组织结构等等,例如可以为骨折的裂痕、恶性肿瘤、良性肿瘤、增生组织等等。

通过接收图像处理任务,可以将图像处理任务中携带的目标检测区域对应的多个目标图像作为输入,用于检测目标检测区域内是否存在异常待检测对象。

步骤204:将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

实际应用中,接收图像处理任务,可以从图像处理任务中获取携带的多个目标图像,将多个目标图像输入至图像处理模型,可以获得图像处理模型输出的目标检测区域对应的检测结果,检测结果具体的包括是否包含异常对象的概率、异常对象种类等等。

具体的,图像处理模型能基于输入的多个目标图像,提取各目标图像的图像特征信息、图像预测信息和用户预测信息,其中,图像特征信息具体是指目标图像在像素级别的图像特征;图像预测信息具体是指根据图像特征信息预测出来信息,即针对目标检测区域的检测信息;用户预测信息具体是指预测出待检测对象的预测信息,待检测对象即为目标图像对应的对象。例如目标图像为张三的肺部的CT图像的情况下,待检测对象即为张三。

在目标检测区域中可能不会存在异常对象,也有可能会存在异常对象,也有可能会存在多个异常对象,在多个异常对象,每个异常对象的种类可能也不相同。例如在肺部的图像中,可能会检测不到肿瘤,也可能会检测到肿瘤,检测到的肿瘤可能为良性的,也可能为恶性的,在本说明书提供的一个或多个实施方式中,可以通过各目标图像进行预测,预测出目标检测区域中是否存在异常对象,以及异常对象的类型和概率,概率值可以为0-1的数值,输出异常对象的概率值越接近0,则说明检测到异常对象的概率越低;输出异常对象的概率值越接近1,则说明检测到异常对象的概率越高,同时还会确定各异常对象的类型。

Mask Transformer(掩码模型)一个在各种分割任务上有着优秀表现的模型,与为每个像素预测类标签的传统卷积分割器不同,Mask Transformer为每个对象预测类标签和二进制掩码,从图像中提取一个高分辨率像素嵌入张量

为了提高图像处理模型执行图像处理任务的任务执行效果,提高输出的检测结果的准确性,在本说明书一个或多个实施例中,在Mask Transformer的基础上,增加了像素预测单元、异常预测单元和用户预测单元,具体的,所述图像处理模型包括图像编码器、图像解码器、像素预测单元、异常预测单元和用户预测单元;

参见图3,图3示出了本说明书一实施例提供的一种图像处理模型的结构图,如图3所示,图像处理模型包括图像编码器302、图像解码器304、像素预测单元306、异常预测单元308和用户预测单元310。

进一步的,将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,包括:

将所述多个目标图像输入至所述图像编码器,获得各目标图像对应的图像编码信息;

将各图像编码信息输入至所述图像解码器,获得各目标图像对应的初始预测信息;

将各初始预测信息输入至所述像素预测单元,获得各初始预测信息对应的像素预测信息;

从各图像编码信息中确定至少一个待处理图像编码信息;

将各待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息;

将各待处理图像编码信息输入至所述用户预测单元,获得用户预测信息;

根据所述图像预测信息和所述用户预测信息生成所述检测结果。

其中,图像编码器用于对输入的多个目标图像进行编码,图像编码器用于提取各目标图像中的图像特征信息,获得各目标图像对应的图像编码信息。

在实际应用中,在图像处理模型还包括嵌入层;相应的,将所述多个目标图像输入至所述图像编码器,获得各目标图像对应的图像编码信息,包括:

将所述多个目标图像输入至所述嵌入层,获得各目标图像对应的图像特征信息;

将各图像特征信息输入至所述图像编码器,获得各目标图像对应的图像编码信息。

具体的,图像处理模型对图像进行处理,实际是对图像的图像特征信息进行处理,而无法对图像本身进行处理。因此将目标图像输入到图像处理模型后,需要先将目标图像转换为图像处理模型可以处理的特征信息,具体的,通过图像处理模型中的嵌入层对各目标图像进行嵌入化处理,获得各目标图像对应的图像特征信息,再将图像特征信息输入到图像编码器中,获得各目标图像对应的图像编码信息。

更进一步的,各目标图像对应的图像编码信息可以理解为对目标图像中各像素点进行编码后的特征信息。

图像解码器用于对图像编码信息进行解码,从而从图像编码信息中获取个目标图像对应的初始预测信息,这里的初始预测信息具体是指目标图像中各像素点对应的分类信息。在实际应用中,各图像编码信息经过图像解码器处理之后,获得的初始预测信息可以再输入至像素预测单元中,可以获得像素级别的像素预测信息,即预测目标图像中各像素点对应的是否为异常对象,以及异常对象的概率。

像素预测单元用于各图像编码信息进行处理,生成图像预测信息。图像预测信息为后续的异常预测单元提供了参考信息。像素预测单元是在图像解码器之后的卷积网络(CNN,convolutional neural network),学习预测类似传统分割器的逐个像素分割图,在本说明书提供的方法中,对预测的掩码进行连通分析,提取异常实例,然后对每个预测异常的区域的像素嵌入进行平均,预测异常以获得特征向量,特征向量即为图像预测信息,将图像预测信息作为后续异常预测单元的输入。

本说明书提供的一个或多个具体实施方中,除了常规的像素级别的图像预测之外,还在图像处理模型中引入了异常预测单元和用户预测单元,其中,异常预测单元用于对目标图像中的目标检测区域的进行图像级别的预测,更进一步的,以某器官的肿瘤预测场景为例,异常预测单元用于根据各目标图像预测该器官中是否有肿瘤,以及肿瘤的类型和概率;用户预测单元用于对目标图像对应的待检测图像进行用户级别的预测,更进一步的,以对张三的CT图像进行处理为例,通过用户预测单元对各目标图像的特征信息进行处理,预测张三的某个器官中是否有肿瘤,以及肿瘤的种类和概率。

具体的,异常预测单元的输入为像素预测信息,以各目标图像在编码过程中生成的一些待处理图像编码信息。例如以图像编码器包括6个图像编码层为例,在各图像编码层中会包括有在中间处理过程中的待处理图像编码信息,同时,在生成图像解码信息的过程中,也会存在一些待处理图像编码信息,需要注意的是,本说明书提供的一个或多个实施方式中的待处理图像编码信息具体是指在生成图像编码信息和初始预测信息过程中的特征信息。

从各图像编码信息中确定至少一个待处理图像编码信息的过程中,可以通过随机获取的方式确定,也可以通过一些预设的抽取规则确定,在本说明书提供的方法中,对此不做限定,以实际应用为准。

在本说明书提供的一具体实施方式中,将各待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息,包括:

将各待处理图像编码信息、各像素预测信息和各初始预测信息,输入至所述异常预测单元,获得图像预测信息。

具体的,在通过异常预测单元获得图像预测信息的过程中,除了根据待处理图像编码信息和各像素预测信息之外,还可以加入图像解码器输出的各初始预测信息。即输入到异常预测单元的信息包括图像解码器输出的各初始预测信息、像素预测单元输出的各像素预测信息和在图像编解码过程中生成的待处理图像编码信息。通过加入了各初始预测信息,增加了预测的参考维度,可以使得最终的预测结果更加准确。

异常预测单元为每个数据预测一个异常分类预测结果和异常分割预测结果,模型在采样像素上计算分割损失而不是在整个图像上计算分割损失,可以提升精度并减少资源(如内存)的使用。

参见图4,图4示出了本说明书一实施例提供的异常预测单元的结构示意图,如图4所示,异常预测单元中包括有特征解码单元402、异常分割单元404和异常分类单元406。具体的,将各待处理图像编码信息、各像素预测信息和各初始预测信息,输入至所述异常预测单元,获得图像预测信息,包括:

将各像素预测信息和随机编码信息进行拼接,获得各拼接特征信息;

将各拼接特征信息和各待处理图像编码信息输入至所述特征解码单元,获得各拼接特征信息对应的参考解码特征信息;

将各参考解码特征信息和各初始预测信息拼接,并输入至所述异常分割单元,获得异常分割预测结果;

将各参考解码特征信息输入至所述异常分类单元,获得异常分类预测结果;

根据所述异常分割预测结果和所述异常分类预测结果,生成图像预测信息。

其中,随机编码信息即为Mask Transformer生成的随机特征信息,在异常预测单元中,将随机编码信息和各像素预测信息进行拼接,获得对应的拼接特征信息,具体的拼接方式可以为将参考解码特征信息和初始预测信息进行顺序拼接。

在获得各拼接特征信息之后,将拼接特征信息和待处理图像编码信息输入至特征解码单元进行处理,其中,特征解码单元具体可以是Transformer模型中的解码器,根据输入的拼接特征信息和待处理图像编码信息进行解码,获得参考解码特征信息。

在获得了参考解码特征信息之后,参考解码特征信息会分别输入至异常分割单元和异常分类单元中进行处理,具体的,在输入至异常分割单元之前,还会再结合图像编码器中输出的初始预测信息,将拼接后的特征信息输入至异常分割单元,在异常分割单元中根据各像素点的特征信息进行预测,将有相似度小于预设阈值的像素点归集到一起,实现在特征图像上进行图像的分割,从而生成异常分割预测结果。

参考解码特征信息直接输入至分类预测单元,用于将生成的各像素点的参考解码特征信息进行分类,并判断各对象的分类概率,从而获得异常分类预测结果。

最后根据各像素点,将对应的异常分割预测结果和异常分类预测结果进行融合,从而生成最终的图像预测信息。在图像预测信息中会显示有检测出各对象的对象标记信息、类型名称和概率值。

本说明书提供的一个或多个具体实施方中,还包括有用户预测单元,用户预测单元是在用户的维度提供数据支持,可以从目标图像的分析处理结果中,预测出该用户的目标检测区域内是否有异常对象,即获得用户预测单元的用户预测信息,从而结合用户预测信息和图像预测信息,给出目标检测区域最终的检测结果,用户预测信息和图像预测信息是从两个不同的维度同时给出预测结果,两个预测结果又相辅相成,互相提供数据支持,从而进一步提升了检测结果的准确性。

在本说明书提供的一个或多个实施方式中,从各图像编码信息中确定至少一个待处理图像编码信息,并将待处理图像编码特征信息分别输入至异常预测单元和用户预测单元进行处理,进一步的,可以选择同样的待处理图像编码特征信息分别输入至异常预测单元和用户预测单元,也可以选择不同的待处理图像编码特征信息分别输入至异常预测单元和用户预测单元。

具体的,从各图像编码信息中确定至少一个待处理图像编码信息,包括:

从各图像编码信息中确定至少一个第一待处理图像编码信息和至少一个第二待处理图像编码信息。

相应的,将各待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息,包括:将各第一待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息;

将各待处理图像编码信息输入至所述用户预测单元,获得用户预测信息,包括:将各第二待处理图像编码信息输入至所述用户预测单元,获得用户预测信息。

其中,第一待处理图像编码信息和第二待处理图像编码信息为不同的待处理图像编码信息,其用于标识从待处理图像编码信息中取出不同的编码信息,并分别输入至异常预测单元和用户预测单元,具体的,是将第一待处理图像编码信息输入至异常预测单元,将第二待处理图像编码信息输入至用户预测单元,确定第一待处理图像编码信息和第二待处理图像编码信息的具体方式,可以随机确定,也可以按照预设的规律确定,在本申请中对此不做限定。

在计算机辅助诊断领域,异常预测单元可以理解为病灶预测单元,用户预测单元可以理解为病人预测单元,病灶预测单元从目标图像中辅助诊断目标检测区域是否存在异常对象,以及异常对象的名称和概率;病人预测单元从待检测人员的角度预测其目标检测区域中异常对象名称和概率,病灶预测单元和病人预测单元的结果趋于一致的情况下,可以提升模型的预测准确率。

本说明书一个或多个实施例提供的方法,在图像处理模型中,加入了异常预测单元和用户预测单元,分别对目标图像的图像特征信息进行分析与处理,获得了图像预测信息和用户预测信息,并基于图像预测信息和用户预测信息生成最终的检测结果。结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导检测结果的一致性,提升了检测结果的准确率。

随着计算机技术的不断发展,深度学习逐渐能应用于各种医学影响计算机辅助诊断任务中,深度学习模型依赖大规模精准标注的训练样本和样本标签作为训练数据进行模型训练,目前对图像处理模型在模型训练过程中,其训练数据为目标检测区域内包括异常对象的图像,其对于目标检测区域内没有包括异常对象的处理效果较差。基于此,本说明书提供的一个或多个具体实施方式中包括了一种图像处理模型的训练方法,具体的,本说明书提供的图像处理模型通过下述步骤训练获得:

S2042、获取训练样本对,其中,所述训练样本对包括针对目标检测区域的多个训练样本图像和所述目标检测区域的样本检测结果,训练样本图像中包括异常对象或不包括异常对象。

具体的,本说明书提供的图像处理模型的训练方法使用的是有监督训练,其包括有训练样本对,训练样本对中包括有训练样本和样本标签,具体的,针对目标检测区域的多个训练样本图像即为训练样本,目标检测区域的样本检测结果即为样本标签。

在本说明书提供的训练方法中,采用的训练样本对,目标图像中不仅是包含有异常对象的图像,还包含有不存在异常对象的图像,例如以计算机辅助诊断领域为例,样本训练图像包括了肿瘤患者的CT图像,也包括了健康者的CT图像。即有些训练样本图像包括肿瘤,有些训练样本图像不包括肿瘤。

以训练计算机辅助诊断领域的辅助诊断图像处理模型为例,在训练过程中,引入了健康者的图像,而不是仅使用肿瘤患者的图像,从而避免了在图像处理模型在真实应用时,面对多样化的无肿瘤图像时,预测出错误的结果。

需要注意的是,在本说明书提供的图像处理模型的训练方法中,训练样本图像中的异常对象还分为第一异常对象和第二异常对象,其中,第一异常对象为恶性异常对象,第二异常对象为良性异常对象,例如以目标检测区域为肝脏为例,训练样本图像对应的用户可以包括有健康用户、患有脂肪肝或肝炎等肝病用户,还包括患有肝癌的肝癌用户,其中,第一异常对象可以理解为肝癌肿瘤,第二异常对象可以理解为肝脏中弥漫性肝病病变。即本说明书提供的图像处理模型的方法,在选择训练样本图像时,丰富了训练样本图像的丰富性,提升了图像处理模型处理各种类型的图像时的稳定性和准确性。

S2044、将所述多个训练样本图像输入至图像处理模型,获得所述目标检测区域对应的预测检测结果。

在获得了训练样本图像之后,将训练样本图像输入至图像处理模型,此时的图像处理模型是还未训练好的图像处理模型,在图像处理模型中,根据各训练样本图像生成图像预测信息和用户预测信息,再基于图像预测信息和用户预测信息生成针对目标检测区域对应的预测检测结果。

在本说明书提供的方法中,图像处理模型如上述图像处理模型的模型结构相同,也包括图像编码器、图像解码器、像素预测单元、异常预测单元和用户预测单元。训练样本图像在未训练好的图像处理模型中的数据处理过程与上述实施例中图像处理模型的数据处理过程相同,关于训练样本图像在未训练好的图像处理模型中的数据处理过程,参见上述目标图像在图像处理模型中的数据处理过程,在此不在赘述。

S2046、根据所述预测检测结果和所述样本检测结果计算模型损失值。

在获得了图像处理模型的预测检测结果之后,即可根据预测检测结果和样本检测结果计算模型损失值,在本说明书提供的方法中,计算模型损失值的方法有很多,例如交叉熵损失函数、最大损失函数、平均值损失函数等等,在本说明书中,对损失函数的具体方式不做限定,以实际应用为准。

在本说明书提供的一个或多个具体实施方式中,所述样本检测结果包括图像样本子结果和用户样本子结果,所述预测检测结果包括图像预测子结果和用户预测子结果。相应的,根据所述预测检测结果和所述样本检测结果计算模型损失值,包括:

基于所述图像样本子结果和所述图像预测子结果计算第一损失值;

基于所述用户样本子结果和所述用户预测子结果计算第二损失值。

具体的,在本说明书提供的一个或多个具体实施方式中,预测的结果分为图像预测结果和用户预测结果,技术人员希望图像预测结果和用户预测结果能区域一致,从而提升预测的准确性。相应的,在模型训练阶段,可以将样本检测结果拆分为图像样本子结果和用户样本子结果,预测检测结果也可以分为图像预测子结果和用户预测子结果。

进一步的,基于所述图像样本子结果和所述图像预测子结果计算第一损失值,基于所述用户样本子结果和所述用户预测子结果计算第二损失值。同时图像预测子结果和用户预测子结果之间还可以互相验证,进一步提升预测的准确性。

更进一步的,所述图像样本子结果包括样本分割信息和样本分类信息,所述图像预测子结果包括预测分割信息和预测分类信息;相应的,基于所述图像样本子结果和所述图像预测子结果计算第一损失值,包括:

根据所述样本分割信息和所述预测分割信息计算第一子损失值;

根据所述样本分类信息和所述预测分类信息计算第二子损失值;

具体的,在本说明书提供的一个或多个具体实施方式中,如上述实施方式中的内容,图像样本子结果还包括有样本分割信息和样本分类信息,同样的,图像预测子结果也包括预测分割信息和预测分类信息。

基于所述图像样本子结果和所述图像预测子结果计算第一损失值,具体的是根据所述样本分割信息和所述预测分割信息计算第一子损失值,根据所述样本分类信息和所述预测分类信息计算第二子损失值。在本说明书提供的一具体实施方式中,根据Foreground-enhanced sampling loss(前景增强采样损失函数)计算第一子损失值,根据Cross-entropy loss(交叉熵损失函数)计算第二子损失值。

S2048、根据所述模型损失值调整所述图像处理模型的模型参数,直至达到模型训练停止条件。

在获得模型损失值后,即可根据模型损失值对图像处理模型的模型参数进行调整,具体的,可以是将所述模型损失值反向传播依次更新所述图像处理模型的模型参数。

在本说明书提供的一具体实施方式中,根据所述第一损失值和所述第二损失值调整所述图像处理模型的模型参数。

在本说明书提供的另一具体实施方式中,根据所述第一子损失值、第二子损失值和所述第二损失值调整所述图像处理模型的模型参数。

在调整完模型参数后,即可继续重复上述的步骤,继续对图像处理模型进行训练,直至达到训练停止条件,在实际应用中,图像处理模型的所述训练停止条件,包括:

模型损失值小于预设阈值;和/或

训练轮次达到预设的训练轮次。

具体的,在对图像处理模型进行训练的过程中,可以将模型的训练停止条件设置为模型损失值小于预设阈值,也可以将训练停止条件设置为训练轮次为预设的训练轮次,例如训练10轮,在本说明书中,对损失值的预设阈值和/或预设的训练轮次不做具体限定,以实际应用为准。

本说明书实施例提供的方法,在对图像处理模型进行训练的过程中,不仅仅使用包含有异常对象的训练样本图像,还包括了不包括异常对象的训练样本图像,更进一步的,在包含有异常对象的训练样本图像中,还包括了不同类型的异常对象,丰富了图像处理模型的图像处理能力,避免了图像处理模型在预测过程中的预测错误,提升了图像处理模型的预测准确率。

参见图5,图5示出了本说明书一个实施例提供的一种CT图像处理方法的流程图,具体包括以下步骤:

步骤502:接收CT图像处理任务,其中,所述CT图像处理任务携带目标检测区域对应的多个CT图像,所述CT图像处理任务用于检测所述目标检测区域内是否存在异常组织。

步骤504:将所述多个CT图像输入至CT图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述CT图像处理模型基于各CT图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

需要说明的是,步骤502-步骤504的实现方式,与上述步骤202-步骤204的实现方式相同,本说明书实施例便不再进行赘述。

示例性的,以目标检测区域为胃部为例,接收CT图像处理任务,在CT图像处理任务中包括目标用户的胃部对应的多个CT图像,多个CT图像可以组成目标用户的胃部3D图,该CT图像处理任务用于检测目标用户的胃部中是否存在恶性肿瘤。

应用本说明书实施例的方法,CT图像处理模型为上述实施例中的图像处理模型,CT图像处理模型的模型结构与上述实施例中图像处理模型的结构相同,在此不再赘述。通过将胃部对应的多个CT图像输入至CT图像处理模型,能获得图像处理模型输出的胃部对应的检测结果,从而实现对胃部中欧是否存在恶性肿瘤的自动检测,具体的,图像处理模型是根据多个CT图像生成图像预测信息和用户预测信息,其中,图像预测信息具体是指根据CT图像中的信息标记出哪些是异常对象,以及该异常对象可能的分类和分类概率,用户预测信息具体是指根据CT图像的信息预测用户患有胃部疾病的分类和分类概率,再通过图像预测信息和用户预测信息之间相互印证和结合,从而生成最终的检测结果。

本说明书一个或多个实施例提供的CT图像处理方法,在CT图像处理模型中,加入了异常预测单元和用户预测单元,分别对CT图像的图像特征信息进行分析与处理,获得了图像预测信息和用户预测信息,并基于图像预测信息和用户预测信息生成最终的检测结果。结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导检测结果的一致性,提升了检测结果的准确率。

参见图6,图6示出了本说明书一个实施例提供的一种图像处理模型的训练方法的流程图,应用于云侧设备,具体包括以下步骤:

步骤602:获取训练样本对,其中,所述训练样本对包括针对目标检测区域的多个训练样本图像和所述目标检测区域的样本检测结果,训练样本图像中包括异常对象或不包括异常对象。

步骤604:将所述多个训练样本图像输入至图像处理模型,获得所述目标检测区域对应的预测检测结果。

步骤606:根据所述预测检测结果和所述样本检测结果计算模型损失值。

步骤608:根据所述模型损失值调整所述图像处理模型的模型参数,直至达到模型训练停止条件,获得图像处理模型的模型参数。

步骤610:向端侧设备发送所述图像处理模型的模型参数。

需要说明的是,步骤602-步骤608与上述S2042-S2048的实现方式相同,本说明书实施例不在进行赘述。

在实际应用中,由于对模型进行训练需要大量的数据和较好的计算资源,端侧设备可能不具备相应的处理能力,因此,模型训练的过程可以在云侧设备实现,云侧设备在获得了图像处理模型的模型参数后,还可以将模型参数发送至端侧设备。端侧设备可以根据图像处理模型的模型参数在本地构建图像处理模型,进一步利用图像处理模型进行图像处理。

本说明书实施例提供的方法,在对图像处理模型进行训练的过程中,不仅仅使用包含有异常对象的训练样本图像,还包括了不包括异常对象的训练样本图像,更进一步的,在包含有异常对象的训练样本图像中,还包括了不同类型的异常对象,丰富了图像处理模型的图像处理能力,避免了图像处理模型在预测过程中的预测错误,提升了图像处理模型的预测准确率。

参见图7,图7示出了本说明书一个实施例提供的一种图像处理方法的流程图,具体包括以下步骤:

步骤702:接收用户发送的图像处理请求,其中,所述图像处理请求包括图像处理任务,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象。

步骤704:将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

步骤706:向用户发送所述目标待检测分区对应的检测结果。

需要说明的是,步骤702-步骤704的具体实现方式与上述步骤202-步骤204的实现方式相同,在本说明书实施例中不再进行赘述。

在本实施方式中,是接收到用户发送的图像处理请求,在该图像处理请求中包括有图像处理任务,并且在通过上述实施例的图像处理方法处理完成、获得检测结果之后,还需要将检测结果返回给用户,以使用户根据检测结果进行相应的后续处理。

本说明书一个或多个实施例提供的方法,在图像处理模型中,加入了异常预测单元和用户预测单元,分别对目标图像的图像特征信息进行分析与处理,获得了图像预测信息和用户预测信息,并基于图像预测信息和用户预测信息生成最终的检测结果。结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导检测结果的一致性,提升了检测结果的准确率。

下述结合附图8,以本说明书提供的图像处理方法在检测目标器官中是否存在恶性肿瘤的应用为例,对所述图像处理方法进行进一步说明。其中,图8示出了本说明书一个实施例提供的一种图像处理方法的处理过程流程图,具体包括以下步骤:

步骤802:接收CT图像处理任务,其中,CT图像处理任务中携带目标器官对应的多个CT图像。

步骤804:将多个CT图像输入至CT图像处理模型,获得所述目标器官对应的检测结果,其中,CT图像处理模型基于各CT图像生成图像预测信息和用户预测信息,并根据图像预测信息和用户预测信息生成检测结果。

在实际应用中,以目标器官为肝脏为例进行解释说明。预先对CT图像处理模型进行训练,具体的,采用的数据集包括有810名正常受试者和939名肝脏肿瘤患者,对每个正常受试者进行平扫CT(NC CT),对每个肝脏肿瘤患者进行动态增强CT(DCE CT),包括平扫CT、动脉期、静脉期。邀请资深医生对多种CT图像进行标记。根据病例报告和相关检测方式,对肝脏肿瘤进行3D标记和类型标注。研究考虑了8种肿瘤类型,包括肝细胞癌、肝内胆管癌、转移瘤、肝母细胞瘤、血管瘤、局灶性结节增生、囊肿和其他(其他类型的肿瘤)。如果不能根据CT图像和病理结果来确定肿瘤的类型,则标记为未知。通过上述标注,总计标记了4010个肿瘤实例,其体积范围从11到3.7*10

在对PLAN模型进行训练的过程中,每个CT重采样至0.7*0.7*5mm的间距,我们首先在公共数据集上训练一个nnU-Net模型,来分割肝脏和其他器官,然后裁剪肝脏区域来训练PLAN模型,为了帮助PLAN模型区分肝脏肿瘤和其他器官,训练PLAN模型使用预测的器官标签对肿瘤和其他器官进行分割,PLAN模型是建立在nnU-Net框架之上,PLAN模型的编码器就是U-Net的编码器,而PLAN模型的解码器是一个轻量级的特征金字塔网络,异常预测单元包括三个具有掩蔽注意力的Transformer decoder,其使用来自Transformer decoder的步长为16、8、4的特征图。随机查询的数量为20,嵌入尺寸为64,采样像素点的数量为K=12544,对于无对象类别,损失权重为0.1,对于异常预测单元中其他类别的损失权重为1。在训练过程中,首先对PLAN模型的图像编码器、图像解码器、像素预测单元分别进行500次预训练,然后再对整个PLAN模型整体进行500次模型训练。

同时获取了目前其他的计算机辅助诊断使用的机器学习模型nnU-Net和Mask2Former,通过将相同的CT分别输入到nnU-Net模型、Mask2Former模型和PLAN模型中,获得各自的预测结果。

参见下述表1,表1示出了在nnU-Net模型、Mask2Former模型和PLAN模型中的比对数据。

表1

参见表1,Spec.1表示了对202例完全正常病例检测的特异性,Spec.2表示了对100例较困难的非肿瘤病例的特异性。在8种类型的肿瘤中,肝细胞癌、肝内胆管癌、转移瘤、肝母细胞瘤为恶性肿瘤,血管瘤、局灶性结节增生、囊肿为良性肿瘤,其他可能是良性肿瘤,也可能是恶性肿瘤。NC测试集包括198例肿瘤病例,202例完全正常病例和100例可能存在较大图像噪声或弥漫性肝脏疾病(如肝腹水、肝炎、脂肪肝等)的非肿瘤病例,通过本说明书实施例提供的PLAN模型在各项任务上都达到了较好的准确率。

参见下述表2,表2示出了nnU-Net模型、Mask2Former模型和PLAN模型在8种肿瘤类型病变水平评估。

表2

在病变水平评估中,如果预测与图像中的基本病变重叠大于0.2,视为真阳性,并将半径小于3mm的损伤忽略,如表2所示,nnU-Net模型、Mask2Former模型的精度相当,但PLAN模型的精度始终高于nnU-Net模型,尽管PLAN模型针对NC图像的对比度较低,但仍可在病灶级别和像素级别的分割任务上达到80%的精度,仍可以作为用于分割和分类的模型。

本说明书一个或多个实施例提供的CT图像处理方法,在CT图像处理模型中,加入了异常预测单元和用户预测单元,分别对CT图像的图像特征信息进行分析与处理,获得了图像预测信息和用户预测信息,并基于图像预测信息和用户预测信息生成最终的检测结果。结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导检测结果的一致性,提升了检测结果的准确率。

与上述方法实施例相对应,本说明书还提供了图像处理装置实施例,图9示出了本说明书一个实施例提供的一种图像处理装置的结构示意图。如图9所示,该装置包括:

接收模块902,被配置为接收图像处理任务,其中,所述图像处理任务携带目标检测区域对应的多个目标图像,所述图像处理任务用于检测所述目标检测区域内是否存在异常对象;

检测模块904,被配置为将所述多个目标图像输入至图像处理模型,获得所述目标检测区域对应的检测结果,其中,所述图像处理模型基于各目标图像生成图像预测信息和用户预测信息,并基于所述图像预测信息和所述用户预测信息生成所述检测结果。

可选的,所述图像处理模型包括图像编码器、图像解码器、像素预测单元、异常预测单元和用户预测单元;

所述检测模块904,进一步被配置为:

将所述多个目标图像输入至所述图像编码器,获得各目标图像对应的图像编码信息;

将各图像编码信息输入至所述图像解码器,获得各目标图像对应的初始预测信息;

将各初始预测信息输入至所述像素预测单元,获得各初始预测信息对应的像素预测信息;

从各图像编码信息中确定至少一个待处理图像编码信息;

将各待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息;

将各待处理图像编码信息输入至所述用户预测单元,获得用户预测信息;

根据所述图像预测信息和所述用户预测信息生成所述检测结果。

可选的,所述图像处理模型还包括嵌入层;

所述检测模块904,进一步被配置为:

将所述多个目标图像输入至所述嵌入层,获得各目标图像对应的图像特征信息;

将各图像特征信息输入至所述图像编码器,获得各目标图像对应的图像编码信息。

可选的,所述检测模块904,进一步被配置为:

从各图像编码信息中确定至少一个第一待处理图像编码信息和至少一个第二待处理图像编码信息;

相应的,将各待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息,包括:

将各第一待处理图像编码信息和各像素预测信息输入至所述异常预测单元,获得图像预测信息;

相应的,将各待处理图像编码信息输入至所述用户预测单元,获得用户预测信息,包括:

将各第二待处理图像编码信息输入至所述用户预测单元,获得用户预测信息。

可选的,所述检测模块904,进一步被配置为:

将各待处理图像编码信息、各像素预测信息和各初始预测信息,输入至所述异常预测单元,获得图像预测信息。

可选的,所述异常预测单元包括特征解码单元、异常分割单元和异常分类单元;

所述检测模块904,进一步被配置为:

将各像素预测信息和随机编码信息进行拼接,获得各拼接特征信息;

将各拼接特征信息和各待处理图像编码信息输入至所述特征解码单元,获得各拼接特征信息对应的参考解码特征信息;

将各参考解码特征信息和各初始预测信息拼接,并输入至所述异常分割单元,获得异常分割预测结果;

将各参考解码特征信息输入至所述异常分类单元,获得异常分类预测结果;

根据所述异常分割预测结果和所述异常分类预测结果,生成图像预测信息。

可选的,所述装置还包括训练模块,被配置为:

获取训练样本对,其中,所述训练样本对包括针对目标检测区域的多个训练样本图像和所述目标检测区域的样本检测结果,训练样本图像中包括异常对象或不包括异常对象;

将所述多个训练样本图像输入至图像处理模型,获得所述目标检测区域对应的预测检测结果;

根据所述预测检测结果和所述样本检测结果计算模型损失值;

根据所述模型损失值调整所述图像处理模型的模型参数,直至达到模型训练停止条件。

可选的,所述样本检测结果包括图像样本子结果和用户样本子结果,所述预测检测结果包括图像预测子结果和用户预测子结果;

所述训练模块,进一步被配置为:

基于所述图像样本子结果和所述图像预测子结果计算第一损失值;

基于所述用户样本子结果和所述用户预测子结果计算第二损失值;

相应的,根据所述模型损失值调整所述图像处理模型的模型参数,包括:

根据所述第一损失值和所述第二损失值调整所述图像处理模型的模型参数。

可选的,所述图像样本子结果包括样本分割信息和样本分类信息,所述图像预测子结果包括预测分割信息和预测分类信息;

所述训练模块,进一步被配置为:

根据所述样本分割信息和所述预测分割信息计算第一子损失值;

根据所述样本分类信息和所述预测分类信息计算第二子损失值;

相应的,根据所述第一损失值和所述第二损失值调整所述图像处理模型的模型参数,包括:

根据所述第一子损失值、第二子损失值和所述第二损失值调整所述图像处理模型的模型参数。

本说明书一个或多个实施例提供的装置,在图像处理模型中,加入了异常预测单元和用户预测单元,分别对目标图像的图像特征信息进行分析与处理,获得了图像预测信息和用户预测信息,并基于图像预测信息和用户预测信息生成最终的检测结果。结合图像预测信息和用户预测信息,一起为最终的检测结果提供指导,使得图像预测信息和用户预测信息之间可以相互印证,指导检测结果的一致性,提升了检测结果的准确率。

上述为本实施例的一种图像处理装置的示意性方案。需要说明的是,该图像处理装置的技术方案与上述的图像处理方法的技术方案属于同一构思,图像处理装置的技术方案未详细描述的细节内容,均可以参见上述图像处理方法的技术方案的描述。

图10示出了本说明书一个实施例提供的一种计算设备的结构框图。该计算设备1000的部件包括但不限于存储器1010和处理器1020。处理器1020与存储器1010通过总线1030相连接,数据库1050用于保存数据。

计算设备1000还包括接入设备1040,接入设备1040使得计算设备1000能够经由一个或多个网络1060通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide AreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备1040可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,NetworkInterface Card))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,Wireless LocalArea Networks)无线接口、全球微波互联接入(Wi-MAX,World Interoperability forMicrowave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near Field Communication)接口,等等。

在本说明书的一个实施例中,计算设备1000的上述部件以及图10中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图10所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。

计算设备1000可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备1000还可以是移动式或静止式的服务器。

其中,处理器1020用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述图像处理方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的图像处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述图像处理方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述图像处理方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的图像处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述图像处理方法的技术方案的描述。

本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述图像处理方法的步骤。

上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的图像处理方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述图像处理方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

技术分类

06120116458854