掌桥专利:专业的专利平台
掌桥专利
首页

一种图像处理方法和装置

文献发布时间:2023-06-19 10:58:46


一种图像处理方法和装置

技术领域

本发明涉及计算机技术领域,尤其涉及一种图像处理方法和装置。

背景技术

目前,包括医疗健康影像等众多场景涉及带有文字的影像的处理,需要预先将筛选过滤掉无法使用的模糊影像。而图像质量评估向来很难做,难点主要在于图像质量是一个连续状态,很难界定一个图像清晰和模糊之间的界限,而且往往对图像质量的评估是很主观的,不同人对同一张图像的质量判断看法也是会有差别的,没有统一的标准。而且现有针对文档类的图像评估的方法也较少,方法一般都是基于整张图像,或者是裁剪图像分块来进行判断,最终结果都差强人意,准确率和召回率达到实际可用的效果还是有一定距离。

也就是说,现有业务中都是通过人工筛选模糊文档图像,在图像量级越来越大的当下,人工筛选效率太低,极大的影响了图像检索后续过程的自动化,而且也影响其后续结果的速度和精度。

发明内容

有鉴于此,本发明实施例提供一种图像处理方法和装置,能够应用在图像检索平台,实现自动筛选过滤掉模糊的文字类影响,使之后续图像检索的结果满足清晰条件。

为实现上述目的,根据本发明实施例的一个方面,提供了一种图像处理方法,包括获取待处理图像,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像;将所述目标待处理图像输入至训练好的图像质量评估神经网络中,提取多尺度的网络特征,以融合中低层网络特征,输出文本块区域数据和文本块区域模糊清晰分类级别;解析所述文本块区域数据,获取所述文本块区域的置信度,进而调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据并输出。

可选地,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像,包括:

将待处理图像进行白边填充以调整为目标形状,进而将调整后的待处理图像放缩至预设尺寸,以得到目标待处理图像。

可选地,将所述目标待处理图像输入至训练好的图像质量评估神经网络中之前,包括:

构建图像质量评估神经网络,采用包括分类损失和回归损失的多任务损失函数;其中,多任务损失函数中的分类损失赋予较大权重,以使图像质量评估神经网络训练更偏向于减小分类损失。

可选地,将所述目标待处理图像输入至训练好的图像质量评估神经网络中,包括:

依次通过五层卷积池化层对目标待处理图像进行特征提取;

将经过第五层卷积池化层之后得到的特征进行上采样操作,进而将经过第四层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第一特征图;

对所述第一特征图进行上采样操作,进而将经过第三层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第二特征图;

对所述第二特征图进行上采样操作得到目标特征图,以使所述目标特征图通过预设的两个两层全连接层生成文本块区域数据和文本块区域模糊清晰分类值。

可选地,所述五层卷积池化层,包括:

第一卷积池化层采用64个3×3的卷积核和1个maxpooling的池化层;第二卷积池化层采用128个3×3的卷积核和1个maxpooling的池化层;第三卷积池化层先采用2层256个3×3的卷积核,再使用1层256个1×1的卷积层和1个maxpooling的池化层;第四卷积池化层先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层;第五卷积池化层先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层。

可选地,还包括:

所述目标特征图通过预设的一个两层全连接层操作之后,输出文本块区域数据,所述文本块区域数据包括左上角坐标、右下角坐标以及所述文本块区域对应的置信度;

所述目标特征图通过预设的另一个两层全连接层操作之后,输出文本块区域对应的模糊值和清晰值,进而模糊值和清晰值通过softmax处理之后得到0-1之间的数值,作为文本块区域模糊清晰分类值。

可选地,调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据,包括:

对所有文本块区域按照置信度分数大小,从大到小排序,进而从最大的置信度分数的文本块区域开始,按照交并比算法,计算文本块区域重合程度,以通过预设的重合程度值阈值进行比对,过滤掉小于所述重合程度值阈值的文本块区域;

对剩余的文本块区域利用加权投票方法得到所述待处理图像的模糊清晰分类值,将所述待处理图像的模糊清晰分类值与模糊清晰区间等级进行匹配,得到模糊清晰分类级别,作为所述待处理图像的评估数据。

另外,本发明还提供了一种图像处理装置,包括获取模块,用于获取待处理图像,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像;处理模块,用于将所述目标待处理图像输入至训练好的图像质量评估神经网络中,提取多尺度的网络特征,以融合中低层网络特征,输出文本块区域数据和文本块区域模糊清晰分类级别;生成模块,用于解析所述文本块区域数据,获取所述文本块区域的置信度,进而调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据并输出。

上述发明中的一个实施例具有如下优点或有益效果:本发明基于非精确大块文本块区域进行文本定位的模糊清晰判别,可代替图像检索过程中人工筛选,可实现在0.1秒内得到文档图像的模糊评测结果,并且召回率和准确率均可达到95%以上,极大的提高了图像检索的效率,同时减少了相关人工成本。并且,通过标注、网络结构和损失函数三个环节进行优化更改,达到虽然牺牲检测精度(简化检测任务),但却提高了文本块区域模糊分类判断精度和方法整体速度。同时,通过最后分级策略,筛选出部分模糊部分清晰的图像。另外,本发明可以应用在图像检索平台,得到图像的评估数据,从而使之后续图像检索的结果能够满足最基本的清晰条件。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是根据本发明第一实施例的图像处理方法的主要流程的示意图;

图2是根据本发明实施例的图像质量评估神经网络的示意图;

图3是根据本发明实施例的图像识别示例;

图4是根据本发明第二实施例的图像处理方法的主要流程的示意图;

图5是根据本发明实施例的图像处理装置的主要模块的示意图;

图6是本发明实施例可以应用于其中的示例性装置架构图;

图7是适于用来实现本发明实施例的终端设备或服务器的计算机装置的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本发明第一实施例的图像处理方法的主要流程的示意图,所述图像处理方法包括:

步骤S101,获取待处理图像,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像。

在一些实施例中,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像,具体地实施过程包括:将待处理图像进行白边填充以调整为目标形状,进而将调整后的待处理图像放缩至预设尺寸,以得到目标待处理图像。

步骤S102,将所述目标待处理图像输入至训练好的图像质量评估神经网络中,提取多尺度的网络特征,以融合中低层网络特征,输出文本块区域数据和文本块区域模糊清晰分类级别。

在一些实施例中,将所述目标待处理图像输入至训练好的图像质量评估神经网络中之前,包括构建图像质量评估神经网络,采用包括分类损失和回归损失的多任务损失函数;其中,多任务损失函数中的分类损失赋予较大权重,以使图像质量评估神经网络训练更偏向于减小分类损失。

作为实施例,将所述目标待处理图像输入至训练好的图像质量评估神经网络中,如图2所示,依次通过五层卷积池化层对目标待处理图像进行特征提取;将经过第五层卷积池化层之后得到的特征进行上采样操作,进而将经过第四层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第一特征图;对所述第一特征图进行上采样操作,进而将经过第三层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第二特征图;对所述第二特征图进行上采样操作得到目标特征图,以使所述目标特征图通过预设的两个两层全连接层生成文本块区域数据和文本块区域模糊清晰分类值。

较佳地,所述五层卷积池化层,包括:第一卷积池化层采用64个3×3的卷积核和1个maxpooling的池化层;第二卷积池化层采用128个3×3的卷积核和1个maxpooling的池化层;第三卷积池化层先采用2层256个3×3的卷积核,再使用1层256个1×1的卷积层和1个maxpooling的池化层;第四卷积池化层先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层;第五卷积池化层先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层。

还值得说明的是,所述目标特征图通过预设的一个两层全连接层操作之后,输出文本块区域数据,所述文本块区域数据包括左上角坐标、右下角坐标以及所述文本块区域对应的置信度;所述目标特征图通过预设的另一个两层全连接层操作之后,输出文本块区域对应的模糊值和清晰值,进而模糊值和清晰值通过softmax处理之后得到0-1之间的数值,作为文本块区域模糊清晰分类值。

作为另一些实施例,将所述目标待处理图像输入至训练好的图像质量评估神经网络中之前,需要训练图像质量评估神经网络,具体的实施过程包括:

获取m份文字类图像,将图像进行白边填充为目标形状(例如正方形),然后将图像放缩到固定大小(例如768x768)。对m份图像进行文本块标注,其中只要大致框住文本块内容,不要求精确(如图3所示)即大的文本块内容标注,舍弃了小的文本目标区域,只要不是太离谱即可应对模糊判断,虽然稍微牺牲了目标检测的精度,但却提升了模糊判断的精度,对大的文本块检测(而非文本行或小文本块),不仅参数量小很多,速度快很多。标注文本块的标签为清晰或模糊。

构建一个卷积神经网络,通过对图像进行卷积以及融合操作,得到不同尺度的特征,从融合的特征上回归出非精确的文本块区域,进而文本块区域继续分类,输出该文本块的分类0、1(0表示清晰文本、1表示模糊文本)。其中,损失函数采用多任务损失函数,包括分类损失和回归损失,具体地:损失函数=分类损失函数+回归损失函数,即

L=λ

优选地,分类损失L

构建的卷积神经网络输入为rgb三通道图像以及该图像的模糊清晰分类。通过卷积神经网络提取不同尺度特征(ResNet50),并进行特征融合、输出。具体结构包括5层特征提取:

第一层:1个卷积层和1个池化层,采用64个3×3的卷积核和1个maxpooling的池化层。

第二层:2个卷积层和1个池化层,采用128个3×3的卷积核和1个maxpooling的池化层。

第三层:3个卷积层和1个池化层,先采用2层256个3×3的卷积核,再使用1层256个1×1的卷积层和1个maxpooling的池化层。

第四层:3个卷积层和1个池化层,先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层。

第五层:3个卷积层和1个池化层,先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层。

特征融合具体结构包括:将上述操作的第五层的输出首先做一个上采样操作,将其尺寸恢复到与它卷积池化操作的上一步的结果,同时将第四层的输出经过1x1卷积后与上采样操作的结果叠加得到第一特征图。将第一特征图做一个上采样操作,同时将第三层经过1x1卷积后与上采样操作的结果叠加得到第二特征图。将第二特征图直接进行上采样,不再与之前的卷积池化结果进行叠加,只采用特征提取网络中较低层(更关注于目标位置信息)的特征,不合并较高层(更关注于语义信息)的特征,即选取的文本块区域目标较大,只要定位到大致文字区域就可以,不需要太精确,不仅使网络参数量减少,加快网络速度,也吻合大致定位文字区域的目的,及非精确检测。

网络输出具体结构包括回归文本块区域的模糊清晰分类值和回归文本块区域数据。其中,文本块区域数据是通过如下过程得到:对上采样后的第二特征图进行一个两层全连接操作,每个像素点上生成8个待选的候选框,这些候选框具有不同的尺寸,在进行模型训练时,在训练样本的所有文本块区域将其的值标为1,非文本块区域的值标为0,然后利用回归的方式,回归出值为1的区域的候选框,利用NMS(非极大抑制)算法将这些候选框合并为最终的文本块区域,得到文本块区域数据:文本块区域的左上角坐标和右下角坐标。其中,训练时将文本块区域标注模糊清晰分类,然后训练时在每个文本块区域内利用回归的方法回归对应的分类。

值得说明的是,在输出文本块区域数据的同时,输出置信度分数。优选地,先对所有文本块区域按照其各自的置信度分数大小,从大到小排序,从最大的置信度分数的文本块区域开始,按照交并比(IOU)算法,计算文本块区域重合程度,进行筛选(例如所示重合程度值设置为0.75),然后对剩下的文本块区域利用加权投票方法得到最终图像模糊清晰判断,即加权投票后的数值匹配模糊清晰分类级别。

另外,本发明对上采样后的第二特征图进行另外一个两层全连接操作,得到回归文本块区域的模糊清晰分类值,进而将所述模糊清晰分类值经过softmax(归一化指数函数)处理之后得到0-1之间的值,经过投票加权后的值分为3个等级(如下表所示),0~0.3为模糊图像,0.3~0.7为部分模糊部分清晰图像,0.7~1为清晰图像。在实际医疗类文本影像的模糊度判断时,可能因为拍摄角度、发送时被压缩等多种原因,有大量的图像是部分清晰部分模糊的图像。因此,通过预测值进行分级,实现了筛选出部分模糊部分清晰的这种虽然特殊,但在实际应用中占比很大的一类图像。

步骤S103,解析所述文本块区域数据,获取所述文本块区域的置信度,进而调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据并输出。

在一些实施例中,调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据,包括:对所有文本块区域按照置信度分数大小,从大到小排序,进而从最大的置信度分数的文本块区域开始,按照交并比算法,计算文本块区域重合程度,以通过预设的重合程度值阈值进行比对,过滤掉小于所述重合程度值阈值的文本块区域;对剩余的文本块区域利用加权投票方法得到所述待处理图像的模糊清晰分类值,将所述待处理图像的模糊清晰分类值与模糊清晰区间等级进行匹配,得到模糊清晰分类级别,作为所述待处理图像的评估数据。

其中,加权投票算法,即按照筛选剩下的文本块区域,每个文本块区域有一个置信度分数,也有一个模糊清晰分类的输出值,将各自文本块区域的置信度分数,除以所有剩余的文本块区域的置信度分数加和的总值,得到各个文本块区域的权重,然后乘以各自文本块区域的模糊清晰分类的输出值,加和得到最后的值,作为这张图像的模糊清晰分类值,然后根据分类值区间等级进行判断,得到最终质量评估结论。

值得说明的是,所述的评估数据可以包括图像中每个文本块区域的模糊清晰分类级别,以及整个图像的模糊清晰分类级别,从而本发明可以对各个文本块区域以及整个图像的模糊清晰进行评估,实现了全方位的动态评估,即针对不同的图像基于该图像的文本块区域模糊清晰分类级别进行文本块区域以及整个图像的模糊清晰评估。综上所述,可以看出本发明通过非精确检测的文本块区域,判断文本块区域的模糊清晰分类,按照置信度阈值,选取阈值以上的文本块区域的判断结果进行投票,得到最终图像的清晰模糊结论。同时,本发明抛弃掉现有文本行检测思路,而是采用大块文本块区域的检测思路,只要筛选出大致合适的文本块区域(如图3所示),而达到了更好模糊清晰判断精度和更快的速度。还有,本发明可以在图像检索平台中,针对大量的医疗健康影像进行评估处理,筛选剔除一些模糊的无法使用的图像,还可以对一些半模糊图像经过人工识别也能够使用从而大大提高了图像的应用效率。也就是说,本发明不仅可以区分模糊和清晰图像,也可辨析一些图像是部分模糊部分清晰的特殊图像,这类特殊图像虽然特殊,但实际应用过程中却大量出现,非常有必要单独筛选出来,不能与只模糊或者只清晰图像混杂在一起,造成图像识别的偏差。

图4是根据本发明第二实施例的图像处理方法的主要流程的示意图。所述图像处理方法,包括:

步骤S401,获取待处理图像。

步骤S402,基于预设的预处理模型,将待处理图像进行白边填充以调整为目标形状,进而将调整后的待处理图像放缩至预设尺寸,以得到目标待处理图像。

步骤S403,依次通过五层卷积池化层对目标待处理图像进行特征提取。

步骤S404,将经过第五层卷积池化层之后得到的特征进行上采样操作,进而将经过第四层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第一特征图。

步骤S405,对所述第一特征图进行上采样操作,进而将经过第三层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第二特征图。

步骤S406,对所述第二特征图进行上采样操作得到目标特征图,以使所述目标特征图通过预设的两个两层全连接层,分别生成文本块区域数据和文本块区域模糊清晰分类值。

在实施例中,所述目标特征图通过预设的一个两层全连接层操作之后,输出包括五个节点的文本块区域数据,其中四个节点为左上角坐标、右下角坐标,一个节点为文本块区域对应的置信度。所述目标特征图通过预设的另一个两层全连接层操作之后,输出文本块区域对应的模糊值和清晰值,进而模糊值和清晰值通过softmax处理之后得到0-1之间的数值,作为文本块区域模糊清晰分类值。

步骤S407,调用预设的评估引擎,对所有文本块区域按照文本块区域数据中的置信度分数大小,从大到小排序,进而从最大的置信度分数的文本块区域开始,按照交并比算法,计算文本块区域重合程度,以通过预设的重合程度值阈值进行比对,过滤掉小于所述重合程度值阈值的文本块区域。

步骤S408,对剩余的文本块区域利用加权投票方法得到所述待处理图像的模糊清晰分类值,将所述待处理图像的模糊清晰分类值与模糊清晰区间等级进行匹配,得到模糊清晰分类级别,作为所述待处理图像的评估数据并输出。

综上所述,本发明基于非精确检测的文本块区域,判断文字模糊与否,进而确定整个文档图像模糊与否,实现使文档图像模糊判断更加聚焦于文字内容。标注(粗颗粒度的大块文本块区域标注和检测)、网络结构(特征提取中抛弃高层语义信息特征,聚焦于中低层的网络特征,并增加1x1卷积提高特征的抽象表达能力)和损失函数(损失函数中提高分类损失的权重),三个环节进行优化更改,达到虽然牺牲检测精度,但却提高了文本块区域模糊分类判断精度的。因此,本发明在简化了整体检测任务的情况下,大大提高了整个网络的速度,满足线上实时性的要求,而且也减少了标注的难度。另外,本发明除了可以得到图像清晰或模糊结论,也可通过最后分级策略,筛选出部分模糊部分清晰的图像。

值得说明的是,本发明可以应用于图像检索平台,可以作为其中的一个功能模块,也可单独对外提供服务,支持接口调用。

作为本发明的一个应用实施例,在使用图像检索平台中,面对大量的医疗健康影像的处理,需要将上传的所有图像进行一定的预处理,筛选剔除一些模糊的无法使用的图像,如一些健康档案影像或者体检健康影像,本发明将这些模糊的图像筛选出来,如果业务需要,则反馈给业务让其重新上传,如若业务不需要,则直接中图像库中删除。

图5是根据本发明实施例的图像处理装置的主要模块的示意图,如图5所示,所述图像处理装置500包括获取模块501、处理模块502和生成模块503。其中,获取模块501获取待处理图像,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像;处理模块502将所述目标待处理图像输入至训练好的图像质量评估神经网络中,提取多尺度的网络特征,以融合中低层网络特征,输出文本块区域数据和文本块区域模糊清晰分类级别;生成模块503解析所述文本块区域数据,获取所述文本块区域的置信度,进而调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据并输出出。

在一些实施例中,获取模块501基于预设的预处理模型,将所述待处理图像调整为目标待处理图像,包括将待处理图像进行白边填充以调整为目标形状,进而将调整后的待处理图像放缩至预设尺寸,以得到目标待处理图像。

在一些实施例中,处理模块502将所述目标待处理图像输入至训练好的图像质量评估神经网络中之前,包括:

构建图像质量评估神经网络,采用包括分类损失和回归损失的多任务损失函数;其中,多任务损失函数中的分类损失赋予较大权重,以使图像质量评估神经网络训练更偏向于减小分类损失。

在一些实施例中,处理模块502将所述目标待处理图像输入至训练好的图像质量评估神经网络中,包括:

依次通过五层卷积池化层对目标待处理图像进行特征提取;

将经过第五层卷积池化层之后得到的特征进行上采样操作,进而将经过第四层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第一特征图;

对所述第一特征图进行上采样操作,进而将经过第三层卷积池化层之后得到的特征经过1x1卷积后的结果,与所述上采样操作的结果叠加得到第二特征图;

对所述第二特征图进行上采样操作得到目标特征图,以使所述目标特征图通过预设的两个两层全连接层生成文本块区域数据和文本块区域模糊清晰分类值。

在一些实施例中,所述五层卷积池化层,包括:

第一卷积池化层采用64个3×3的卷积核和1个maxpooling的池化层;第二卷积池化层采用128个3×3的卷积核和1个maxpooling的池化层;第三卷积池化层先采用2层256个3×3的卷积核,再使用1层256个1×1的卷积层和1个maxpooling的池化层;第四卷积池化层先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层;第五卷积池化层先采用2层512个3×3的卷积核,再使用1层512个1×1的卷积层和1个maxpooling的池化层。

在一些实施例中,处理模块502还包括:

所述目标特征图通过预设的一个两层全连接层操作之后,输出文本块区域数据,所述文本块区域数据包括左上角坐标、右下角坐标以及所述文本块区域对应的置信度;

所述目标特征图通过预设的另一个两层全连接层操作之后,输出文本块区域对应的模糊值和清晰值,进而模糊值和清晰值通过softmax处理之后得到0-1之间的数值,作为文本块区域模糊清晰分类值。

在一些实施例中,生成模块503调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据,包括

对所有文本块区域按照置信度分数大小,从大到小排序,进而从最大的置信度分数的文本块区域开始,按照交并比算法,计算文本块区域重合程度,以通过预设的重合程度值阈值进行比对,过滤掉小于所述重合程度值阈值的文本块区域;对剩余的文本块区域利用加权投票方法得到所述待处理图像的模糊清晰分类值,将所述待处理图像的模糊清晰分类值与模糊清晰区间等级进行匹配,得到模糊清晰分类级别,作为所述待处理图像的评估数据。

需要说明的是,在本发明所述图像处理方法和所述图像处理装置在具体实施内容上具有相应关系,故重复内容不再说明。

图6示出了可以应用本发明实施例的图像处理方法或图像处理装置的示例性装置架构600。

如图6所示,装置架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备601、602、603可以是具有图像处理屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是,本发明实施例所提供的图像处理方法一般由服务器605执行,相应地,计算装置一般设置于服务器605中。

应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机装置700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示,计算机装置700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM703中,还存储有计算机装置700操作所需的各种程序和数据。CPU701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶图像处理器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的装置中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、处理模块和生成模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括获取待处理图像,基于预设的预处理模型,将所述待处理图像调整为目标待处理图像;将所述目标待处理图像输入至训练好的图像质量评估神经网络中,提取多尺度的网络特征,以融合中低层网络特征,输出文本块区域数据和文本块区域模糊清晰分类级别;解析所述文本块区域数据,获取所述文本块区域的置信度,进而调用预设的评估引擎,基于文本块区域模糊清晰分类值计算得到所述待处理图像的模糊清晰分类值,以根据模糊清晰区间等级生成所述待处理图像的评估数据并输出。

根据本发明实施例的技术方案,本发明实施方式能够应用在图像检索平台,实现自动筛选过滤掉模糊的文字类影响,使之后续图像检索的结果满足清晰条件。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

相关技术
  • 信息处理装置、信息处理方法、控制装置、控制系统、控制方法、断层合成图像捕获装置、X射线成像装置、图像处理装置、图像处理系统、图像处理方法和计算机程序
  • 图像处理装置和图像处理方法、图像处理方法的程序、以及具有记录在其上的图像处理方法的程序的记录介质
技术分类

06120112757547