掌桥专利:专业的专利平台
掌桥专利
首页

图像识别方法及装置

文献发布时间:2023-06-19 19:30:30


图像识别方法及装置

技术领域

本发明涉及图像识别领域,具体涉及一种图像识别方法及装置。

背景技术

图像处理时将源图像数据通过技术手段赋予其真实的含义,比如该图像属于什么类型的图像,或者该图像中描述的人物是谁等,以便将赋予真实含义的图像通过技术手段可以传送给特定的对象,展示在其对应的终端设备中,方便查看。

现有的技术方案多采用如SaaS(Software as a Service)服务,如针对体育赛事的马拉松项目等提供专门摄影师来进行拍照,由摄影师将拍好的图像上传到并人工进行特定标记,根据特定标记将图像提供给特定对象。这样处理的方式费事、费力,且仅针对体育赛事这一类特定场景,灵活度不高。除此之外,对于图像的识别,多采用人工方法或单一的人工智能识别算法,其准确率较低,导致后续的分拣效果较差。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的图像识别方法及装置。

根据本发明的一个方面,提供了一种图像识别方法,其包括:

步骤S1,接收至少一个图像接口上传的图像信息;

步骤S2,提取图像信息中包含的至少一个人物信息和至少一个人脸信息;将至少一个人物信息和至少一个人脸信息与预存储的对象信息进行匹配,分别得到匹配人物集以及匹配度集;其中,匹配人物集包括与至少一个人物信息匹配的第一匹配人物和与至少一个人脸信息匹配的第二匹配人物;匹配度集包括至少一个人物信息对应的第一匹配度和至少一个人脸信息对应的第二匹配度;

步骤S3,判断匹配人物集中第一匹配人物与第二匹配人物是否为同一人物;若是,执行步骤S4;

步骤S4,根据第一匹配度和第二匹配度计算得到共同匹配度;

步骤S5,判断共同匹配度是否大于第一匹配阈值;若是,执行步骤S6;

步骤S6,确定匹配成功,根据匹配结果分发图像。

根据本发明的另一方面,提供了一种图像识别装置,其包括:

接收模块,适于接收至少一个图像接口上传的图像信息;

第一匹配计算模块,适于提取图像信息中包含的至少一个人物信息和至少一个人脸信息;将至少一个人物信息和至少一个人脸信息与预存储的对象信息进行匹配,分别得到匹配人物集以及匹配度集;其中,匹配人物集包括与至少一个人物信息匹配的第一匹配人物和与至少一个人脸信息匹配的第二匹配人物;匹配度集包括至少一个人物信息对应的第一匹配度和至少一个人脸信息对应的第二匹配度;

第一判断模块,适于判断匹配人物集中第一匹配人物与第二匹配人物是否为同一人物;若是,执行共同匹配模块;

第二匹配计算模块,适于根据第一匹配度和第二匹配度计算得到共同匹配度;

第二判断模块,适于判断共同匹配度是否大于第一匹配阈值;若是,执行分发模块;

分发模块,适于确定匹配成功,根据匹配结果分发图像。

根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述图像识别方法对应的操作。

根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述图像识别方法对应的操作。

根据本发明的图像识别方法及装置,提取人物信息及人脸信息,将人物信息的识别与人脸信息的识别相结合,通过人物信息来补偿单一人脸识别的场景,提升匹配的准确率。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的图像识别方法的流程图;

图2示出了多个图像接口示意图;

图3示出了图像识别方法的流程示意图;

图4示出了根据本发明一个实施例的图像识别装置的功能框图;

图5示出了根据本发明一个实施例的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的图像识别方法的流程图。如图1所示,图像识别方法具体包括如下步骤:

步骤S1,接收至少一个图像接口上传的图像信息。

本实施例基于PaaS(Platform as a Service,平台即服务),提供多个不同图像接口,方便用于不同场景,减少了对专业摄像师的依赖,增加了图像信息获取的灵活性。具体的,如图2所示,可以接收基于web页面图像接口上传的图像信息,用户可以直接登录web页面利用提供的图像接口上传图像信息;或者,接收基于客户端图像接口上传的图像信息,如通过配置用户的专属客户端,获取客户端中存储的图片自动通过web页面上传图像信息;或者,接收按照预设规则自动截取图像接口上传的图像信息,预设摄像设备(如摄像头等),将摄像设备拍摄的视频按照预设规则自动截取的图像通过图像接口上传,摄像设备通过RTSP(Real Time Streaming Protocol,实时流传输协议)将自动截图进行上传。预设规则可以按照预设时间间隔进行自动截图,也可以通过对摄像设备采集的图像进行检测,对检测的包含人脸或指定信息的图像进行自动截图,指定信息根据实施情况设置,如体育场景可以包括如运动员的号码牌、体育活动名称等,运营活动场景包括如活动名称、公司名称等,此处不做限定。

步骤S2,提取图像信息中包含的至少一个人物信息和至少一个人脸信息;将至少一个人物信息和至少一个人脸信息与预存储的对象信息进行匹配,分别得到匹配人物集以及匹配度集。

考虑到现有技术基于图像信息中的人脸进行识别标注的方式,处理方式单一,准确率不高等问题,本实施例从上传的图像信息中提取出至少一个人物信息和至少一个人脸信息。人物信息是从人物整体出发,提取的包含如人物形态、人物体型、人物服饰等各种人物信息,以便从人物整体上与预存储的对象信息进行匹配。人脸信息是在提取的人物信息的基础上,针对性的进行人脸提取,得到人脸信息。将人物信息和人脸信息相结合,利用人物信息来增强人脸信息识别的准确性。具体的,根据提取的人物信息可以得到对应的人物特征矩阵,当提取到多个人物信息时,对应的得到多个人物特征矩阵。根据提取的人脸信息可以得到对应的人脸特征矩阵,当提取得到多个人脸信息时,对应的得到多个人脸特征矩阵。基于人物特征矩阵与预存储的对象信息进行匹配,如将预存储的对象信息转换为对应的对象人物特征矩阵,通过计算与人物特征矩阵间的距离,基于距离得到至少一个人物信息对应的第一匹配度,以及对应的与至少一个人物信息匹配的第一匹配人物。基于人脸特征矩阵与预存储的对象信息进行匹配,如将预存储的对象信息转换为对应的对象人脸特征矩阵,通过计算与人脸特征矩阵间的距离,基于距离得到至少一个人脸信息对应的第二匹配度,以及对应的与至少一个人脸信息匹配的第二匹配人物,以便后续基于以上得到的匹配人物集以及匹配度集进行整体匹配。

可选地,在计算得到第一匹配度后,本实施例还可以直接判断第一匹配度是否大于第二匹配度阈值,若是,说明可以直接根据人物信息确定匹配对象,可以直接执行步骤S6,无需再进行其它匹配。若否,则还需要继续根据人物信息和人脸信息的匹配度集和匹配人物集继续执行步骤S3。

步骤S3,判断匹配人物集中第一匹配人物与第二匹配人物是否为同一人物。

当判断第一匹配人物和第二匹配人物为同一人物时,执行步骤S4,进一步进行准确匹配。若判断匹配人物集中第一匹配人物与第二匹配人物不是为同一人物,则执行步骤S7。

步骤S4,根据第一匹配度和第二匹配度计算得到共同匹配度。

当判断第一匹配人物与第二匹配人物为同一人物时,根据第一匹配度和第二匹配度计算得到共同匹配度,具体的,S

步骤S5,判断共同匹配度是否大于第一匹配阈值。

判断计算得到的共同匹配度是否大于第一匹配阈值,若是,说明根据人物信息和人脸信息的匹配成功,则执行步骤S6,若否,可选地,执行步骤S7。

步骤S6,确定匹配成功,根据匹配结果分发图像。

当计算得到的匹配度满足对应的判断条件时,则确定匹配成功。可以根据对应的匹配结果,确定分发对象。如根据匹配的预存储的对象信息,对象信息中包括如对象账号等信息,或者,根据预存储的文本信息,基于对应的号码牌等确定分发对象,从而将图像分发给对应的分发对象等。

可选地,本实施例还包括如下步骤:

步骤S7,判断第二匹配度是否大于第三匹配阈值。

在判断第一匹配度不大于第二匹配度阈值的基础上,判断第二匹配度是否大于第三匹配阈值,若是,即根据人脸信息可以准确识别匹配对象,则执行步骤S6,直接进行分发,若否,则执行步骤S8。

步骤S8,提取图像信息中包含的文本信息;将文本信息以及预存储文本信息进行匹配,确定第三匹配度。

当提取的人物信息、人脸信息均无法准确匹配时,提取图像信息中包含的文本信息,如号码牌、名称、名字等文字型文本信息。根据文本信息与预存储文本信息中各字符计算得到编辑距离。其中文本信息标记为x,预存储文本信息标记为y,x中包含i个字符,y中包含j个字符,编辑距离以矩阵D[i,j]表示,在计算矩阵值时,其中所需要的最少操作次数为D

根据计算得到的编辑距离(以d表示D[i,j]的值)、文本信息的长度i、预存储文本信息的长度j,其中,取二者的最大值k=max(i,j)。各字符间相似度(λ(m)),每个字符对文本信息的相似度影响因子为1/k,基于以上信息计算得到第三匹配度。第三匹配度用于表征文本信息与预存储文本信息的相似度similar(x,y)。公式如下:

步骤S9,判断第三匹配度是否大于第四匹配阈值。

若判断第三匹配度大于第四匹配阈值,则基于文本信息匹配生成,执行步骤S6。

若判断第三匹配度不大于第四匹配阈值,则确定匹配失败,不对该图像信息进行分发处理。

在本实施例中的各种匹配阈值,根据实施情况设置,此处不做限定。

可选地,本实施例还可以如图3所示,各步骤参照以上对应步骤的描述,此处不做展开说明。

根据本发明提供的图像识别方法,提取人物信息及人脸信息,将人物信息的识别与人脸信息的识别相结合,通过人物信息来补偿单一人脸识别的场景,提升匹配的准确率。进一步,通过文本信息提取,对文本信息进行匹配,基于编辑距离计算文本信息与预存储文本信息的相似度确定匹配度,可以提高识别准确率。

图4示出了根据本发明一个实施例的图像识别装置的功能框图。如图4所示,图像识别装置包括如下模块:

接收模块4010,适于接收至少一个图像接口上传的图像信息;

第一匹配计算模块4020,适于提取图像信息中包含的至少一个人物信息和至少一个人脸信息;将至少一个人物信息和至少一个人脸信息与预存储的对象信息进行匹配,分别得到匹配人物集以及匹配度集;其中,匹配人物集包括与至少一个人物信息匹配的第一匹配人物和与至少一个人脸信息匹配的第二匹配人物;匹配度集包括至少一个人物信息对应的第一匹配度和至少一个人脸信息对应的第二匹配度;

第一判断模块4030,适于判断匹配人物集中第一匹配人物与第二匹配人物是否为同一人物;若是,执行共同匹配模块;

第二匹配计算模块4040,适于根据第一匹配度和第二匹配度计算得到共同匹配度;

第二判断模块4050,适于判断共同匹配度是否大于第一匹配阈值;若是,执行分发模块;

分发模块4060,适于确定匹配成功,根据匹配结果分发图像。

可选地,接收模块4010进一步适于:

接收基于web页面图像接口上传的图像信息;

和/或,

接收基于客户端图像接口上传的图像信息;

和/或,

接收按照预设规则自动截取图像接口上传的图像信息。

可选地,装置还包括:第三判断模块4070,适于判断第一匹配度是否大于第二匹配度阈值;若是,执行分发模块4060;若否,执行第一判断模块4030。

可选地,装置还包括:第四判断模块4080,适于若第一判断模块4030判断匹配人物集中第一匹配人物与第二匹配人物不是为同一人物,或者,若第二判断模块4050判断共同匹配度不大于第一匹配阈值,则判断第二匹配度是否大于第三匹配阈值;若是,执行分发模块4060。

可选地,装置还包括:第三匹配计算模块4090,适于若第四判断模块4080判断第二匹配度不大于第三匹配阈值,则提取图像信息中包含的文本信息;将文本信息以及预存储文本信息进行匹配,确定第三匹配度;判断第三匹配度是否大于第四匹配阈值;若是,执行分发模块4060。

可选地,第三匹配计算模块4090进一步适于:

根据文本信息与预存储文本信息中各字符计算得到编辑距离;

根据编辑距离、文本信息的长度、预存储文本信息的长度和/或各字符间相似度计算得到第三匹配度;第三匹配度用于表征文本信息与预存储文本信息的相似度。

可选地,装置还包括:匹配失败模块4100,适于若判断第三匹配度不大于第四匹配阈值,则确定匹配失败。

以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。

本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的图像识别方法。

图5示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。

如图5所示,该电子设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。

其中:

处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。

通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。

处理器502,用于执行程序510,具体可以执行上述图像识别方法实施例中的相关步骤。

具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。

处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。

存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序510具体可以用于使得处理器502执行上述任意方法实施例中的图像识别方法。程序510中各步骤的具体实现可以参见上述图像识别实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

相关技术
  • 一种图像识别模型的训练方法、图像识别方法和相关装置
  • 图像识别方法、图像识别装置和电子设备
  • 碱基识别方法及装置、生成彩色图像的方法及系统
  • 一种图像中的对象识别方法及装置
  • 图像识别方法、装置、系统及内窥镜图像识别方法、装置
  • 图像识别方法及装置、眼底图像识别方法和电子设备
技术分类

06120115930339