掌桥专利:专业的专利平台
掌桥专利
首页

图片标签拓展方法、系统、电子设备、存储介质

文献发布时间:2024-04-18 20:01:23


图片标签拓展方法、系统、电子设备、存储介质

技术领域

本发明涉及人工智能提取技术领域,特别涉及一种图片标签拓展方法、系统、电子设备、存储介质。

背景技术

目前的POI(Point Of Interest)图片标签体系仅对图片中出现的客观物体进行标记记录,无法对现象、特征进行标注,并且新增标签需要人工逐个提取,训练标签则需人工对训练样本进行大量标注,可拓展性弱,应用场景有限,并且需要大量的人力成本。

发明内容

本发明要解决的技术问题是为了克服现有技术中现存的POI标签体系新增标签需人工逐个提取,可拓展性弱,应用场景有限的缺陷,提供一种图片标签拓展方法、系统、电子设备、存储介质。

本发明是通过下述技术方案来解决上述技术问题:

一种图片标签拓展方法,所述拓展方法包括:

获取图文数据中的关键词组和图片集;

将所述关键词组与所述图片集互相映射和图文映射关系,并生成图文匹配度;

输出图文匹配度大于预设阈值的关键词语作为图片标签。

可选地,所述获取图文数据中的关键词组和图片集的步骤包括:

挑选出所述图文数据文本中的词语进行词性分析以得到候选关键词语;

按语义理解所述候选关键词语在文本中的重要程度并排序,以选取关键词语。

可选地,所述词性分析的步骤包括:

筛选出句子中的名词、形容词、介词、代词、连词;

保留选取的名词作为候选关键词语。

可选地,所述图文映射关系包括图文对;所述将所述关键词组与所述图片集互相映射后生成图文映射关系和图文匹配度的步骤包括:

将选取的关键词语和图片进行逐个映射,生成图文对;

根据所述图文对中图片与关键词语的匹配程度生成所述图文匹配度。

可选地,在输出图文匹配度大于预设阈值的关键词语作为图片标签的步骤之后,所述图片标签拓展方法还包括:

统计所有输出的关键词语匹配所述图片的频次;

输出频次大于预设频次阈值的目标关键词语和对应图片;

将目标关键词作为所述对应图片的标签。

一种图片标签拓展系统,所述图片标签拓展系统包括:

获取模块,用于获取图文数据中的关键词组和图片集;

映射模块,用于将所述关键词组与所述图片集互相映射后生成映射关系,并生成图文匹配度;

比较模块,用于比较所述图文匹配度与阈值,输出合格的关键词语。

可选地,所述获取模块包括:

分析单元,用于挑选出所述图文数据文本中的词语进行词性分析以得到候选关键词语;

排序单元,用于按语义理解所述候选关键词语在文本中的重要程度并排序,以选取关键词语。

可选地,所述分析单元包括:

筛选子单元,用于筛选出句子中的名词、形容词、介词、代词、连词;

保留子单元,用于保留选取的名词作为候选关键词语。

可选地,所述映射模块包括:

映射单元,用于将选取的关键词语和图片进行逐个映射,生成图文对;

匹配单元,用于根据所述图文对中图片与关键词语的匹配程度生成所述图文匹配度。

可选地,所述图片标签拓展系统的模块还包括:

统计模块,用于统计所有输出的关键词语匹配所述图片的频次;

输出模块,用于输出频次大于预设频次阈值的目标关键词语和对应图片;

标签模块,用于将目标关键词作为图片的标签。

一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的图片标签拓展方法。

一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的图片标签拓展方法。

本发明的积极进步效果在于:本发明在开源训练集基础上加入用户内容图文对,优化文本特征编码器使其更适用于收集到的数据集,以文本向量与图片特征向量相互映射、比对阈值后输出高频的关键词,不再需要人工大量标注样本来训练模型,并且提高标签增加的频率,增强标签的拓展性并扩大其应用场景。

附图说明

为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

图1为本发明一示例性实施例提供的一种图片标签拓展方法的流程示意图。

图2为本发明一示例性实施例提供的图片标签拓展系统的模块示意图。

图3为本发明一示例性实施例提供的电子设备的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。

在本文提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在文中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

如本文中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。

本文中第一、第二的定义,本文中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本文中对设备个数的特别限定,不能构成对本文的任何限制。例如,可以将第一元件称为第二元件,而没脱离本公开的范围,类似地,可以将第二元件称为第一元件。

本文中使用了流程图用来说明根据本文的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。

图1为本发明一示例性实施例提供的一种图片标签拓展方法的流程示意图,图片标签拓展方法包括:

步骤101、获取图文数据中的关键词组和图片集;

步骤102、将关键词组与图片集互相映射后生成图文映射关系和图文匹配度;

步骤103、输出图文匹配度大于预设阈值的关键词语作为图片标签。

本方法是基于AI(Artificial Intelligence)模型训练来实现对图片标签的拓展,先使用大数据灌溉训练AI模型,在训练完成后使用AI模型先从用户发布的图文大数据中获取图文数据中的关键词组和图片集,再将关键词组与图片集组成互相映射的关系,生成图文映射关系,并根据关键词组与图片集的相似程度生成图文匹配度,通过对比图文匹配度选择出匹配度高的词组作为标签。

在一个实施例中,步骤101包括:

步骤1011、挑选出图文数据文本中的词语进行词性分析以得到候选关键词语;

步骤1012、按语义理解候选关键词语在文本中的重要程度并排序,以选取关键词语。

AI模型会优先将时间、地点、季节、交通、花销、住宿、美食等比较重要的关键词语以及与之相关的关键词语筛选出来。

在一个实施例中,词性分析的步骤包括:

筛选出句子中的名词、形容词、介词、代词、连词;

保留选取的名词作为候选关键词语。

在判断句子中词语的词性时,对于出现同形同音的词语,选取出现频次最高的那个词作为关键词语。

在一个实施例中,步骤102包括:

步骤1021、将选取的关键词语和图片进行逐个映射,生成图文对;

步骤1022、根据图文对中图片与关键词语的匹配程度生成图文匹配度。

在一个实施例中,在输出图文匹配度大于预设阈值的关键词语作为图片标签的步骤之后,图片标签拓展方法还包括:

步骤104、统计所有输出的关键词语匹配图片的频次;

步骤105、输出频次大于预设频次阈值的目标关键词语和对应图片;

步骤106、将目标关键词作为对应图片的标签。

例如,现有“西湖”、“雷峰塔”、“灵隐寺”等关键词语和对应图片若干张,经过频次统计后,西湖和雷峰塔两个关键词语匹配图片的频次大于预设频次阈值,所以选择西湖和雷锋塔作为图片的标签。

图2为本发明一示例性实施例提供的图片标签拓展系统的模块示意图,

图片标签拓展系统包括:

获取模块201,用于获取图文数据中的关键词组和图片集;

映射模块202,用于将关键词组与所述图片集互相映射后生成映射关系,并生成图文匹配度;

比较模块203,用于比较图文匹配度与阈值,输出合格的关键词语。

在一个实施例中,获取模块包括:

分析单元,用于挑选出图文数据文本中的词语进行词性分析以得到候选关键词语;

排序单元,用于按语义理解候选关键词语在文本中的重要程度并排序,以选取关键词语。

在一个实施例中,分析单元包括:

筛选子单元,用于筛选出句子中的名词、形容词、介词、代词、连词;

保留子单元,用于保留选取的名词作为候选关键词语。

可选地,映射模块202包括:

映射单元,用于将选取的关键词语和图片进行逐个映射,生成图文对;

匹配单元,用于根据图文对中图片与关键词语的匹配程度生成图文匹配度。

在一个实施例中,图片标签拓展系统的模块还包括:

统计模块,用于统计所有输出的关键词语匹配图片的频次;

输出模块,用于输出频次大于预设频次阈值的目标关键词语和对应图片;

标签模块,用于将目标关键词作为图片的标签。

本实施例对选出的关键词语标签还要进行人工审核,验证标签与图片对应关系,在验证图文准确无误后上线标签。

对于系统实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为单元显示的模块可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

图3为本发明一示例实施例示出的一种电子设备的结构示意图,示出了适于用来实现本发明实施方式的示例性电子设备30的框图。图3显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图3所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。

总线33包括数据总线、地址总线和控制总线。

存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。

存储器32还可以包括具有一组(至少一个)程序模块324的程序工具325(或实用工具),这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如上述任一实施例所提供的方法。

电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的电子设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的电子设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的电子设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

本发明实施例还提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所提供的方法。

其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中,本发明实施例还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现上述任一实施例的方法。

其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

相关技术
  • 一种治疗颈肩腰腿痛的泡脚药包
  • 治疗颈肩腰腿痛的中药热敷包及其治疗颈肩腰腿痛的方法
技术分类

06120116549572