掌桥专利:专业的专利平台
掌桥专利
首页

图像风控大模型训练方法、图像风控方法及相关装置

文献发布时间:2024-04-18 19:59:31


图像风控大模型训练方法、图像风控方法及相关装置

技术领域

本发明涉及视频技术领域,具体而言,涉及一种图像风控大模型训练方法、图像风控方法及相关装置。

背景技术

随互联网直播、短视频行业的兴起,相关数据在近年得到了爆发式的增长。为维护健康有序的网络环境,需有效监管直播和视频数据中出现的违规敏感内容。海量直播数据无法通过人工逐一审核。

当前业界图像风控领域,通常采用定制化深度学习模型,这意味着面对新的违规场景案例、新的审核需求的时候,需要对定制化深度学习模型重新开发训练,开发训练包括:需求评审与对接、数据采集与清洗、模型选型与训练、接口开发与适配、模型部署与灰度以及业务效果评估与上线等流程。这将导致开发周期较长和成本较高,从而影响图像风控的效率和准确率。

发明内容

有鉴于此,本发明的目的在于提供一种图像风控大模型训练方法、图像风控方法及相关装置,能够有效缩短图像风控大模型的开发周期,同时提高图像风控大模型的泛化能力和检测准确率。

为了实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明提供一种图像风控大模型训练方法,应用于服务器,所述图像风控大模型包括图像特征提取模型和大语言模型,所述方法包括:

将第一训练图像输入所述图像特征提取模型获得第一图像特征向量;

将所述第一图像特征向量与第一风控指令通过桥接参数适配输入至待验证的大语言模型,以获取当前训练周期的第一待验证违规识别信息;所述桥接参数用于表征对齐图像的特征空间与所述大语言模型的特征空间;所述第一风控指令用来指示违规风控的范围;

将所述第一待验证违规识别信息、提示词和预期结果输入预设大模型确定相似度;所述预期结果表征所述第一训练图像的实际违规信息;所述相似度表征当前训练周期的第一待验证违规识别信息和所述预期结果的相似得分;

根据每个训练周期对应的相似度对所述桥接参数进行更新,直至第M个训练周期对应的相似度满足验收条件,则将第M个训练周期对应的训练后的图像风控大模型作为成熟的图像风控大模型。

在可选的实施方式中,所述将所述第一图像特征向量与第一风控指令通过桥接参数适配输入至待验证的大语言模型,以获取当前训练周期的第一待验证违规识别信息的步骤,包括:

获取所述待验证的大语言模型的初始参数;

将所述第一风控指令输入所述待验证的大语言模型获得第一风控指令向量;

根据所述第一图像特征向量、所述第一风控指令向量、所述初始参数和当前训练周期对应的桥接参数获得当前训练周期的第一待验证违规识别信息。

在可选的实施方式中,在所述将第一训练图像输入所述图像特征提取模型获得第一图像特征向量的步骤之前,还包括:

获取第二训练图像和第二风控指令,根据所述第二风控指令对所述第二训练图像进行构建得到训练违规数据;所述训练违规数据包括违规对象和违规对象的知识描述;所述知识描述用来记录违规对象的实际违规信息;

将所述违规对象输入所述图像特征提取模型获得第二图像特征向量;

将所述第二图像特征向量和所述第二风控指令通过待训练桥接参数适配输入至待验证的大语言模型,以获得当前预训练周期的第二待验证违规识别信息;

根据所述第二待验证违规识别信息和对应的知识描述确定损失值;所述损失值表征当前预训练周期的第二待验证违规识别信息和对应的违规对象的实际违规信息的差异;

根据每个预训练周期对应的损失值对所述待训练桥接参数进行更新;直至第N个预训练周期对应的损失值满足收敛条件,则将第N个预训练周期对应的待训练桥接参数作为所述桥接参数。

在可选的实施方式中,所述根据所述第二风控指令对所述第二训练图像进行构建得到训练违规数据的步骤,包括:

对所述第二训练图像进行去重处理,得到目标训练图像;

对所述目标训练图像进行检测截取处理,得到训练对象;

将所述训练对象和所述第二风控指令输入违规分类模型,得到所述违规对象;

获取所述违规对象的知识描述,根据所述违规对象和对应的知识描述得到所述训练违规数据。

第二方面,本发明提供一种图像风控方法,应用于图像风控大模型,所述图像风控大模型包括图像特征提取模型和大语言模型,所述方法包括:

将待检测图像输入所述图像特征提取模型获得第三图像特征向量;

将所述第三图像特征向量和待检测风控指令通过成熟桥接参数输入至所述大语言模型,以获取待检测图像的违规识别信息;所述违规识别信息用于判断所述待检测图像是否存在违规现象。

在可选的实施方式中,所述大语言模型的风控函数为:

y=W

其中,W

第三方面,本发明提供一种图像风控大模型训练装置,应用于服务器,所述图像风控大模型包括图像特征提取模型和大语言模型,所述装置包括:

处理模块,用于将第一训练图像输入所述图像特征提取模型获得第一图像特征向量;

识别模块,用于将所述第一图像特征向量与第一风控指令通过桥接参数适配输入至待验证的大语言模型,以获取当前训练周期的第一待验证违规识别信息;所述桥接参数用于表征对齐图像的特征空间与所述大语言模型的特征空间;所述第一风控指令用来指示违规风控的范围;将所述第一待验证违规识别信息、提示词和预期结果输入预设大模型确定相似度;所述预期结果表征所述第一训练图像的实际违规信息;所述相似度表征当前训练周期的第一待验证违规识别信息和所述预期结果的相似得分;

迭代模块,用于根据每个训练周期对应的相似度对所述桥接参数进行更新,直至第M个训练周期对应的相似度满足验收条件,则将第M个训练周期对应的训练后的图像风控大模型作为成熟的图像风控大模型。

第四方面,本发明提供一种图像风控装置,应用于图像风控大模型,所述图像风控大模型包括图像特征提取模型和大语言模型,所述装置包括:

提取模块,用于将待检测图像输入所述图像特征提取模型获得第三图像特征向量;

检测模块,用于将所述第三图像特征向量和待检测风控指令通过成熟桥接参数输入至所述大语言模型,以获取待检测图像的违规识别信息;所述违规识别信息用于判断所述待检测图像是否存在违规现象。

第五方面,本发明提供一种服务器,所述服务器包括处理器和存储器,所述存储器用于存储程序,所述处理器用于在执行所述程序时,实现前述实施方式中任一项所述的图像风控大模型训练方法或前述实施方式中任一项所述的图像风控方法。

第六方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现前述实施方式中任一项所述的图像风控大模型训练方法或前述实施方式中任一项所述的图像风控方法。

相比于现有技术,本发明实施例提供的图像风控大模型训练方法、图像风控方法及相关装置,该方法的图像风控大模型包括图像特征提取模型和大语言模型,借助大语言模型优秀的语言理解、认知推理和知识迁移能力,利用图像特征提取模型获取业务图像的特征向量,通过迭代更新桥接参数对齐图像的特征空间与大语言模型的特征空间,在保证大语言模型通用能力的同时降低训练难度。在训练过程中利用预设大语言模型自动评估图像风控大模型,提高训练阶段模型的收敛速度,有助于缩短图像风控大模型的开发周期,使得图像风控大模型具备更好的泛化能力和更高的检测准确率,同时能够有效降低人工成本。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例提供的图像风控大模型训练方法的一种流程示意图。

图2示出了图1中步骤S109的子步骤的一种流程示意图。

图3示出了本发明实施例提供的图像风控大模型训练方法的另一种流程示意图。

图4示出了本发明实施例提供的图像风控方法的一种流程示意图。

图5示出了本发明实施例提供的图像风控大模型训练装置的方框示意图。

图6示出了本发明实施例提供的图像风控装置的方框示意图。

图7示出了本发明实施例提供的服务器的一种方框示意图。

图标:100-服务器;110-存储器;120-处理器;130-通信模块;200-图像风控大模型训练装置;201-处理模块;202-识别模块;203-迭代模块;300-图像风控装置;301-提取模块;302-检测模块。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

在直播或视频平台上,有越来越多用户上传的视频或者主播开播内容,其中可能存在不文明词汇、不文明画面、热点敏感话题等违规内容的不良画面内容。为了有效监管违规敏感内容,一般通过画面风控及时识别高风险内容,营造健康有序、合规合法的网络环境。这里提及的画面风控也就是图像风控。

现有技术中,一种有效的图像风控方法是基于大数据驱动的监督式深度学习算法。通常采用定制化深度学习模型,但出现违规新需求时,需要对定制化深度学习模型开发验证违规新需求,这样的开发周期较长,同时由于时间长严重影响违规新需求的风控检测准确率和效率。

目前,图像风控检测除了可以使用定制化深度学习模型,还可以使用视觉大模型,视觉大模型是一种综合性的多模态大模型,多模态体现在同时处理图像和文本两种信息模态。视觉大模型结合了图像特征模块和大语言模型,旨在达到对图像和文本信息进行认知理解、内容生成的目的。例如ChatGPT等大语言模型在文本理解和生成方面表现卓越,其涌现的智能令人激动,但ChatGPT并不具备对图像的理解和生成能力。

尽管近期新发布的综合性多模态大模型GPT-4V加上了对图像的理解功能,但经业界和多行业测试发现,GPT-4V在理解通用常见的视觉对象时表现优异。但在一些专业领域或特殊场景时,图像风控检测效果并不如人意,视觉大模型的泛化能力较差。

值得一提的是,ChatGPT和GPT-4V目前并未开源,为此,业界和学术界都试图复现其效果。例如开源的VisualGLM、MiniGPT-4等视觉大模型,经发明人研究发现,其主要技术原理是采用公开、通用的数据对图像视觉和语言模型进行两个阶段的训练。这些开源的视觉大模型尽管在通用常见的场景中表现出一定的认知推理能力,但是在未见过的场景或者专业领域表现较差,并且缺乏通用高效的定量评估手段。

为了解决上述问题,本发明核心改进在于借助大语言模型优秀的语言理解、认知推理和知识迁移能力,利用图像特征提取模型获取业务图像的特征向量,通过迭代更新桥接参数对齐图像的特征空间与大语言模型的特征空间,在保证大语言模型通用能力的同时降低训练难度。在训练过程中利用预设大语言模型自动评估图像风控大模型,提高训练阶段模型的收敛速度,有助于缩短图像风控大模型的开发周期,使得图像风控大模型具备更好的泛化能力和更高的检测准确率,同时能够有效降低人工成本。

下面为了更好地说明图像风控大模型的桥接参数的训练过程,以完成了“预训练阶段”的图像风控大模型为例,对“训练阶段”进行说明。请参照图1,图1示出了本发明实施例提供的一种图像风控大模型训练方法的流程示意图,该方法包括以下步骤:

步骤S108,将第一训练图像输入图像特征提取模型获得第一图像特征向量。

在本发明实施例中,采集直播平台或者网络视频中包含违规敏感内容的图像,并将采集的图像作为第一训练图像,与第一风控指令一起传给服务器,服务器将接收到的第一训练图像输入到图像特征提取模型,映射得到对应的第一图像特征向量。其中,图像特征提取模型是根据图像风控检测业务图像预先训练得到的,例如可以为预先训练的VisionTransformer模型。

步骤S109,将第一图像特征向量与第一风控指令通过桥接参数适配输入至待验证的大语言模型,以获取当前训练周期的第一待验证违规识别信息。

其中,桥接参数用于表征对齐图像的特征空间与大语言模型的特征空间。第一风控指令用来指示违规风控的范围。

在本发明实施例中,大语言模型是根据违规文本数据预先训练得到的,例如可以为预先训练的Vicuna大语言模型或预先训练的ChatGLM大语言模型。

需要说明的是,为了利用大语言模型识别业务图像中的违规信息,即为了将业务违规数据注入到大语言模型中,需要调试更新大语言模型的参数。但是大语言模型的参数更新存在两个困难,一个是参数的数量规模过大,训练更新成本极高。另一个是由于业务图像规模相对于参数的数量规模过小,更新参数容易导致过拟合问题,从而导致大语言模型产生灾难性知识遗忘的问题。

为了解决上述问题,同时实现将大语言模型的特征空间对齐到图像的特征空间,则使用桥接参数对大语言模型进行特征适配,通过桥接参数将第一图像特征向量和第一风控指令输入至待验证的大语言模型,经待验证的大语言模型处理后得到当前训练周期的第一待验证违规识别信息。

假设,将图像的特征空间和大语言模型的特征空间对齐学习后,得到的待验证的图像风控大模型记为Model

Response=Model

其中,Instruct为第一风控指令;a为业务图像,即第一训练图像;Response为Model

例如,若要识别第一训练图像a中是否包含xxx的文字内容或画面内容,则可以将第一风控指令设置为“请识别业务图像a中是否包含违规内容xxx,若包含违规内容xxx则对违规信息进行描述”。待验证的图像风控大模型根据第一风控指令识别第一训练图像中包含违规内容xxx,得到第一待验证违规识别信息。

步骤S110,将第一待验证违规识别信息、提示词和预期结果输入预设大模型确定相似度。

其中,预期结果表征第一训练图像的实际违规信息。相似度表征当前训练周期的第一待验证违规识别信息和预期结果的相似得分。

在本发明实施例中,为评估第一待验证违规识别信息的效果,首先由业务审核专家人工生成期望的业务反馈,即预期结果。假设将ChatGPT作为预设大模型,令ChatGPT承接业务图像风控审核专家的职责,提示词可以编写为“我是一名内容审核安全工程师,现在需要你扮演一个智能打分程序,对不文明词汇、不文明画面、热点敏感话题等违规内容的有着专业的审核和理解能力,让我们一起努力营造良好的互联网环境。现在我们的审核工作是:给出两段文本段落,并分别用标准段落、候选段落来指示,请你判断候选段落是否贴合标准段落的意思,如果满分是100,请从准确性、文本通畅性等考虑打分。请帮忙一步一步思考和判断打分。注意,请首先返回你的评分回答,之后再一步一步给出你打分的判断和分析根据,上述通过json格式返回”。提示词用于激发预设大模型生成所需的相似度。

作为一种可能的实施方式,相似度获取表达式可以为:

Score=ChatGPT(Prompt,Response,Human),0≤Score≤100

其中,Score为相似度,分数越高表征图像风控大模型得到的第一待验证违规识别信息与业务审核专家的预期结果越接近,Prompt为提示词,Human为预期结果。

步骤S111,判断相似度是否满足验收条件,若否则执行步骤S112,若是则执行步骤S113。

作为一种可能的实施方式,假设图像风控大模型的验收测试总次数为1000次,相似度得分高于85分的测试次数超过950次,则认为图像风控大模型验收合格。也就是说,验收条件可以为相似度得分高于85分的比例超过95%。可根据实际应用场景设置验收条件,对此本发明不予限定。

步骤S112,根据每个训练周期对应的相似度对桥接参数进行更新。

作为一种可能实施方式,对于该“训练阶段”,图像风控大模型的桥接参数可以经历多个周期的训练周期迭代,即每个训练周期均可以通过上述步骤S108-步骤S110获取对应周期的相似度;进而利用该相似度对桥接参数进行更新。

需要说明的是,本发明利用桥接参数对齐图像的特征空间和大语言模型的特征空间,通过不断比对当前训练周期的第一待验证违规识别信息和预期结果之间的差异来调整更新桥接参数,以使通过迭代更新的桥接参数适配识别得到的第一待验证违规识别信息越来越精准,直到与预期结果之间的相似度满足验收条件为止。从而使得大语言模型在保证通用能力的同时降低训练难度,有助于缩短图像风控大模型的开发周期和提升检测准确率。

具体地,当执行完步骤S112后,返回执行步骤S108-步骤S110,开始新一个训练周期的训练。

步骤S113,将第M个训练周期对应的训练后的图像风控大模型作为成熟的图像风控大模型。

可选的,M为大于等于1的自然数。

具体地,对于每个训练周期,可以根据对应的相似度对桥接参数进行更新,直至第M个训练周期对应的相似度满足验收条件,则将第M个训练周期对应的训练后的图像风控大模型作为成熟的图像风控大模型。

在本发明实施例中,经过迭代训练后的满足验收条件的图像风控大模型可以作为成熟的图像风控大模型,用于业务图像的风控检测。可见,本发明实施例提供的图像风控大模型训练方法经过预训练阶段后能够利用图像风控大模型自动辅助描述新的业务图像的违规信息,无需人工介入,经过多轮循环迭代后,训练效率能够得到极大提升,直到满足业务指标。

综上所述,本发明实施例提供的图像风控大模型训练方法,借助大语言模型优秀的语言理解、认知推理和知识迁移能力,利用图像特征提取模型获取业务图像的特征向量,通过迭代更新桥接参数对齐图像的特征空间与大语言模型的特征空间,在保证大语言模型通用能力的同时降低训练难度。在训练过程中利用预设大语言模型自动评估图像风控大模型,提高训练阶段模型的收敛速度,有助于缩短图像风控大模型的开发周期,使得图像风控大模型具备更好的泛化能力和更高的检测准确率,同时能够有效降低人工成本。

可选地,在实际应用中,通过大语言模型的初始参数来确保大语言模型的通用能力,同时避免出现过拟合现象。请参照图2,图1中步骤S109的子步骤,可以包括:

步骤S1091,获取待验证的大语言模型的初始参数。

步骤S1092,将第一风控指令输入待验证的大语言模型获得第一风控指令向量。

步骤S1093,根据第一图像特征向量、第一风控指令向量、初始参数和当前训练周期对应的桥接参数获得当前训练周期的第一待验证违规识别信息。

在本发明实施例中,将第一图像特征向量和第一风控指令输入待验证的大语言模型,待验证的大语言模型根据第一风控指令生成对应的第一风控指令向量,再根据待验证的大语言模型的初始参数、第一图像特征向量、第一风控指令向量和当前训练周期对应的桥接参数获取当前训练周期的第一待验证违规识别信息。

在一种可能的实施方式中,待验证的大语言模型的风控函数可以表示为:

y

其中,W

需要说明的是,W

为了更有效降低训练更新成本,达到快速训练收敛的效果,作为一种实现方式,可以引入降维矩阵D和升维矩阵U组成桥接参数来对齐图像的特征空间与大语言模型的特征空间。待验证的大语言模型的风控函数还可以表示为:

y

其中,W

进一步地,在进行上述“训练阶段”之前,首先需要对图像风控大模型预设的待训练桥接参数进行训练,即“预训练阶段”。下面对“预训练阶段”进行说明。请参照图3,图3示出了本发明实施例提供的图像风控大模型训练方法的另一种流程示意图,在步骤S106之前,还包括:

步骤S101,获取第二训练图像和第二风控指令,根据第二风控指令对第二训练图像进行构建得到训练违规数据。

其中,训练违规数据包括违规对象和违规对象的知识描述。知识描述用来记录违规对象的实际违规信息。

在本发明实施例中,在进行预训练之前,需要采集直播平台或者网络视频中违规敏感场景下的图像,并将采集的图像作为第二训练图像与第二风控指令一同发送给服务器,服务器收到第二训练图像和第二风控指令,并根据第二风控指令构建第二训练图像得到训练违规数据。

其中,违规对象是包含违规内容的部分第二训练图像。而第二风控指令与前文所述的第一风控指令的作用相似,是用来指示第二训练图像的违规风控范围。例如,若要识别第二训练图像b中是否包含zzz的文字内容或画面内容,则可以将第二风控指令设置为“请识别业务图像b中是否包含违规内容zzz,若包含违规内容zzz则对违规信息进行描述”。

需要说明的是,在采集业务图像时,更多样化的业务图像意味着更丰富的业务领域知识,更有利于在迭代训练桥接参数时发挥更好的业务效果。

步骤S102,将违规对象输入图像特征提取模型获得第二图像特征向量。

步骤S103,将第二图像特征向量和第二风控指令通过待训练桥接参数适配输入至待验证的大语言模型,以获得当前预训练周期的第二待验证违规识别信息。

在本发明实施例中,大语言模型是经过业务违规数据预先训练得到的,例如可以为预训练的Vicuna、ChatGLM等大语言模型。服务器系统上电初始化时,随机生成一个待训练桥接参数,并在预训练阶段迭代更新训练该待训练桥接参数。

步骤S104,根据第二待验证违规识别信息和对应的知识描述确定损失值。

其中,损失值表征当前预训练周期的第二待验证违规识别信息和对应的违规对象的实际违规信息的差异。

步骤S105,判断损失值是否满足收敛条件,若否则执行步骤S106,若是则执行步骤S107。

步骤S106,根据每个预训练周期对应的损失值对待训练桥接参数进行更新。

作为一种可能实施方式,对于该“预训练阶段”,图像风控大模型的待训练桥接参数可以经历多个周期的预训练周期迭代,即每个预训练周期均可以通过上述步骤S101-步骤S104获取对应周期的损失值;进而利用该损失值对待训练桥接参数进行更新。

具体地,当执行完步骤S106后,返回执行步骤S101-步骤S104,开始新一个预训练周期的训练。

步骤S107,将第N个预训练周期对应的待训练桥接参数作为桥接参数。

可选的,N为大于等于1的自然数。

具体地,对于每个预训练周期,可以根据对应的损失值对待训练桥接参数进行更新,直至第N个预训练周期对应的损失值满足收敛条件,则将第N个预训练周期对应的待训练桥接参数作为桥接参数。

需要说明的是,收敛条件可以根据实际业务需求进行设置,本发明不予限定。例如收敛条件可以设置为第二待验证违规识别信息和对应的违规对象的实际违规信息的差异低于5%,即第二待验证违规识别信息和对应的违规对象的实际违规信息的差异比例低于5%则认为预训练阶段完成。

可选地,在预训练阶段对第二训练图像进行违规构建得到训练违规数据。图3中步骤S10中根据第二风控指令对第二训练图像进行构建得到训练违规数据的子步骤,可以包括:

对第二训练图像进行去重处理,得到目标训练图像。对目标训练图像进行检测截取处理,得到训练对象。将训练对象和第二风控指令输入违规分类模型,得到违规对象。获取违规对象的知识描述,根据违规对象和对应的知识描述得到训练违规数据。

在本发明实施例中,为避免信息冗余,可以通过图像相似度算法对第二训练图像进行去重处理,例如采用感知哈希算法对第二训练图像去重,得到目标训练图像。假设目标训练图像的集合set=[t

在目标训练图像中存在的违规画面区域往往较小,即图像画面的大部分面积展示为正常内容。为了降低这些正常画面或者正常背景的干扰,在后续更高效将违规区域信息注入大语言模型,需要进行违规区域的精细化截取。

虽然手工截取方式是最准确的精细化截取方式,但费时费力,违规区域截取效率较低。本发明实施例基于通用检测算法,例如YOLO(You Only Look Once)系列算法、FasterRCNN算法等分别对每个目标训练图像进行检测和截取,得到每个目标训练图像中的多个训练对象。以目标训练图像t

接下来,进行违规对象的筛选,可以将训练对象和第二风控指令输入违规分类模型得到违规对象。当然,也可以人工进行手动筛选违规对象。继续以目标训练图像t

经过上述对每个目标训练图像进行处理,得到每个目标训练图像中的违规对象,并对违规对象进行去重处理。将去重后的违规对象通过可视化界面展现给业务图像审核专家,由业务图像审核专家人工反馈违规对象的实际违规信息生成每个违规对象的知识描述,并将全部违规对象的知识描述一一对应的传给服务器,服务器根据违规对象和对应的知识描述生成训练违规数据,用于对大语言模型进行预训练。

在完成了上述“预训练阶段”与“训练阶段”后,即获得一个成熟的图像风控大模型。下面基于成熟的图像风控大模型对图像风控检测的各实施例进行说明。

请参照图4,图4示出了本发明实施例提供的图像风控方法的一种流程示意图。该方法包括以下步骤:

步骤S201,将待检测图像输入图像特征提取模型获得第三图像特征向量。

步骤S202,将第三图像特征向量和待检测风控指令通过成熟桥接参数输入至大语言模型,以获取待检测图像的违规识别信息。

其中,违规识别信息用于判断待检测图像是否存在违规现象。

在本发明实施例中,经过“预训练阶段”和“训练阶段”得到成熟的图像风控大模型,成熟的图像风控大模型可以用于图像风控检测,从而实现自动获取待检测图像的违规识别信息的功能。成熟桥接参数即为成熟的图像风控大模型对应的桥接参数。

综上所述,本发明实施例提供的图像风控方法,通过采用完成“预训练阶段”和“训练阶段”后成熟的图像风控大模型,由于根据图像风控大模型的违规识别信息和实际违规信息之间的差异迭代更新桥接参数,使得训练成熟的图像风控大模型对于业务图像的风控检测更加准确,进一步提升风控审核的通用性和灵活性。

可选地,大语言模型的风控函数为:

y=W

其中,W

基于同一发明构思,本发明实施例还提供了一种图像风控大模型训练装置和图像风控装置。其基本原理及产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。

请参照图5,图5示出了本发明实施例提供的一种图像风控大模型训练装置200的方框示意图。图像风控大模型训练装置200包括处理模块201,识别模块202和迭代模块203。

处理模块201,用于将第一训练图像输入图像特征提取模型获得第一图像特征向量。

识别模块202,用于将第一图像特征向量与第一风控指令通过桥接参数适配输入至待验证的大语言模型,以获取当前训练周期的第一待验证违规识别信息;桥接参数用于表征对齐图像的特征空间与大语言模型的特征空间;第一风控指令用来指示违规风控的范围;将第一待验证违规识别信息、提示词和预期结果输入预设大模型确定相似度;预期结果表征第一训练图像的实际违规信息;相似度表征当前训练周期的第一待验证违规识别信息和预期结果的相似得分。

迭代模块203,用于根据每个训练周期对应的相似度对桥接参数进行更新,直至第M个训练周期对应的相似度满足验收条件,则将第M个训练周期对应的训练后的图像风控大模型作为成熟的图像风控大模型。

综上所述,本发明实施例提供的图像风控大模型训练装置,借助大语言模型优秀的语言理解、认知推理和知识迁移能力,利用图像特征提取模型获取业务图像的特征向量,通过迭代更新桥接参数对齐图像的特征空间与大语言模型的特征空间,在保证大语言模型通用能力的同时降低训练难度。训练过程中利用预设大语言模型自动评估图像风控大模型,提高训练阶段模型的收敛速度,有助于缩短图像风控大模型的开发周期,使得图像风控大模型具备更好的泛化能力和更高的检测准确率,同时能够有效降低人工成本。

可选地,识别模块202,具体用于获取待验证的大语言模型的初始参数;将第一风控指令输入待验证的大语言模型获得第一风控指令向量;根据第一图像特征向量、第一风控指令向量、初始参数和当前训练周期对应的桥接参数获得当前训练周期的第一待验证违规识别信息。

可选地,处理模块201,还用于获取第二训练图像和第二风控指令,根据第二风控指令对第二训练图像进行构建得到训练违规数据;训练违规数据包括违规对象和违规对象的知识描述;知识描述用来记录违规对象的实际违规信息;将违规对象输入图像特征提取模型获得第二图像特征向量。

识别模块202,还用于将第二图像特征向量和第二风控指令通过待训练桥接参数适配输入至待验证的大语言模型,以获得当前预训练周期的第二待验证违规识别信息;根据第二待验证违规识别信息和对应的知识描述确定损失值;损失值表征当前预训练周期的第二待验证违规识别信息和对应的违规对象的实际违规信息的差异。

迭代模块203,还用于根据每个预训练周期对应的损失值对待训练桥接参数进行更新;直至第N个预训练周期对应的损失值满足收敛条件,则将第N个预训练周期对应的待训练桥接参数作为桥接参数。

可选地,处理模块201,具体用于对第二训练图像进行去重处理,得到目标训练图像;对目标训练图像进行检测截取处理,得到训练对象;将训练对象和第二风控指令输入违规分类模型,得到违规对象;获取违规对象的知识描述,根据违规对象和对应的知识描述得到训练违规数据。

请参照图6,图6示出了本发明实施例提供的一种图像风控装置300的方框示意图。图像风控装置300包括提取模块301和检测模块302。

提取模块301,用于将待检测图像输入图像特征提取模型获得第三图像特征向量;

检测模块302,用于将第三图像特征向量和待检测风控指令通过成熟桥接参数输入至大语言模型,以获取待检测图像的违规识别信息;违规识别信息用于判断待检测图像是否存在违规现象。

综上所述,本发明实施例提供的图像风控装置,通过采用完成“预训练阶段”和“训练阶段”后成熟的图像风控大模型,由于根据图像风控大模型的违规识别信息和实际违规信息之间的差异迭代更新桥接参数,使得训练成熟的图像风控大模型对于业务图像的风控检测更加准确,进一步提升风控审核的通用性和灵活性。

可选地,检测模块302,还用于使用大语言模型的风控函数获取待检测图像的违规识别信息。大语言模型的风控函数为:

y=W

其中,W

请参照图7,图7为本发明实施例提供的服务器100的一种方框示意图。服务器100包括存储器110、处理器120及通信模块130。存储器110、处理器120以及通信模块130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。

其中,存储器110用于存储程序或者数据。存储器110可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-Only Memory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。

处理器120用于读/写存储器110中存储的数据或程序,并执行相应地功能。例如,当存储器110中存储的计算机程序被处理器120执行时,可以实现上述各实施例所揭示的图像风控大模型训练方法或图像风控方法。

通信模块130用于通过网络建立服务器100与其它通信终端之间的通信连接,并用于通过网络收发数据。

应当理解的是,图7所示的结构仅为服务器100的结构示意图,服务器100还可包括比图7中所示更多或者更少的组件,或者具有与图7所示不同的配置。图7中所示的各组件可以采用硬件、软件或其组合实现。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器120执行时实现上述各实施例所揭示的图像风控大模型训练方法或图像风控方法。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称:ROM)、随机存取存储器(Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120116524896