掌桥专利:专业的专利平台
掌桥专利
首页

检测对象的方法、装置和系统

文献发布时间:2023-06-19 11:29:13


检测对象的方法、装置和系统

技术领域

本申请涉及数据处理领域,具体而言,涉及一种检测对象的方法、装置和系统。

背景技术

目前,电子商务平台在向用户提供方便接口的同时,一些违规商品,例如,枪支配件、色情暴力的图像影音、毒品等也容易被用户获得。违规商品的传播会对电子商务平台、用户,甚至社会都带来危害,因此对于电子商务平台的提供商来说,急需更加智能和高效的方法来召回违规商品。为了维护电子商务平台的环境,现有技术通常采用以下两种方式来对违规商品进行检测:

方式一:基于敏感关键词拦截结合人工审核的方法。该方法通常由相关领域专家基于已有的业务积累,提出和违规商品相关的敏感词典。同时,在人工审核的过程中,根据业务变化,随时增添敏感词典中的关键词。尽管该方法可以拦截绝大多数违规商品,但该方式不够灵活,很难应付卖家创造的新词或者新的描述。例如,出售违规商品的卖家在向电子商务平台上传违规商品的相关信息(例如,搜索信息)时,会尽量避免使用高危词汇,而是采用高危词汇的同义词,甚至完全和违规商品不相关的词来作为该商品的相关信息,以此来躲避审核机制。例如,在图1所示的电子商务平台的显示界面中,色情暴力的图像影音的关键词为“电影资源”、“网盘”、“云盘”、“网站”、“软件”,电子商务平台的审核机制无法检测出该商品为违规商品。另外,经验丰富的买家也可通过自己的搜索技术将违规商品从海量的相似商品中搜索出,例如,在图2所示的电子商务平台的显示界面中,买家通过与卖家沟通来搜索违规的图像影音。

方式二:基于特征提取的机器学习或者深度学习方法。该方法通常利用商品的文本信息作为特征,训练机器学习或者深度学习分类模型以理解商品文本中蕴含的语义。然而,由于违规商品的文本内容相对来说比较隐晦或者与正常商品相似,因此,已有的基于机器学习和深度学习的模型也很难捕捉到有效的语义。此外,由于这些模型需要大量的训练语料,而这些由商品本身的信息(例如,商品标题)或描述数据很难快速捕捉到商品文本信息中的变化,训练好的模型相对于最新的场景存在时延,因此,在线上使用该方法可能无法满足业务需求。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种检测对象的方法、装置和系统,以至少解决现有技术对违规商品进行检测的准确率低的技术问题。

根据本申请实施例的一个方面,提供了一种检测对象的方法,包括:获取用户行为数据,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;根据标签确定目标对象是否包括异常对象。

根据本申请实施例的另一方面,还提供了一种检测对象的方法,包括:获取与目标对象对应的用户行为数据,其中,用户行为数据至少包括:查询数据以及对象数据;基于预设模型对用户行为数据进行检测,得到检测结果,其中,检测结果用于表征目标对象是否为异常对象,预设模型为使用多组数据通过神经网络学习训练得到的,多组数据中的每组数据至少包括:对对象进行查询时的用户行为数据,以及标签,标签用于表征对象是否为异常对象。

根据本申请实施例的另一方面,还提供了一种检测对象的装置,包括:获取模块,用于获取用户行为数据,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;处理模块,用于分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;拼接模块,用于对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;确定模块,用于根据标签确定目标对象是否包括异常对象。

根据本申请实施例的另一方面,还提供了一种检测对象的系统,包括:电子平台,用于获取用户行为数据,并基于预设模型对用户行为数据进行检测,得到检测结果,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;预设平台,用于在确定目标对象为异常对象的情况下,对目标对象进行召回处理。

根据本申请实施例的另一方面,还提供了一种检测对象的平台,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取用户行为数据,并基于预设模型对用户行为数据进行检测,得到检测结果,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;在确定目标对象为异常对象的情况下,对目标对象进行召回处理。

根据本申请实施例的另一方面,还提供了一种检测对象的方法,包括:获取用户行为数据,其中,用户行为数据表征通过与即时通讯工具关联的电商平台查询目标对象的过程中所产生的数据,用户行为数据至少包括:查询数据以及对象数据;分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;根据标签确定目标对象是否包括异常对象。

根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的检测对象的方法。

根据本申请实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述的检测对象的方法。

在本申请实施例中,采用检测用户行为数据的方式,在获取到购买目标对象的过程所产生的用户行为数据之后,分别对用户行为数据中的查询数据以及对象数据进行向量化处理,得到第一向量和第二向量,并对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,从而得到表征目标对象是否包括异常对象的标签。

由此可见,本申请所提供的方案达到了违规商品进行检测的目的,从而实现了提高违规商品的检测准确度的技术效果,进而解决了现有技术对违规商品进行检测的准确率低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据现有技术的一种电子商务平台的显示界面示意图;

图2是根据现有技术的一种电子商务平台的显示界面示意图;

图3是根据本申请实施例的一种可选的计算机设备的示意图;

图4是根据本申请实施例的一种检测对象的方法的流程图;

图5是根据本申请实施例的一种可选的预设模型对用户行为数据的处理示意图;

图6是根据本申请实施例的一种检测对象的方法的流程图;

图7是根据本申请实施例的一种检测对象的装置的示意图;

图8是根据本申请实施例的一种检测对象的系统的示意图;

图9是根据本申请实施例的一种计算设备的结构框图;以及

图10是根据本申请实施例的一种检测对象的方法的流程图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本申请实施例,还提供了一种检测对象的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算设备或者类似的运算装置中执行。图3示出了一种用于实现检测对象的方法的计算设备的硬件结构框图。如图3所示,计算设备10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(BUS)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图3所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备10还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的检测对象的方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的检测对象的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备10(或移动设备)的用户界面进行交互。

此处需要说明的是,在一些可选实施例中,上述图3所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图3仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。

在上述运行环境下,本申请提供了如图4所示的检测对象的方法。需要说明的是,本实施例所提供的方法可应用在电子商务平台上,其中,电子商务平台具有预设模型,该预设模型可对购买目标对象的过程中所产生的数据进行处理,以确定目标对象是否为异常对象,即在本实施例中,电子商务平台中的预设模可作为本实施例中的执行主体。

具体的,图4是根据本申请实施例一的检测对象的方法的流程图,由图4可知,该方法包括如下步骤:

步骤S402,获取用户行为数据,其中,用户行为数据表征查询购买目标对象的过程所产生的数据。

在步骤S402中,目标对象可以为用户所要购买的商品,其中,目标对象可以为实体商品,也可以为虚拟商品(例如,影像、图片、软件等)。电子商务平台能够显示目标对象的相关信息,并为用户提供购买该目标对象的渠道。其中,目标对象的相关信息可以为该目标对象的描述信息,例如,目标对象对应的名称、搜索关键字、图片等。

另外,用户行为数据至少包括:查询数据以及对象数据,查询数据至少包括用户在搜索目标对象的过程中所使用的搜索词以及搜索词的搜索顺序,对象数据至少包括用户对目标对象进行选中时所产生的数据,其中,对象数据可以为用户在购买该目标对象之前,所访问的多个对象以及多个对象之间的访问顺序。

在一种可选的实施例中,在通过电子商务平台购买商品的场景中,用户行为数据可以为购买目标对象过程中所产生的数据。具体的,电子商务平台可以记录每个用户在购买目标对象的过程中的用户行为数据,即获取用户在购买该目标对象之前,输入了哪些搜索词,以及访问了哪些对象(即商品),还可以获取用户输入的多个搜索词的输入顺序,以及访问多个对象时的访问顺序。同时,电子商务平台还可记录目标对象与用户行为数据之间的对应关系。在对目标对象进行检测时,电子商务平台可以通过对应关系从预设数据库中查询到与目标对象标识对应的用户行为数据。

在另一种可选的实施例中,电子商务平台首先获取与目标对象对应的购买记录,然后从购买记录对应的行为日志中获取用户行为数据。具体的,电子商务平台从购买记录中确定购买目标对象的目标用户,然后从行为日志中获取目标用户在购买目标对象的过程中输入的搜索词,得到查询数据,最后从行为日志中获取目标用户在购买目标对象的过程中对至少一个对象进行操作的对象信息,得到对象数据。可选的,电子商务平台存储有每个目标对象对应的行为日志,其中,行为日志与购买该目标对象的用户相关联。当电子商务平台对目标对象进行检测时,从该目标对象的行为日志中可以确定多个购买该目标对象的用户,并从多个用户中选择一个用户作为目标用户,然后从该目标用户的行为日志中获取该目标用户对应的查询数据以及对象数据。其中,目标对象对至少一个对象的操作可以为但不限于点击操作。

在得到用户行为数据之后,电子商务平台将用户行为数据输入至预设模型中,预设模型对用户行为数据进行处理,输出处理结果(即步骤S406中的标签)。其中,预设模型为使用多组数据通过神经网络学习训练得到的,多组数据中的每组数据至少包括:对对象进行查询时的,以及标签,标签用于表征对象是否为异常对象。

还存在一种可选的实施例,本实施例所提供的方法还可应用在一般的电子平台上,该电子平台可能够获取用户查询目标对象的查询数据,例如,用户在通过互联网查询不法网页,并访问不法网页的过程中,电子平台通过检测用户在查询不法网页的过程中所输入的关键词,以及关键词的顺序来得到查询数据。当通过关键词搜索到多个网页时,检测用户从多个网页中所选中的网页,从而得到对象数据。同样的,在得到用户行为数据之后,电子平台将用户行为数据输入至预设模型中,预设模型对用户行为数据进行处理,输出处理结果。

步骤S404,分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量。

在步骤S404中,可以采用两个模型来分别对查询数据以及对象数据进行向量化处理,其中,第一模型用于对查询数据进行向量化处理得到第一向量,第二模型用于对对象数据进行向量化处理得到第二向量。第一模型和第二模型可以为相同的神经网络进行建模所得到的模型,例如,第一模型和第二模型均是通过LSTM(Long Short-Term Memory,长短期记忆网络)进行建模所得到的模型。另外,第一模型和第二模型还可以为不同的神经网络进行建模所得到的模型,例如,第一模型通过LSTM建模得到,第二模型通过GRU(GateRecurrent Unit,门递归神经元)得到。

需要说明的是,上述神经网络不限于LSTM、GRU,还可以为SRU(Simple RecurrentUnit,简单递归神经元)、Bi-LSTM(双向长短期记忆网络)。其中,LSTM是一种时间递归神经网络,是RNN(Recurrent Neural Network,循环神经网络)的变体,适合于编码、处理和预测时间序列中间隔和延迟相对较长的重要事件。

步骤S406,对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签。

在步骤S406中,上述神经网络可以为但不限于MLP(Multilayer Perceptron,多层神经网络)。

在一种可选的实施例中,图5示出了预设模型对用户行为数据的处理示意图,在图5中,p

步骤S408,根据标签确定目标对象是否包括异常对象。

在通过步骤S406得到标签之后,根据标签所对应的内容即可确定目标对象是否为异常对象,其中,异常对象为具有违规行为的对象,例如,异常对象可以为违规商品或产品,违规商品或产品包括但不限于枪支配件、色情暴力的图像影音、毒品等。

可选的,标签对应的不同内容表征了预测模型的检测结果,其中,检查结果用于表征目标对象是否为异常对象,例如,标签对应的数值为0,表示目标对象为异常对象;标签对应的数值为1,表示目标对象为正常对象。

进一步地,在得到检测结果之后,电子商务平台可以将检测结果发送至预设平台,以使预设平台根据用户行为数据重新确定目标对象的关键信息,并基于关键信息以及用户行为数据对与目标对象相关的对象进行召回处理。其中,预设平台可以为电子商务平台的维护平台,关键信息可以为目标对象的标识信息,例如,关键搜索词,用户可通过该关键信息搜索到目标对象,并将与该关键信息相关的其他对象也进行召回处理。

需要说明的是,预设平台通过重新确定目标对象的关键信息,并将关键信息相同或相似,并且用户行为数据与目标对象也相同或相似的对象进行召回,不仅可以对异常对象进行召回,还可以对与异常对象相关的对象进行召回,从而进一步维护了电子商务平台的环境。

基于上述步骤S402至步骤S408所限定的方案,可以获知,在本申请实施例中,采用检测用户行为数据的方式,在获取到购买目标对象的过程所产生的用户行为数据之后,分别对用户行为数据中的查询数据以及对象数据进行向量化处理,得到第一向量和第二向量,并对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,从而得到表征目标对象是否包括异常对象的标签。

在上述过程中,在检测目标对象是否为异常对象的过程中,考虑到了用户行为数据对检测结果的影响。容易注意到的是,用户行为数据为用户在搜索目标对象的过程中所产生的数据,用户行为数据中蕴含了用户购买目标对象的意图和搜索行为,用户购买目标对象的意图和搜索行为是卖家无法直接改变的,从而可以有效的避免现有技术中卖家对违规商品的相关信息进行更改以躲避审核的问题,提高的违规商品的检测准确度。

由此可见,本申请所提供的方案达到了违规商品进行检测的目的,从而实现了提高违规商品的检测准确度的技术效果,进而解决了现有技术对违规商品进行检测的准确率低的技术问题。

在一种可选的实施例中,在得到用户行为数据之后,电子商务平台中的预设模型可分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量。具体的,预设模型首先从用户行为数据中提取查询数据以及对象数据,并基于查询数据以及对象数据的生成时间,分别对查询数据以及对象数据进行排序处理,分别得到查询序列以及对象序列,其中,查询序列表征查询数据对应的文本序列,对象序列表征对象数据对应的文本序列。然后确定查询序列以及对象序列对应的第一矩阵和第二矩阵,最后,分别对第一矩阵和第二矩阵进行向量化处理,分别得到第一向量和第二向量。

在上述过程中,预设模型对查询数据进行处理,可以得到查询序列,可选的,预设模型可以按照查询数据产生的时间大小来确定查询数据中的每个数据的先后顺序,从而得到查询序列。同样的,预设模型可以按照对象数据产生的时间大小来确定对象数据的每个数据的先后顺序,从而得到对象序列。

进一步地,在得到查询序列以及对象序列之后,预设模型进一步确定查询序列以及对象序列对应的第一矩阵和第二矩阵。具体的,预设模型首先对查询序列以及对象序列进行分词处理,分别得到第一分词和第二分词,并基于预设词典确定第一分词和第二分词对应的第一分词标识和第二分词标识,然后获取与第一分词标识和第二分词标识分别对应的第一词向量和第二词向量,最后对第一词向量和第二词向量分别进行平均池化处理,得到第一矩阵和第二矩阵。

在上述过程中,预设模型可以使用现有的分词算法对查询序列以及对象序列进行分词处理,其中,分词算法包括但不限于基于字符串匹配的算法(例如,机械分词算法)、基于统计以及机器学习的分词算法等。另外,预设模型还可检测查询序列以及对象序列对应的文本语言类型,然后再使用与文本语言类型对应的分词算法对查询序列以及对象序列进行分词处理。

进一步地,在得到第一分词和第二分词之后,预设模型基于预设词典确定第一分词和第二分词对应的第一分词标识和第二分词标识。首先,预设模型获取第一分词和第二分词的词频,然后基于第一分词和第二分词的词频生成预设词典,并基于预设词典对第一分词和第二分词进行编号,得到第一分词标识和第二分词标识。

在上述过程中,预设模型在得到第一分词和第二分词之后,统计第一分词和第二分词中的每个词的词频,然后按照词频由高到低的顺序对第一分词和第二分词中的每个词进行排序,并将词频大于预设词频(例如,95%)的词组成预设词典,并对预设词典中的每个词进行编号,其中,预设词典中的词的编号即为词对应的标识。

更进一步的,在得到第一分词标识和第二分词标识之后,预设模型可从预设词向量库中获取第一词向量和第二词向量,并分别对第一次向量和第二词向量进行平均池化处理,即可得到第一矩阵和第二矩阵。其中,预设词向量库是通过训练得到的,或者通过随机初始化得到的。

需要说明的是,在本申请中可以从预设词向量库中获取第一词向量和第二词向量,即使用词向量作为每个词的表达,还可以采用BERT用来增强每个字的表达,其中,BERT是一种预训练语言表示的方式。

在得到第一矩阵和第二矩阵之后,预设模型使用长短时间记忆网络分别对第一矩阵和第二矩阵进行建模,得到第一建模结果和第二建模结果,并对第一建模结果和第二建模结果进行拼接,得到第一向量和第二向量。

需要说明的是,在上述过程中,长短时间记忆网络可以为双向长短时间记忆网络(Bi-LSTM)。通过使用长短时间记忆网络分别对第一矩阵和第二矩阵进行建模可以挖掘目标对象的信息以及用户的潜在意图,然后分别将长短时间记忆网络中的最后一个时间步的结果进行拼接(即对第一建模结果和第二建模结果进行拼接),最终得到两个向量(即第一向量和第二向量)。

容易注意到的是,虽然卖家可以通过改变目标对象的信息来规避电子商务平台已有的审查机制,但是卖家无法控制买家的搜索行为。买家的第一个查询通常是异常对象的直接描述,例如,对于枪支的搜索,买家首先想到的是输入“枪支”来进行搜索。在搜索结果不理想(例如,没有搜索到目标对象)的情况下,才会不断修改自己的查询以找到目标对象。因此,买家的查询序列和点击的对象序列中蕴含着大量的信息可供挖掘,通过Bi-LSTM对查询序列和对象序列的输出拼接,然后对两个输出结果进行连接,即可得到最终的标签。

另外,电子商务平台可基于随机梯度下降算法确定预设模型的模型参数,其中,预设模型对应的交叉熵最小时的模型参数为预设模型对应的模型参数。

需要说明的是,交叉熵(Cross Entropy)是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息。语言模型的性能通常用交叉熵和复杂度来衡量。梯度下降算法是一种迭代算法,其可用于求解最小二乘问题(例如,线性问题、非线性问题)。在求解机器学习算法的模型参数,即无约束优化问题的过程中,可以采用梯度下降(Gradient Descent)算法,还可以采用最小二乘法。

由上述内容可知,本申请所提供的方案通过引入用户在搜索异常对象时提交的查询序列,充实了目标对象的特征,并用LSTM来建模用户行为数据对应的序列,以更深入的挖掘目标对象的隐含信息和用户的潜在意图。同时,由于卖家无法直接改变买家的想法和搜索行为,因此,买家行为蕴含的信息远大于目标对象本身的信息。由此可见,本申请所提供的方案可以提高异常对象检测的效果。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的检测对象的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

实施例2

根据本申请实施例,还提供了一种检测对象的方法,其中,在本实施例中,电子商务平台可以作为本实施例的执行主体。如图6所示,该方法包括如下步骤:

步骤S602,获取与目标对象对应的用户行为数据,其中,用户行为数据至少包括:查询数据以及对象数据。

在步骤S602中,目标对象为用户所要购买的商品,其中,目标对象可以为实体商品,也可以为虚拟商品(例如,影像、图片、软件等)。电子商务平台能够显示目标对象的相关信息,并为用户提供购买该目标对象的渠道。其中,目标对象的相关信息可以为该目标对象的描述信息,例如,目标对象对应的名称、搜索关键字、图片等。

另外,用户行为数据至少包括:查询数据以及对象数据,查询数据至少包括用户在搜索目标对象的过程中所使用的搜索词以及搜索词的搜索顺序,对象数据至少包括用户对目标对象进行选中时所产生的数据,其中,对象数据可以为用户在购买该目标对象之前,所访问的多个对象以及多个对象之间的访问顺序。

在一种可选的实施例中,电子商务平台可以记录每个用户在查询目标对象的过程中的用户行为数据,即获取用户在查询该目标对象之前,输入了哪些搜索词,以及访问了哪些对象(例如,商品),还可以获取用户输入的多个搜索词的输入顺序,以及访问多个对象时的访问顺序。同时,电子商务平台还可记录目标对象与用户行为数据之间的对应关系。在对目标对象进行检测时,电子商务平台可以通过对应关系从预设数据库中查询到与目标对象标识对应的用户行为数据。

在另一种可选的实施例中,电子商务平台首先获取与目标对象对应的购买记录,然后从购买记录对应的行为日志中获取用户行为数据。具体的,电子商务平台从购买记录中确定购买目标对象的目标用户,然后从行为日志中获取目标用户在购买目标对象的过程中输入的搜索词,得到查询数据,最后从行为日志中获取目标用户在购买目标对象的过程中对至少一个对象进行操作的对象信息,得到对象数据。可选的,电子商务平台存储有每个目标对象对应的行为日志,其中,行为日志与购买该目标对象的用户相关联。当电子商务平台对目标对象进行检测时,从该目标对象的行为日志中可以确定多个购买该目标对象的用户,并从多个用户中选择一个用户作为目标用户,然后从该目标用户的行为日志中获取该目标用户对应的查询数据以及对象数据。其中,目标对象对至少一个对象的操作可以为但不限于点击操作。

在得到用户行为数据之后,电子商务平台将用户行为数据输入至预设模型中,预设模型对用户行为数据进行处理,输出处理结果。

步骤S604,基于预设模型对用户行为数据进行检测,得到检测结果,其中,检测结果用于表征目标对象是否为异常对象,预设模型为使用多组数据通过神经网络学习训练得到的,多组数据中的每组数据至少包括:对对象进行查询时的用户行为数据,以及标签,标签用于表征对象是否为异常对象。

需要说明的是,上述神经网络不限于LSTM、GRU,还可以为SRU(Simple RecurrentUnit,简单递归神经元)、Bi-LSTM(双向长短期记忆网络)。其中,LSTM是一种时间递归神经网络,是RNN(Recurrent Neural Network,循环神经网络)的变体,适合于编码、处理和预测时间序列中间隔和延迟相对较长的重要事件。

此外,还需要说明的是,上述预设模型可以执行上述实施例1所提供的检测对象的方法,相关内容已在实施例1中进行说明,在此不再赘述。

基于上述步骤S602至步骤S604所限定的方案,可以获知,在本申请实施例中,采用检测用户行为数据的方式,在获取到购买目标对象的过程所产生的用户行为数据之后,基于预设模型对用户行为数据进行检测,得到检测结果。

在上述过程中,在检测目标对象是否为异常对象的过程中,考虑到了用户行为数据对检测结果的影响。容易注意到的是,用户行为数据为用户在搜索目标对象的过程中所产生的数据,用户行为数据中蕴含了用户购买目标对象的意图和搜索行为,用户购买目标对象的意图和搜索行为是卖家无法直接改变的,从而可以有效的避免现有技术中卖家对违规商品的相关信息进行更改以躲避审核的问题,提高的违规商品的检测准确度。

由此可见,本申请所提供的方案达到了违规商品进行检测的目的,从而实现了提高违规商品的检测准确度的技术效果,进而解决了现有技术对违规商品进行检测的准确率低的技术问题。

在一种可选的实施例中,在基于预设模型对用户行为数据进行检测,得到检测结果之前,电子商务平台还基于随机梯度下降算法确定预设模型的模型参数,其中,预设模型对应的交叉熵最小时的模型参数为预设模型对应的模型参数。

需要说明的是,交叉熵(Cross Entropy)是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息。语言模型的性能通常用交叉熵和复杂度来衡量。梯度下降算法是一种迭代算法,其可用于求解最小二乘问题(例如,线性问题、非线性问题)。在求解机器学习算法的模型参数,即无约束优化问题的过程中,可以采用梯度下降(Gradient Descent)算法,还可以采用最小二乘法。

进一步地,在得到检测结果之后,电子商务平台在检测结果指示目标对象为异常对象的情况下,获取查询目标对象的用户的用户行为数据,并将用户行为数据发送至预设平台,以使预设平台根据用户行为数据重新确定目标对象的关键信息。其中,预设平台可以为电子商务平台的维护平台,关键信息可以为目标对象的标识信息,例如,关键搜索词。

可选的,在检测结果指示目标对象为异常对象的情况下,预设平台还用于确定售卖异常对象的电商对象,并生成警告信息,以提示电商对象禁止售卖异常对象。例如,在异常对象为违规商品的场景中,在电子商务平台检测到违规商品之后,预设平台进一步检测售卖该违规商品的电子商铺(即电商对象)的相关信息(例如,经营该电子商铺的经营人以及经营人的联系方式等),并向该电子商铺发出警报信息,提醒电子商铺禁止再售卖违规商品。

可选的,在检测结果指示目标对象为异常对象的情况下,预设平台基于关键信息确定与异常对象关联的相关对象,并对异常对象以及相关对象进行召回处理,用户可通过该关键信息搜索到目标对象,并将与该关键信息相关的其他对象也进行召回处理

需要说明的是,预设平台通过重新确定目标对象的关键信息,并将关键信息相同或相似,并且用户行为数据与目标对象也相同或相似的对象进行召回,不仅可以对异常对象进行召回,还可以对与异常对象相关的对象进行召回,从而进一步维护了电子商务平台的环境。

实施例3

根据本申请实施例,还提供了一种用于实施上述检测对象的方法的检测对象的装置,如图7所示,该装置70包括:获取模块701、处理模块703、拼接模块705以及确定模块707。

其中,获取模块701,用于获取用户行为数据,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;处理模块703,用于分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;拼接模块705,用于对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;确定模块707,用于根据标签确定目标对象是否包括异常对象。

此处需要说明的是,上述获取模块701、处理模块703、拼接模块705以及确定模块707对应于实施例1中的步骤S402至步骤S408,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算设备10中。

可选的,查询数据至少包括用户在搜索目标对象的过程中所使用的搜索词以及搜索词的搜索顺序,对象数据至少包括用户对目标对象进行选中时所产生的数据。

在一种可选的实施例中,处理模块包括:提取模块、第一处理模块、第一确定模块以及第二处理模块。其中,提取模块,用于从用户行为数据中提取查询数据以及对象数据;第一处理模块,用于基于查询数据以及对象数据的生成时间,分别对查询数据以及对象数据进行排序处理,分别得到查询序列以及对象序列,其中,查询序列表征查询数据对应的文本序列,对象序列表征对象数据对应的文本序列;第一确定模块,用于确定查询序列以及对象序列对应的第一矩阵和第二矩阵;第二处理模块,用于分别对第一矩阵和第二矩阵进行向量化处理,分别得到第一向量和第二向量。

在一种可选的实施例中,第一确定模块包括:分词模块、第二确定模块、第一获取模块以及池化模块。其中,分词模块,用于对查询序列以及对象序列进行分词处理,分别得到第一分词和第二分词;第二确定模块,用于基于预设词典确定第一分词和第二分词对应的第一分词标识和第二分词标识;第一获取模块,用于获取与第一分词标识和第二分词标识分别对应的第一词向量和第二词向量;池化模块,用于对第一词向量和第二词向量分别进行平均池化处理,得到第一矩阵和第二矩阵。

在一种可选的实施例中,处理模块包括:建模模块以及拼接模块。其中,建模模块,用于使用长短时间记忆网络分别对第一矩阵和第二矩阵进行建模,得到第一建模结果和第二建模结果;拼接模块,用于对第一建模结果和第二建模结果进行拼接,得到第一向量和第二向量。

在一种可选的实施例中,检测对象的装置还包括::第二获取模块以及生成模块。其中,第二获取模块,用于获取第一分词和第二分词的词频;生成模块,用于基于第一分词和第二分词的词频生成预设词典。第二确定模块包括编号模块,用于基于预设词典对第一分词和第二分词进行编号,得到第一分词标识和第二分词标识。

在一种可选的实施例中,第一获取模块包括:第三获取模块。其中,第三获取模块,用于从预设词向量库中获取第一词向量和第二词向量,其中,预设词向量库是通过训练得到的,或者通过随机初始化得到的。

实施例4

根据本申请实施例,还提供了一种用于实施上述检测对象的方法的检测对象的系统,如图8所示,该系统包括:电子平台80以及预设平台82。

其中,电子平台80,用于获取用户行为数据,并基于预设模型对用户行为数据进行检测,得到检测结果,其中,用户行为数据为购买目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;预设平台82,用于在确定目标对象为异常对象的情况下,对目标对象进行召回处理。

可选的,上述电子平台可以为电子商务平台,也可以为非电子商务平台,预设平台可以为电子平台的维护平台。目标对象为用户所要购买的商品,其中,目标对象可以为实体商品,也可以为虚拟商品(例如,影像、图片、软件等)。电子平台能够显示目标对象的相关信息,并为用户提供查询该目标对象的渠道。其中,目标对象的相关信息可以为该目标对象的描述信息,例如,目标对象对应的名称、搜索关键字、图片等。

另外,用户行为数据至少包括:查询数据以及对象数据,查询数据至少包括用户在搜索目标对象的过程中所使用的搜索词以及搜索词的搜索顺序,对象数据至少包括用户对目标对象进行选中时所产生的数据。其中,对象数据可以为用户在购买该目标对象之前,所访问的多个对象以及多个对象之间的访问顺序。

在上述过程中,在检测目标对象是否为异常对象的过程中,考虑到了用户行为数据对检测结果的影响。容易注意到的是,用户行为数据为用户在搜索目标对象的过程中所产生的数据,用户行为数据中蕴含了用户购买目标对象的意图和搜索行为,用户购买目标对象的意图和搜索行为是卖家无法直接改变的,从而可以有效的避免现有技术中卖家对违规商品的相关信息进行更改以躲避审核的问题,提高的违规商品的检测准确度。

由此可见,本申请所提供的方案达到了违规商品进行检测的目的,从而实现了提高违规商品的检测准确度的技术效果,进而解决了现有技术对违规商品进行检测的准确率低的技术问题。

需要说明的是,电子平台以及预设平台的相关内容已在实施例1和实施例2中进行说明,在此不再赘述。

实施例5

本申请的实施例可以提供一种检测对象的平台,该平台包括:处理器以及存储器。

其中,存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取用户行为数据,并基于预设模型对用户行为数据进行检测,得到检测结果,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;在确定目标对象为异常对象的情况下,对目标对象进行召回处理。

由上可知,在检测目标对象是否为异常对象的过程中,考虑到了用户行为数据对检测结果的影响。容易注意到的是,用户行为数据为用户在搜索目标对象的过程中所产生的数据,用户行为数据中蕴含了用户购买目标对象的意图和搜索行为,用户购买目标对象的意图和搜索行为是卖家无法直接改变的,从而可以有效的避免现有技术中卖家对违规商品的相关信息进行更改以躲避审核的问题,提高的违规商品的检测准确度。

由此可见,本申请所提供的方案达到了违规商品进行检测的目的,从而实现了提高违规商品的检测准确度的技术效果,进而解决了现有技术对违规商品进行检测的准确率低的技术问题。

需要说明的是,本实施例可以执行实施例2所对应的检测对象的方法,相关内容已在实施例2中进行说明,在此不再赘述。

实施例6

本申请的实施例还提供了一种检测对象的方法,如图10所示,该方法包括如下步骤:

步骤S1002,获取用户行为数据,其中,用户行为数据表征与通过即时通讯工具关联的电商平台查询目标对象的过程中所产生的数据,用户行为数据至少包括:查询数据以及对象数据。

在步骤S1002中,与即时通讯工具关联的电商平台不仅可以使用与即时通讯工具相同的账号、密码登陆,还能够从即时通讯工具的界面直接跳转到电商平台所对应的界面,例如,在即时通讯工具的应用界面中设置有一个跳转控件,通过操作该跳转控件,可实现从即时通讯工具的界面直接跳转到电商平台所对应的界面;另外,在与即时通讯工具关联的电商平台中也可设置跳转控件,通过操作该跳转控件,可实现电商平台所对应的界面跳转至即时通讯工具的界面。

在一种可选的实施例中,以购买商品为例进行说明,电子平台可以通过与即时通讯工具关联的电商平台获取用户购买目标对象的过程中所生成的购买日志,其中,购买日志中包括用户行为数据,用户行为数据中的查询数据至少包括用户在使用与通过即时通讯工具关联的电商平台购买目标对象的过程中所使用的关键词以及关键词的输入顺序;对象数据至少包括用户在购买该目标对象之前,所访问的多个对象以及多个对象之间的访问顺序。

步骤S1004,分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量。

在步骤S1004中,可以采用两个模型来分别对查询数据以及对象数据进行向量化处理,其中,第一模型用于对查询数据进行向量化处理得到第一向量,第二模型用于对对象数据进行向量化处理得到第二向量。第一模型和第二模型可以为相同的神经网络进行建模所得到的模型,例如,第一模型和第二模型均是通过LSTM(Long Short-Term Memory,长短期记忆网络)进行建模所得到的模型。另外,第一模型和第二模型还可以为不同的神经网络进行建模所得到的模型,例如,第一模型通过LSTM建模得到,第二模型通过GRU(GateRecurrent Unit,门递归神经元)得到。

需要说明的是,上述神经网络不限于LSTM、GRU,还可以为SRU(Simple RecurrentUnit,简单递归神经元)、Bi-LSTM(双向长短期记忆网络)。其中,LSTM是一种时间递归神经网络,是RNN(Recurrent Neural Network,循环神经网络)的变体,适合于编码、处理和预测时间序列中间隔和延迟相对较长的重要事件。

步骤S1006,对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签。

在步骤S1006中,上述神经网络可以为但不限于MLP(Multilayer Perceptron,多层神经网络)。

在一种可选的实施例中,图5示出了预设模型对用户行为数据的处理示意图,在图5中,p

步骤S1008,根据标签确定目标对象是否包括异常对象。

在通过步骤S1006得到标签之后,根据标签所对应的内容即可确定目标对象是否为异常对象,其中,异常对象为具有违规行为的对象,例如,异常对象可以为违规商品或产品,违规商品或产品包括但不限于枪支配件、色情暴力的图像影音、毒品等。

可选的,标签对应的不同内容表征了预测模型的检测结果,其中,检查结果用于表征目标对象是否为异常对象,例如,标签对应的数值为0,表示目标对象为异常对象;标签对应的数值为1,表示目标对象为正常对象。

进一步地,在得到检测结果之后,电子平台可以将检测结果发送至预设平台,以使预设平台根据用户行为数据重新确定目标对象的关键信息,并基于关键信息以及用户行为数据对与目标对象相关的用户进行警告。

基于上述步骤S1002至步骤S1008所限定的方案,可以获知,在本申请实施例中,采用检测用户行为数据的方式,在获取到购买目标对象的过程所产生的用户行为数据之后,分别对用户行为数据中的查询数据以及对象数据进行向量化处理,得到第一向量和第二向量,并对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,从而得到表征目标对象是否为异常对象的标签。

在上述过程中,在检测目标对象是否为异常对象的过程中,考虑到了用户行为数据对检测结果的影响。容易注意到的是,用户行为数据为用户在搜索目标对象的过程中所产生的数据,用户行为数据中蕴含了用户购买目标对象的意图和搜索行为,用户购买目标对象的意图和搜索行为是卖家无法直接改变的,从而可以有效的避免现有技术中卖家对违规商品的相关信息进行更改以躲避审核的问题,提高的违规商品的检测准确度。

由此可见,本申请所提供的方案达到了违规商品进行检测的目的,从而实现了提高违规商品的检测准确度的技术效果,进而解决了现有技术对违规商品进行检测的准确率低的技术问题。

需要说明的是,本实施例所提供的检测对象的方法与实施例1中所提供的检测对象的方法区别仅在于应用场景不同,在检测对象的过程中所采用的技术手段相同,相关内容已在实施例1中进行说明,在此不再赘述。

实施例7

本申请的实施例可以提供一种计算设备,该计算设备可以是计算设备群中的任意一个计算设备。可选地,在本实施例中,上述计算设备也可以替换为移动终端等终端设备。

可选地,在本实施例中,上述计算设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中,上述计算设备可以执行检测对象的方法中以下步骤的程序代码:获取用户行为数据,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;根据标签确定目标对象是否包括异常对象。

可选地,图9是根据本申请实施例的一种计算设备的结构框图。如图9所示,该计算设备10可以包括:一个或多个(图中仅示出一个)处理器902、存储器904以及外设接口906。

其中,存储器可用于存储软件程序以及模块,如本申请实施例中的检测对象的方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的检测对象的方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取用户行为数据,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;根据标签确定目标对象是否包括异常对象。查询数据至少包括用户在搜索目标对象的过程中所使用的搜索词以及搜索词的搜索顺序,对象数据至少包括用户对目标对象进行选中时所产生的数据。

可选的,上述处理器还可以执行如下步骤的程序代码:从用户行为数据中提取查询数据以及对象数据;基于查询数据以及对象数据的生成时间,分别对查询数据以及对象数据进行排序处理,分别得到查询序列以及对象序列,其中,查询序列表征查询数据对应的文本序列,对象序列表征对象数据对应的文本序列;确定查询序列以及对象序列对应的第一矩阵和第二矩阵;分别对第一矩阵和第二矩阵进行向量化处理,分别得到第一向量和第二向量。

可选的,上述处理器还可以执行如下步骤的程序代码:对查询序列以及对象序列进行分词处理,分别得到第一分词和第二分词;基于预设词典确定第一分词和第二分词对应的第一分词标识和第二分词标识;获取与第一分词标识和第二分词标识分别对应的第一词向量和第二词向量;对第一词向量和第二词向量分别进行平均池化处理,得到第一矩阵和第二矩阵。

可选的,上述处理器还可以执行如下步骤的程序代码:使用长短时间记忆网络分别对第一矩阵和第二矩阵进行建模,得到第一建模结果和第二建模结果;对第一建模结果和第二建模结果进行拼接,得到第一向量和第二向量。

可选的,上述处理器还可以执行如下步骤的程序代码:获取第一分词和第二分词的词频;基于第一分词和第二分词的词频生成预设词典;基于预设词典对第一分词和第二分词进行编号,得到第一分词标识和第二分词标识。

可选的,上述处理器还可以执行如下步骤的程序代码:从预设词向量库中获取第一词向量和第二词向量,其中,预设词向量库是通过训练得到的,或者通过随机初始化得到的。

本领域普通技术人员可以理解,图9所示的结构仅为示意,计算设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图9其并不对上述电子装置的结构造成限定。例如,计算设备10还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图9所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。

实施例8

本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的检测对象的方法所执行的程序代码。

可选地,在本实施例中,上述存储介质可以位于计算机网络中计算设备群中的任意一个计算设备中,或者位于移动终端群中的任意一个移动终端中。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取用户行为数据,其中,用户行为数据表征查询目标对象的过程所产生的数据,用户行为数据至少包括:查询数据以及对象数据;分别对查询数据以及对象数据进行向量化处理,得到第一向量和第二向量;对第一向量和第二向量进行拼接处理,得到拼接结果,并通过神经网络输出拼接结果,得到标签;根据标签确定目标对象是否包括异常对象。查询数据至少包括用户在搜索目标对象的过程中所使用的搜索词以及搜索词的搜索顺序,对象数据至少包括用户对目标对象进行选中时所产生的数据。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从用户行为数据中提取查询数据以及对象数据;基于查询数据以及对象数据的生成时间,分别对查询数据以及对象数据进行排序处理,分别得到查询序列以及对象序列,其中,查询序列表征查询数据对应的文本序列,对象序列表征对象数据对应的文本序列;确定查询序列以及对象序列对应的第一矩阵和第二矩阵;分别对第一矩阵和第二矩阵进行向量化处理,分别得到第一向量和第二向量。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对查询序列以及对象序列进行分词处理,分别得到第一分词和第二分词;基于预设词典确定第一分词和第二分词对应的第一分词标识和第二分词标识;获取与第一分词标识和第二分词标识分别对应的第一词向量和第二词向量;对第一词向量和第二词向量分别进行平均池化处理,得到第一矩阵和第二矩阵。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:使用长短时间记忆网络分别对第一矩阵和第二矩阵进行建模,得到第一建模结果和第二建模结果;对第一建模结果和第二建模结果进行拼接,得到第一向量和第二向量。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取第一分词和第二分词的词频;基于第一分词和第二分词的词频生成预设词典;基于预设词典对第一分词和第二分词进行编号,得到第一分词标识和第二分词标识。

可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从预设词向量库中获取第一词向量和第二词向量,其中,预设词向量库是通过训练得到的,或者通过随机初始化得到的。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

相关技术
  • 检测用信息登录装置、对象物体检测装置、电子设备、检测用信息登录装置的控制方法、对象物体检测装置的控制方法、检测用信息登录装置控制程序、对象物体检测装置控制程序
  • 对象检测装置、对象检测系统以及对象检测方法
技术分类

06120112939611