掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据和人工智能的信息处理方法及数据服务器

文献发布时间:2023-06-19 10:32:14


基于大数据和人工智能的信息处理方法及数据服务器

技术领域

本申请涉及大数据和人工智能技术领域,具体而言,涉及一种基于大数据和人工智能的信息处理方法及数据服务器。

背景技术

随着互联网的发展,用户可以通过各类搜索引擎进行信息查询和搜索,从而满足日常的工作和生活需要。大数据的发展使得数据服务器的数据处理功能得到了进一步地优化,使得现目前的搜索引擎能够将大量数据信息进行展示以供用户浏览或者使用。

然而,用户在实际的搜索过程中,有时候可能不会在第一时间搜索到自己想要的信息内容,在下一次搜索时,可能又会重复浏览之前的内容,这样会降低信息搜索效率。

发明内容

本发明实施例提供了一种基于大数据和人工智能的信息处理方法,所述基于大数据和人工智能的信息处理方法包括:获取到已标记用户的搜索内容的展示记录;通过添加了全局识别标签的内容识别模型对所述已标记用户的搜索内容的展示记录进行展示内容识别,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息;通过所述添加了全局识别标签的内容识别模型对所述展示内容排序信息进行全局点击操作识别以及收藏操作识别,得到全局点击识别信息以及全局收藏识别信息;通过添加了局部识别标签的内容识别模型基于所述全局收藏识别信息对所述展示内容排序信息进行局部点击操作识别,得到局部点击识别信息;其中,所述添加了局部识别标签的内容识别模型是通过历史用户行为数据集训练得到的;将所述全局点击识别信息和所述局部点击识别信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像;基于所述用户兴趣画像,对所述展示记录进行关联内容查询,得到查询结果;通过所述用户兴趣画像以及所述展示记录对应的展示区域信息确定所述查询结果的目标展示方式。

本发明实施例还提供了一种数据服务器,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行上述的方法。

本发明实施例还提供了一种计算机可读信号介质,其上存储有计算机程序,所述计算机程序在运行是实现上述的方法。

本发明实施例提供的基于大数据和人工智能的信息处理方法及数据服务器具有以下技术效果:能够对已标记用户的搜索内容的展示记录先后进行全局层面和局部层面的识别,进而对用户感兴趣的内容进行阶梯式的细化,并同时考虑展示内容的排序情况,这样可以确保得到的局部点击识别信息能够尽可能地与用户的真实意图相匹配。可以理解,基于全局点击识别信息和局部点击识别信息,能够实现对已标记用户的用户兴趣分析,从而精准地确定出用户兴趣画像。进一步地,基于用户兴趣画像能够对展示记录对应的关联内容进行主动性查询,并结合展示记录对应的展示区域信息确定查询结果的目标展示方式。这样,在用户后续进行内容搜索时,能够以目标展示方式对查询结果进行查询,从而避免用户反复浏览之前浏览过的内容,帮助用户更快地锁定感兴趣的内容,减少用户在信息搜索时的耗时,提高信息搜索的效率。

在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中参考数字在附图的各个视图中代表相似的机构。

图1是根据本发明的一些实施例所示的一种示例性基于大数据和人工智能的信息处理系统的框图。

图2是根据本发明的一些实施例所示的一种示例性数据服务器中硬件和软件组成的示意图。

图3是根据本发明的一些实施例所示的一种示例性基于大数据和人工智能的信息处理方法和/或过程的流程图。

图4是根据本发明的一些实施例所示的一种示例性基于大数据和人工智能的信息处理装置的框图。

具体实施方式

如背景技术所述,发明人对各大搜索引擎进行研究和分析后发现,这些搜索引擎几乎都存在这个问题。详细地,比如用户在第一次搜索了“新手如何健身”的相关内容,对应的搜索内容的展示页面的第一页可能包括内容1、内容2、内容3和内容4。这里面可能没有用户想要的东西,此时用户关闭搜索引擎,并在几天后继续进行“新手如何健身”的内容搜索,这个时候展示页面的第一页还是内容1、内容2、内容3和内容4,如果用户忘记了之前浏览过内容1、内容2、内容3和内容4,那么会重新进行浏览,这样会极大地降低信息搜索的效率。

为改善上述问题,发明人创新性地提供了一种基于大数据和人工智能的信息处理方法及数据服务器,能够对用户的搜索内容进行内容识别,从而确定出用户的用户兴趣画像,并实现对在先的展示记录的关联内容进行查询,这样可以将查询结果按照目标展示方式进行预先配置,从而在用户下次进行搜索时,将查询结果进行显示,这样避免用户在多次搜索时所看到的内容都是相同的内容,从而提高信息搜索的效率。

为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。

在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本发明。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要的模糊本发明的方面。

这些和其他特性、当前申请披露的功能、执行的方法、结构中相关元素的功能和部件的组合和生产经济性,在参照附图进行以下描述的考虑中可能会变得更加明显,所有这些形成本申请的一部分。然而,需要理解清楚的是,附图仅仅是为了说明和描述的目的,并不旨在限制本申请的范围。应当了解的是,这些图纸不是按比例绘制的。然而,应当明确理解的是,附图仅用于说明和描述的目的,并不意图限制本发明的范围。应当知晓的是,这些附图并不依照比例。

本申请中使用流程图说明根据本申请的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以从流程图中删除。

图1是根据本发明的一些实施例所示的一种示例性基于大数据和人工智能的信息处理系统300的框图,基于大数据和人工智能的信息处理系统300可以包括数据服务器100和用户业务设备200。其中,用户业务设备200可以为多个,例如手机、电脑等智能设备。

在一些实施例中,如图2所示,数据服务器100可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。

处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central ProcessingUnit,CPU)、专用集成电路(Application-Specific Integrated Circuit,ASIC)、专用指令集处理器(Application-Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、精简指令集计算机(Reduced Instruction-Set Computer,RISC)、微处理器等或其任意组合。

网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone SwitchedNetwork,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入点。例如,网络模块120可以包括有线或无线网路接入点,如基站和/或网路接入点。

存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。

可以理解,图2所示的结构仅为示意,数据服务器100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。图2中所示的各组件可以采用硬件、软件或其组合实现。

图3是根据本发明的一些实施例所示的一种示例性基于大数据和人工智能的信息处理方法和/或过程的流程图,基于大数据和人工智能的信息处理方法应用于图1中的数据服务器100,具体可以包括以下步骤S110-步骤S150所描述的内容。

步骤S110,获取到已标记用户的搜索内容的展示记录。例如,已标记用户可以是预先向数据服务器进行用户画像分析授权的用户业务设备对应的用户。又例如,用户C通过用户业务设备S向数据服务器100进行用户画像分析授权,当用户C通过用户业务设备S登录时,100可以获取用户C的搜索内容的展示记录。再例如,搜索内容可以是“如何进行健身计划定制”,展示记录可以包括健身计划定制方案1、健身计划定制方案2和健身计划定制方案3。

步骤S120,通过添加了全局识别标签的内容识别模型对所述已标记用户的搜索内容的展示记录进行展示内容识别,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息;通过所述添加了全局识别标签的内容识别模型对所述展示内容排序信息进行全局点击操作识别以及收藏操作识别,得到全局点击识别信息以及全局收藏识别信息。例如,全局识别标签可以从整体反应展示记录的相关展示内容,内容识别模型可以是预先训练完成的网络模型。展示内容排序信息可以用于表征展示内容的排序情况,例如健身计划定制方案2排在第一位,健身计划定制方案3排在第二位,健身计划定制方案1排在第三位,当然也可以是其他情况,在此不作限定。点击识别信息和收藏识别信息用于反映用户针对上面的相关内容的对应操作,点击识别信息和收藏识别信息可以是用户第一眼看到上面的内容之后所作出的操作,因此在这里,“全局”可以理解为用户针对展示内容的第一浏览印象。

步骤S130,通过添加了局部识别标签的内容识别模型基于所述全局收藏识别信息对所述展示内容排序信息进行局部点击操作识别,得到局部点击识别信息;其中,所述添加了局部识别标签的内容识别模型是通过历史用户行为数据集训练得到的。例如,局部识别标签可能基于展示内容进行进一步识别,这里的局部点击识别信息可以是用户针对展示内容进行进一步点击和浏览时对应的操作信息,例如,局部点击识别信息可以是针对健身计划定制方案2进行进一步点击对应的识别信息,然后针对健身计划定制方案2中的肩部训练方案f1和腿部训练方案f2的识别信息。

步骤S140,将所述全局点击识别信息和所述局部点击识别信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像。例如,用户兴趣分析用于对用户感兴趣的内容进行挖掘,比如,用户针对腿部训练方案f2的相关内容进行了多次点击浏览操作,那么基于全局点击识别信息和局部点击识别信息可以分析出用户对腿部训练感兴趣,这样一来可以确定出已标记用户的搜索内容的展示记录的用户兴趣画像,便于后续进行相关内容的查询。

步骤S150,基于所述用户兴趣画像,对所述展示记录进行关联内容查询,得到查询结果;通过所述用户兴趣画像以及所述展示记录对应的展示区域信息确定所述查询结果的目标展示方式。例如,用户兴趣画像可以包括用户感兴趣的内容,或者数据服务器100对用户进行画像标签提取之后的标签集。继续以上述示例为例,如果用户兴趣画像中包括“用户对腿部训练感兴趣”,那么对展示记录进行关联内容查询可以针对“腿部训练计划”的相关内容进行查询,而查询结果也可以包括“股四头肌训练计划”、“股二头肌训练计划”等。展示区域信息可以用于表征展示记录在进行内容展示时,不同内容的分布情况。可以理解,展示区域信息对于用户是否点击相关展示内容是存在一定影响的,一般而言,用户倾向于对最醒目的展示区域的内容进行点击。因此,通过展示记录的展示区域信息确定查询结果的目标展示方式,能够对查询结果中的关联内容的显示分布情况进行调整,从而方便用户后续对查询结果的浏览,帮助用户更快地锁定感兴趣的内容,或者帮助用户快速地获取到想要的内容,从而提高信息搜索的效率。

综上所述,在上述方案中,能够对已标记用户的搜索内容的展示记录先后进行全局层面和局部层面的识别,进而对用户感兴趣的内容进行阶梯式的细化,并同时考虑展示内容的排序情况,这样可以确保得到的局部点击识别信息能够尽可能地与用户的真实意图相匹配。可以理解,基于全局点击识别信息和局部点击识别信息,能够实现对已标记用户的用户兴趣分析,从而精准地确定出用户兴趣画像。进一步地,基于用户兴趣画像能够对展示记录对应的关联内容进行主动性查询,并结合展示记录对应的展示区域信息确定查询结果的目标展示方式。这样,在用户后续进行内容搜索时,能够以目标展示方式对查询结果进行查询,从而避免用户反复浏览之前浏览过的内容,帮助用户更快地锁定感兴趣的内容,减少用户在信息搜索时的耗时,提高信息搜索的效率。

接下来将对一些可选实施例进行说明,这些实施例应当理解为示例,不应理解为实现本方案所必不可少的技术特征。

在一些示例中,步骤S120所描述的通过添加了全局识别标签的内容识别模型对所述已标记用户的搜索内容的展示记录进行展示内容识别,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息的步骤包括:利用展示内容处理模型对所述已标记用户的搜索内容的展示记录进行展示内容提取和展示内容划分处理,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息。例如,展示内容处理模型可以是预先搭建的神经网络模型,其模型参数可以根据实际情况进行选择性调整,在此不作更多说明。

在一些可选的实施方式中,步骤S120所描述的对所述已标记用户的搜索内容的展示记录进行展示内容识别,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息的步骤包括:对所述已标记用户的搜索内容的展示记录进行全局展示内容识别,得到全局内容排序信息;对所述全局内容排序信息进行局部展示内容识别,得到局部内容排序信息。

进一步地,步骤S120所描述的通过所述添加了全局识别标签的内容识别模型对所述展示内容排序信息进行全局点击操作识别以及收藏操作识别,得到全局点击识别信息以及全局收藏识别信息的步骤包括:通过所述添加了全局识别标签的内容识别模型对所述局部内容排序信息进行全局点击操作识别以及收藏操作识别,得到全局点击识别信息以及全局收藏识别信息。

在一些可能的实施例中,在步骤S130中,通过添加了局部识别标签的内容识别模型基于所述全局收藏识别信息对所述展示内容排序信息进行局部点击操作识别,得到局部点击识别信息的步骤包括以下步骤S131和步骤S132。

步骤S131,将所述全局收藏识别信息以及所述全局内容排序信息进行内容关联,得到内容关联后的展示内容排序信息。例如,内容关联可以是将图文意思相同的内容进行关联。

步骤S132,对所述内容关联后的展示内容排序信息进行局部点击操作识别,得到局部点击识别信息。

在上述内容的基础上,步骤S132所描述的对所述内容关联后的展示内容排序信息进行局部点击操作识别,得到局部点击识别信息的步骤,进一步可以包括以下步骤S1321-步骤S1323所描述的内容。

步骤S1321,对所述内容关联后的展示内容排序信息进行排序信息聚类处理,得到排序信息聚类后的展示内容排序信息。例如,聚类处理可以根据现有的聚类算法进行,在此不作赘述。

步骤S1322,对所述排序信息聚类后的展示内容排序信息进行用户点击轨迹识别,得到所述排序信息聚类后的展示内容排序信息的点击引导提示信息。例如,用户点击轨迹可以是用户的鼠标点击轨迹或者触控点击轨迹。

步骤S1323,利用所述点击引导提示信息进行局部点击操作识别,得到所述局部点击识别信息。

如此设计,基于上述步骤S1321-步骤S1323所描述的内容,能够考虑用户的点击轨迹以及对应的点击引导提示信息之间的因果关系,从而尽可能地保证局部点击识别信息能够与用户的真实意图相匹配。

对于一些可能的实施例而言,为了完整、实时地确定用户兴趣画像,需要对用户的意图倾向信息进行深度挖掘和分析,为实现这一目的,步骤S140所描述的所述将所述全局点击识别信息和所述局部点击识别信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像的步骤,具体包括以下步骤S141-步骤S143所描述的内容。

步骤S141,对所述全局点击识别信息进行全局点击意图解析,得到所述全局点击识别信息对应的第一意图倾向信息。

步骤S142,对所述局部点击识别信息进行局部点击意图解析,得到所述局部点击识别信息对应的第二意图倾向信息。

步骤S143,基于所述第一意图倾向信息和所述第二意图倾向信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像。

这样一来,通过实施上述步骤S141-步骤S143,能够通过对点击识别信息进行点击意图解析,从而确定出不同的意图倾向信息,从而在确定用户兴趣画像时将用户的意图倾向信息考虑在内,这样可以完整、实时地确定用户兴趣画像。

在一个进一步的实施例中,步骤S143所描述的基于所述第一意图倾向信息和所述第二意图倾向信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像的步骤具体包括以下步骤S1431-步骤S1435。

步骤S1431,分别查询得到第一意图倾向信息对应的用户实时关注内容,以及第二意图倾向信息对应的用户初始关注内容,所述用户实时关注内容和所述用户初始关注内容分别包括多个具有不同内容关注热度的内容事件。例如,用户实时关注内容表征用户在搜索过程中突然感兴趣的内容,用户初始关注内容表征用户在搜索之前就感兴趣的内容。

步骤S1432,获取所述第一意图倾向信息在所述用户实时关注内容的任一内容事件的初始事件关注度匹配结果,将所述用户初始关注内容中具有最小内容关注热度的内容事件确定为待关注内容事件。

步骤S1433,根据全局点击识别信息和局部点击识别信息将所述初始事件关注度匹配结果映射到所述待关注内容事件,在所述待关注内容事件中得到初始关注度映射结果,并根据所述初始事件关注度匹配结果、所述初始关注度映射结果,生成所述第一意图倾向信息和所述第二意图倾向信息之间的兴趣画像关联信息。

步骤S1434,以所述初始关注度映射结果为参考结果在所述待关注内容事件中获取事件关注度更新结果,根据所述兴趣画像关联信息对应的用户兴趣反馈数据,将所述事件关注度更新结果映射到所述初始事件关注度匹配结果所在内容事件,在所述初始事件关注度匹配结果所在内容事件中得到所述事件关注度更新结果对应的事件热度变化信息,并确定所述事件热度变化信息的内容事件更新记录。

步骤S1435,获取所述初始事件关注度匹配结果映射到所述待关注内容事件中的事件关注点映射记录;根据所述事件热度变化信息与所述事件关注点映射记录上的多个关注点信息对应的目标关注事件之间的事件匹配信息,在所述用户初始关注内容中按照关注内容的时效性信息依次获取所述内容事件更新记录对应的已更新的内容事件组合,直至获取到的所述已更新的内容事件组合所在内容事件的事件搜索指数与所述内容事件更新记录在所述用户实时关注内容中的事件搜索指数一致时,停止获取下一内容事件中的已更新的内容事件组合,并确定所述内容事件更新记录与最后一次获取到的已更新的内容事件组合之间的内容事件喜好信息,基于所述内容事件喜好信息确定所述已标记用户的搜索内容的展示记录的用户兴趣画像。

如此设计,通过实施上述步骤S1431-步骤S1435所描述的内容,能够对用户实时关注内容、用户初始关注内容以及关注度进行分析,进一步对不同的内容事件、关注度变化和事件热度变化进行映射处理,并考虑内容事件的事件搜索指数,这样能够实时准确地确定出内容事件更新记录与最后一次获取到的已更新的内容事件组合之间的内容事件喜好信息,进而完整、实时地确定用户兴趣画像。

对于进一步的实施例而言,步骤S1431所描述的所述分别查询得到第一意图倾向信息对应的用户实时关注内容,以及第二意图倾向信息对应的用户初始关注内容,可以包括步骤S1431a和步骤S1431b。

步骤S1431a,根据内容关注热度所对应的关键内容信息查询得到所述第一意图倾向信息对应的所述用户实时关注内容,所述用户实时关注内容中任意存在相同的事件标签的两个内容事件之间的事件偏好信息为所述内容关注热度所对应的关键内容信息。

步骤S1431b,根据内容关注热度所对应的关键内容信息查询得到所述第二意图倾向信息对应的所述用户初始关注内容,所述用户初始关注内容中任意存在相同的事件标签的两个内容事件之间的事件偏好信息为所述内容关注热度所对应的关键内容信息。

对于进一步的实施例而言,步骤S1433所描述的所述根据全局点击识别信息和局部点击识别信息将所述初始事件关注度匹配结果映射到所述待关注内容事件,在所述待关注内容事件中得到初始关注度映射结果,并根据所述初始事件关注度匹配结果、所述初始关注度映射结果,生成所述第一意图倾向信息和所述第二意图倾向信息之间的兴趣画像关联信息,可以包括以下步骤S1433a-步骤S1433d。

步骤S1433a,根据所述全局点击识别信息和所述局部点击识别信息将所述初始事件关注度匹配结果映射到所述待关注内容事件,在所述待关注内容事件中得到所述初始关注度映射结果。

步骤S1433b,在所述初始事件关注度匹配结果所在内容事件中获取已选中事件信息,所述已选中事件信息是以所述初始事件关注度匹配结果为参考的处于预设有效关注时长内的事件信息。例如,预设有效关注时长可以根据实际情况进行调整,在此不作限定。

步骤S1433c,根据所述全局点击识别信息和所述局部点击识别信息将所述已选中事件信息映射到所述待关注内容事件,在所述待关注内容事件中得到关联关注度映射结果。

步骤S1433d,根据所述初始事件关注度匹配结果与所述已选中事件信息之间的关联关系、所述初始关注度映射结果以及所述关联关注度映射结果,生成所述第一意图倾向信息和所述第二意图倾向信息之间的兴趣画像关联信息。

这样,通过实施上述步骤S1433a-步骤S1433d,能够将有效关注时长考虑在内,从而确保第一意图倾向信息和第二意图倾向信息之间的兴趣画像关联信息的时效性。

对于更进一的实施例而言,步骤S1433a中,所述根据所述全局点击识别信息和所述局部点击识别信息将所述初始事件关注度匹配结果映射到所述待关注内容事件,在所述待关注内容事件中得到所述初始关注度映射结果,可以包括如下步骤S1433a1-步骤S1433a4。

步骤S1433a1,根据所述全局点击识别信息、全局点击指示标签,将所述初始事件关注度匹配结果映射到与所述待关注内容事件存在时序连续性的目标关注内容事件中,得到目标关注度映射结果。

步骤S1433a2,根据所述第一意图倾向信息对应的全局意图倾向轨迹和所述第二意图倾向信息对应的局部意图倾向轨迹之间的意图相似信息、意图变化信息,将所述目标关注度映射结果映射到所述第二意图倾向信息的已标记内容事件中,得到关注度变化结果。

步骤S1433a3,将所述关注度变化结果映射到所述第二意图倾向信息的已标记内容事件下具有热点推送记录的已推送内容事件中,得到历史关注度映射结果。

步骤S1433a4,对所述历史关注度映射结果进行关注度等级调整,并根据所述全局点击识别信息将关注度等级调整后的历史关注度映射结果映射到所述待关注内容事件中,得到所述初始关注度映射结果。

更加进一步地,步骤S1435所描述的根据所述事件热度变化信息与所述事件关注点映射记录上的多个关注点信息对应的目标关注事件之间的事件匹配信息,在所述用户初始关注内容中按照关注内容的时效性信息依次获取所述内容事件更新记录对应的已更新的内容事件组合,直至获取到的所述已更新的内容事件组合所在内容事件的事件搜索指数与所述内容事件更新记录在所述用户实时关注内容中的事件搜索指数一致时,停止获取下一内容事件中的已更新的内容事件组合,并确定所述内容事件更新记录与最后一次获取到的已更新的内容事件组合之间的内容事件喜好信息,可以包括如下步骤S1435a-步骤S1435c。

步骤S1435a,根据所述事件热度变化信息与所述事件关注点映射记录上的多个关注点信息对应的目标关注事件之间的事件匹配信息,确定所述内容事件更新记录在所述待关注内容事件中的内容事件组合,作为已更新的内容事件组合。

步骤S1435b,若所述待关注内容事件的事件搜索指数大于所述内容事件更新记录在所述用户实时关注内容中的事件搜索指数,则将所述已更新的内容事件组合与所述事件关注点映射记录映射到所述待关注内容事件的下一内容事件中,基于映射后的已更新的内容事件组合与映射后的事件关注点映射记录确定在所述下一内容事件中的内容事件组合,并将所述下一内容事件确定为所述待关注内容事件,将所述下一内容事件中的内容事件组合确定为所述已更新的内容事件组合。

步骤S1435c,若所述待关注内容事件在所述用户初始关注内容中的事件搜索指数与所述内容事件更新记录在所述用户实时关注内容中的事件搜索指数一致,则确定所述内容事件更新记录与最后一次所确定的所述已更新的内容事件组合之间的内容事件喜好信息。

在实际应用时发明人发现,为了确保关联内容查询的完整性,需要考虑不同的数据访问路径,为此,在步骤S150中,基于所述用户兴趣画像,对所述展示记录进行关联内容查询,得到查询结果,可以包括以下步骤S150a-步骤S150d。

步骤S150a,基于所述用户兴趣画像对应的多级画像分类结果,确定针对所述展示记录的查询链接信息,所述针对所述展示记录的查询链接信息与已收录的事件内容搜索引擎的访问路径相关。

步骤S150b,生成所述针对所述展示记录的查询链接信息的多个内容查询路径。

步骤S150c,获取所述多个内容查询路径各自对应的查询内容指示信息;所述查询内容指示信息由多个展示记录收藏信息进行整理得到。

步骤S150d,基于所述多个内容查询路径各自对应的查询内容指示信息,对相应的内容查询路径进行本地数据库和/或远程数据库的关联内容查询,得到所述多个内容查询路径各自对应的关联内容查询结果。

如此设计,通过实施上述步骤S150a-步骤S150d,能够确定出已收录的事件内容搜索引擎的访问路径相关的查询链接信息,进而确定多个内容查询路径,这样可以确定出查询内容指示信息,以便通过内容查询路径进行本地数据库和/或远程数据库的关联内容查询。这样可以将不同的数据访问路径考虑在内,从而确保查询到的关联内容的完整性。

进一步地,步骤S150a所描述的确定针对所述展示记录的查询链接信息包括:实时获取所述事件内容搜索引擎的访问路径的访问流量信息;当所述访问路径的访问流量信息出现访问流量热度标识时,将出现异常的访问路径对应的事件内容搜索引擎作为所述针对所述展示记录的查询链接信息;其中,所述针对所述展示记录的查询链接信息对应的访问路径包括多个访问路径。

进一步地,步骤S150b所描述的所述生成所述针对所述展示记录的查询链接信息的多个内容查询路径,包括:对所述多个访问路径分别进行内容索引分析,得到所述多个访问路径各自对应的访问内容指示信息;将所述多个访问路径各自对应的访问内容指示信息,作为所述针对所述展示记录的查询链接信息的多个内容查询路径。

更进一步地,步骤S150d所描述的所述基于所述多个内容查询路径各自对应的查询内容指示信息,对相应的内容查询路径进行本地数据库和/或远程数据库的关联内容查询,得到所述多个内容查询路径各自对应的关联内容查询结果,可以包括以下步骤S150d1-步骤S150d3所描述的内容。

步骤S150d1,基于所述多个内容查询路径各自对应的查询内容指示信息,对相应的内容查询路径进行查询内容整合分析,得到所述多个内容查询路径各自对应的查询内容整合结果。

步骤S150d2,在所述多个内容查询路径各自对应的查询内容整合结果与预设兴趣内容整合结果不匹配时,确定所述多个内容查询路径各自对应的关联内容查询结果为衍生内容查询结果。

步骤S150d3,在所述多个内容查询路径各自对应的查询内容整合结果与所述预设兴趣内容整合结果相匹配时,获取所述多个内容查询路径各自对应的数据库标识信息,在所述多个内容查询路径各自对应的数据库标识信息出现标识信息更新时,确定所述多个内容查询路径各自对应的关联内容查询结果为娱乐内容查询结果;在所述多个内容查询路径各自对应的数据库标识信息未出现标识信息更新时,确定各个内容查询路径各自对应的关联内容查询结果为办公内容查询结果。

这样一来,基于上述步骤S150d1-步骤S150d3,能够查询内容整合结果与预设兴趣内容整合结果的匹配情况分别确定不同类型的查询结果,从而确保查询结果的完整性。

对于可替换的实施例而言,步骤S110所描述的获取到已标记用户的搜索内容的展示记录的步骤之前还包括步骤S100:对所述添加了全局识别标签的内容识别模型和所述添加了局部识别标签的内容识别模型进行训练。

进一步地,步骤S100所描述的所述对所述添加了全局识别标签的内容识别模型和所述添加了局部识别标签的内容识别模型进行训练的步骤中具体包括:所述对所述添加了全局识别标签的内容识别模型进行训练的方法包括:采集全局历史用户行为数据集,所述全局历史用户行为数据集包括多个非实时行为数据,所述非实时行为数据为携带有已标记用户的用户身份信息和用户操作信息的行为数据;将所述非实时行为数据输入到待训练的全局网络模型中得到全局展示内容排序信息;对所述全局展示内容排序信息识别得到所述已标记用户的全局身份更新信息和全局操作更新信息;通过所述全局身份更新信息与所述用户身份信息、所述全局操作更新信息和所述用户操作信息查询得到全局识别标签对应的标签训练数据;利用所述全局识别标签对应的标签训练数据对所述待训练的全局网络模型进行迭代训练得到添加了全局识别标签的内容识别模型。

进一步地,步骤S100所描述的所述对所述添加了全局识别标签的内容识别模型和所述添加了局部识别标签的内容识别模型进行训练的步骤中具体包括:所述对所述添加了局部识别标签的内容识别模型进行训练的方法包括:采集局部历史用户行为数据集,所述局部历史用户行为数据集包括多个实时行为数据,所述实时行为数据为携带有已标记用户的用户身份信息和用户操作信息的行为数据;通过所述添加了全局识别标签的内容识别模型对所述实时行为数据进行识别得到过渡内容排序信息以及所述过渡内容排序信息对应的身份更新信息;将所述过渡内容排序信息和所述全局展示内容排序信息对应的身份更新信息输入到待训练的局部网络模型得到局部展示内容排序信息;对所述局部展示内容排序信息识别得到所述已标记用户的局部操作更新信息;通过所述局部操作更新信息和所述用户操作信息查询得到局部识别标签对应的标签训练数据;利用所述局部识别标签对应的标签训练数据对所述待训练的局部网络模型进行迭代训练得到添加了局部识别标签的内容识别模型。

对于可替换的实施例而言,步骤S150所描述的通过所述用户兴趣画像以及所述展示记录对应的展示区域信息确定所述查询结果的目标展示方式,可以包括以下步骤S151-步骤S154所描述的内容。

步骤S151,响应于未进行展示记录存储的用户查询操作,获取所述展示记录的展示内容遗留信息。

步骤S152,通过所述用户兴趣画像,分别对所述展示内容遗留信息及所述展示记录对应的多个展示区域信息的区域位置关系进行内容区域匹配处理,得到所述展示记录的内容展示方式及所述多个展示区域信息的内容展示方式,所述展示记录的内容展示方式包括多个内容输出方式的输出方式使用记录,所述展示区域信息的内容展示方式包括多个内容输出方式的输出方式使用记录,且所述展示区域信息的内容展示方式中的内容输出方式的总数量与所述展示记录的内容展示方式中的内容输出方式的总数量是一致的。

步骤S153,对于每个展示区域信息,分别确定所述展示记录的内容展示方式与所述展示区域信息的内容展示方式中相互对应的输出方式使用记录的用户使用反馈数据,根据确定的多组用户使用反馈数据确定所述展示记录与所述展示区域信息之间的用户关注度指标。

步骤S154,根据所述展示记录与所述多个展示区域信息之间的用户关注度指标,确定所述查询结果的目标展示方式。

如此设计,在确定查询结果的目标展示方式时,能够考虑不同的内容展示方式和内容输出方式,从而确定出用户关注度指标,这样能够根据用户关注度指标针对性地确定查询结果的目标展示方式,以方便后续用户的浏览和查看。

图4是根据本发明的一些实施例所示的一种示例性基于大数据和人工智能的信息处理装置140的框图,所述基于大数据和人工智能的信息处理装置140包括以下功能模块。

获取模块141,用于获取到已标记用户的搜索内容的展示记录。

第一识别模块142,用于通过添加了全局识别标签的内容识别模型对所述已标记用户的搜索内容的展示记录进行展示内容识别,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息;通过所述添加了全局识别标签的内容识别模型对所述展示内容排序信息进行全局点击操作识别以及收藏操作识别,得到全局点击识别信息以及全局收藏识别信息。

第二识别模块143,用于通过添加了局部识别标签的内容识别模型基于所述全局收藏识别信息对所述展示内容排序信息进行局部点击操作识别,得到局部点击识别信息;其中,所述添加了局部识别标签的内容识别模型是通过历史用户行为数据集训练得到的。

分析模块144,用于将所述全局点击识别信息和所述局部点击识别信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像。

查询模块145,用于基于所述用户兴趣画像,对所述展示记录进行关联内容查询,得到查询结果;通过所述用户兴趣画像以及所述展示记录对应的展示区域信息确定所述查询结果的目标展示方式。

上述功能模块的描述可以参阅对图3所示的方法的描述,在此不作更多说明。

基于上述同样的发明构思,还提供了基于大数据和人工智能的信息处理系统,关于该系统的进一步描述如下。

一种基于大数据和人工智能的信息处理系统,包括互相之间通信的数据服务器的用户业务设备;其中,所述数据服务器用于:

获取到已标记用户的搜索内容的展示记录;

通过添加了全局识别标签的内容识别模型对所述已标记用户的搜索内容的展示记录进行展示内容识别,得到所述已标记用户的搜索内容的展示记录的展示内容排序信息;通过所述添加了全局识别标签的内容识别模型对所述展示内容排序信息进行全局点击操作识别以及收藏操作识别,得到全局点击识别信息以及全局收藏识别信息;

通过添加了局部识别标签的内容识别模型基于所述全局收藏识别信息对所述展示内容排序信息进行局部点击操作识别,得到局部点击识别信息;其中,所述添加了局部识别标签的内容识别模型是通过历史用户行为数据集训练得到的;

将所述全局点击识别信息和所述局部点击识别信息进行用户兴趣分析,得到所述已标记用户的搜索内容的展示记录的用户兴趣画像;

基于所述用户兴趣画像,对所述展示记录进行关联内容查询,得到查询结果;通过所述用户兴趣画像以及所述展示记录对应的展示区域信息确定所述查询结果的目标展示方式。

上述系统的描述可以参阅对图3所示的方法的描述,在此不作更多说明。

需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义,例如针对一些值、系数、权重、指数、因子等术语,本领域技术人员可以根据前后的逻辑关系进行推导和确定,这些数值的取值范围可以根据实际情况进行选取,例如0~1,又例如1~10,再例如50~100,在此均不作限定。

本领域技术人员可以根据上述已公开的内容毫无疑义对一些预设的、基准的、预定的、设定的以及目标的技术特征/技术术语进行确定,例如阈值、阈值区间、阈值范围等。对于一些未作解释的技术特征术语,本领域技术人员完全能够基于前后文的逻辑关系进行合理地、毫无疑义地推导,从而清楚、完整地实施上述技术方案。未作解释的技术特征术语的前缀,例如“第一”、“第二”、“上一个”、“下一个”、“前一个”、“后一个”、“当前”、“历史”、“最新”、“最佳”、“目标”、“指定”和“实时”等,可以根据前后文进行毫无疑义地推导和确定。未作解释的技术特征术语的后缀,例如“列表”、“特征”、“序列”、“集合”、“矩阵”、“单元”、“元素”、“轨迹”和“清单”等,也可以根据前后文进行毫无疑义地推导和确定。

本发明实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可以对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。

同时,本申请使用了特定术语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同部分两次或多次提到的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的至少一个实施例中的某些特征、结构或特点可以进行适当的组合。

另外,本领域普通技术人员可以理解的是,本申请的各个方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可以被称为“单元”、“组件”或“系统”。此外,本申请的各方面可以表现为位于至少一个计算机可读介质中的计算机产品,所述产品包括计算机可读程序编码。

计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤缆线、RF、或类似介质、或任何上述介质的组合。

本申请各方面执行所需的计算机程序码可以用一种或多种程序语言的任意组合编写,包括面向对象程序设计,如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET,Python等,或类似的常规程序编程语言,如"C"编程语言,Visual Basic,Fortran2003,Perl,COBOL 2002,PHP,ABAP,动态编程语言如Python,Ruby和Groovy或其它编程语言。所述程式设计编码可以完全在用户计算机上执行、或作为独立的软体包在用户计算机上执行、或部分在用户计算机上执行部分在远程计算机执行、或完全在远程计算机或服务器上执行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网络(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。

此外,除非申请专利范围中明确说明,本申请所述处理元件和序列的顺序、数位字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的申请专利范围并不仅限于披露的实施例,相反,申请专利范围旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件装置实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或行动装置上安装所描述的系统。

同样应当理解的是,为了简化本申请揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法幷不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

相关技术
技术分类

06120112587142