掌桥专利:专业的专利平台
掌桥专利
首页

一种大数据画像分析方法、服务器及可读存储介质

文献发布时间:2023-06-19 11:57:35


一种大数据画像分析方法、服务器及可读存储介质

技术领域

本申请实施例涉及大数据和画像分析技术领域,具体涉及一种大数据画像分析方法、服务器及可读存储介质。

背景技术

随着科技的发展,大数据的应用越来越广泛。话题评论处理和情感极性分析作为大数据应用的其中一个分支,在现目前的流量时代应用的较多。

一般而言,用户可以通过智能终端参与网络上的话题讨论并发表自己的观点,这些观点可能会携带用户的相关情绪倾向,通过分析这些观点评论,能够勾画相关用户的画像,从而为后续的业务推送的产品服务升级提供依据。然而相关针对话题评论用户的画像分析技术还存在一些缺陷。

发明内容

有鉴于此,本申请实施例提供了一种大数据画像分析方法、服务器及可读存储介质。

本申请实施例提供了一种大数据画像分析方法,应用于画像分析服务器,所述方法包括:

根据目标话题互动客户端获取目标话题评论内容的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息;

在所述目标话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息;

根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库。

优选的,所述根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库之后,所述方法包括:

在所述目标在线评论用户在第三组至第四组话题观点文本内不存在互动评论记录的前提下,根据所述话题评论画像知识库分析所述目标在线评论用户在第三组话题观点文本中的第三评论情感极性信息,其中,所述第三组与所述第四组之间间隔n组,n为大于1、且小于第一设定阈值的正整数;

根据所述第三评论情感极性信息确定所述目标在线评论用户的第一解析策略信息;

根据所述文本同步更新线程获取所述第一解析策略信息的关联观点文本的最大关联度;

在所述最大关联度大于第二设定阈值的前提下,确定所述第三评论情感极性信息为所述目标在线评论用户的话题评论画像知识库的信息。

优选的,所述根据所述第三评论情感极性信息确定所述目标在线评论用户的第一解析策略信息,包括:

以所述目标在线评论用户在第二组话题观点文本中的第一目标策略信息的事理图谱传递路径为所述第一解析策略信息的事理图谱传递路径,以所述目标在线评论用户在所述第二组话题观点文本中所述第一目标策略信息的情感关键描述的特征加权结果为所述第一解析策略信息的情感关键描述,确定所述第一解析策略信息。

优选的,所述根据所述文本同步更新线程获取所述第一解析策略信息的关联观点文本的最大关联度,包括:

获取所述第一解析策略信息的策略描述特征;

在所述第一解析策略信息的策略描述特征中确定出m个局部策略描述特征,其中,所述m个局部策略描述特征的特征维度和特征分布相同,所述m个局部策略描述特征第一个局部策略描述特征的一个特征值为所述策略描述特征的第一特征值,所述m个局部策略描述特征最后一个局部策略描述特征的一个特征值为所述策略描述特征的第二特征值,所述第一特征值和所述第二特征值存在关联,所述m个局部策略描述特征中每相邻的两个局部策略描述特征之间存在相同特征维度的共有策略信息,所述m为大于1的正整数;

根据所述文本同步更新线程获取所述m个局部策略描述特征对应的m个关联观点文本;

将所述m个关联观点文本中的最大关联度确定为所述第一解析策略信息的关联观点文本的最大关联度。

优选的,所述根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库之后,所述方法包括:

在所述目标在线评论用户在第三组至第五组话题观点文本内不存在互动评论记录的前提下,根据所述目标话题互动客户端确定所述第三组话题观点文本中所述目标在线评论用户的所有目标备选策略信息,其中所述第三组与所述第五组之间间隔k组,k为大于第一设定阈值的正整数;

将所述所有目标备选策略信息的事理图谱传递路径和策略优先级优化与所述第二组话题观点文本中所述目标在线评论用户所在的第一目标策略信息的事理图谱传递路径和策略优先级一致;

提取所有优化后的所述目标备选策略信息的策略描述向量;

计算每个所述目标备选策略信息的策略描述向量与目标策略描述向量的余弦距离,其中,所述目标策略描述向量是从所述第一目标策略信息中提取所述目标在线评论用户得到的向量;

在最大余弦距离大于第三设定阈值的前提下,将所述最大余弦距离对应的目标备选策略信息中目标在线评论用户的第四评论情感极性信息确定为所述话题评论画像知识库的信息。

优选的,所述根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息之前,所述方法包括:

根据所述目标话题互动客户端获取第一组话题观点文本中所述目标在线评论用户的第二目标策略信息;

获取所述第二目标策略信息的情感关键描述,并根据所述情感关键描述调整得到第二解析策略信息;

获取所述第二解析策略信息的策略描述特征;

通过对所述第二解析策略信息的策略描述特征进行迭代处理得到所述文本同步更新线程的样本训练序列;

根据所述样本训练序列以及线性回归模型确定所述文本同步更新线程。

优选的,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息之前,所述方法还包括:

获取同步更新的关联观点文本的最大关联度;

获取同步更新的关联观点文本与预设自然语言文本特征分布之间的匹配程度;

根据所述最大关联度和所述匹配程度确定所述目标在线评论用户的话题评论可信系数;

在所述话题评论可信系数大于第四设定阈值的前提下,确定所述第二组话题观点文本中存在所述目标在线评论用户。

优选的,所述方法包括:

根据所述目标话题互动客户端获取所述目标话题评论内容的第一组话题观点文本中所述目标在线评论用户的第一用户绑定信息;

在所述目标话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据事理图谱传递路径和策略优先级关联线程关联观点文本的最大评论情感极性获取所述目标在线评论用户在所述第二组话题观点文本中的事理图谱传递路径和策略优先级;

根据所述第二评论情感极性信息、所述事理图谱传递路径和策略优先级确定所述目标在线评论用户在所述第二组话题观点文本中的第二用户绑定信息;

通过所述第一用户绑定信息和所述第二用户绑定信息对所述目标在线评论用户进行持续性画像挖掘;

相应的,所述根据所述第二评论情感极性信息、所述事理图谱传递路径和策略优先级输出所述目标在线评论用户在所述第二组话题观点文本中的第二用户绑定信息之后,所述方法包括:

根据所述第一组话题观点文本中所述目标在线评论用户的目标策略描述向量、所述第二组话题观点文本中的第二用户绑定信息数据以及第一全局线程配置参数确定所述目标在线评论用户在所述第二组话题观点文本中的目标策略描述向量;

根据所述第一组话题观点文本中的文本同步更新线程、所述第二组话题观点文本中的第二用户绑定信息数据以及第二全局线程配置参数确定所述第二组话题观点文本中的文本同步更新线程;

根据所述第一组话题观点文本中的事理图谱传递路径和策略优先级关联线程、所述第二组话题观点文本中的第二用户绑定信息数据以及第三全局线程配置参数确定所述第二组话题观点文本中的事理图谱传递路径和策略优先级关联线程;

依次按照以上步骤,根据前一组话题观点文本中所述目标在线评论用户的目标策略描述向量、当前组话题观点文本中的用户绑定信息数据以及全局线程配置参数确定所述当前组话题观点文本中所述目标在线评论用户的目标策略描述向量、文本同步更新线程以及事理图谱传递路径和策略优先级关联线程。

本申请实施例还提供了一种画像分析服务器,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行上述的方法。

本申请实施例还提供了一种计算机用可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。

相较于现有技术,本申请实施例提供的大数据画像分析方法、服务器及可读存储介质具有以下技术效果:通过根据目标话题互动客户端获取目标话题评论内容的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息;在目标话题评论内容的第二组话题观点文本中存在的目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定目标在线评论用户的第二评论情感极性信息;根据第一评论情感极性信息和第二评论情感极性信息确定目标在线评论用户的话题评论画像知识库,达到了根据文本同步更新线程获取的关联观点文本确定目标话题评论内容中每组话题观点文本中目标在线评论用户的评论情感极性信息的目的,从而实现了根据同步更新的关联观点文本完整确定目标在线评论用户评论情感极性信息的技术效果,进而解决了相关技术中,在较为繁杂的话题交互环境下目标在线评论用户的话题评论画像知识库出现缺失的技术问题。

在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种画像分析服务器的方框示意图。

图2为本申请实施例所提供的一种大数据画像分析方法的流程图。

图3为本申请实施例所提供的一种大数据画像分析装置的框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

图1示出了本申请实施例所提供的一种画像分析服务器10的方框示意图。本申请实施例中的画像分析服务器10可以为具有数据存储、传输、处理功能的服务端,如图1所示,画像分析服务器10包括:存储器11、处理器12、通信总线13和大数据画像分析装置20。

存储器11、处理器12和通信总线13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有大数据画像分析装置20,所述大数据画像分析装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本申请实施例中的大数据画像分析装置20,从而执行各种功能应用以及数据处理,即实现本申请实施例中的大数据画像分析方法。

其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。

所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

通信总线13用于通过网络建立画像分析服务器10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。

可以理解,图1所示的结构仅为示意,画像分析服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

本申请实施例还提供了一种计算机用可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。

图2示出了本申请实施例所提供的一种大数据画像分析的流程图。所述方法有关的流程所定义的方法步骤应用于画像分析服务器10,可以由所述处理器12实现,所述方法包括以下S21-S23。

S21、画像分析服务器根据目标话题互动客户端获取目标话题评论内容的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息。

例如,画像分析服务器与目标话题互动客户端通信,并在获得目标话题互动客户端授权的前提下获取对应的目标话题评论内容。目标话题评论内容可以是文本内容。第一组话题观点文本可以是用户输入的文字性观点评论。目标在线评论用户可以是通过账号登录的互联网用户。相应的,评论情感极性信息可以包括积极、消极和中立三种情感极性,也可以包括其他类型的极性,本方案不一一列举。

在本申请实施例中,可以通过相关神经网络模型对第一组话题观点文本进行分析从而得到第一评论情感极性信息,比如可以预先对神经网络模型进行训练,然后调用神经网络模型对第一组话题观点文本进行分析,具体实施方式可以参阅相关现有技术。

S22、画像分析服务器在所述目标话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息。

例如,第二组话题观点文本的生成时刻可以在第一组话题观点文本之前,第二组话题观点文本中存在的所述目标在线评论用户可以理解为第二组话题观点文本中存在所述目标在线评论用户的在线状态标识。

关联观点文本可以是其他用户的话题观点文本,用以辅助确定目标在线评论用户的第二评论情感极性信息,比如,可以根据关联观点文本与第二组话题观点文本之间的语义关联情况确定目标在线评论用户的第二评论情感极性信息,这样可以尽可能确保第二评论情感极性信息的完整性。

在一些可以替换的实施例中,在S22所描述的根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息的步骤之前,该方法还可以包括以下技术方案:根据所述目标话题互动客户端获取第一组话题观点文本中所述目标在线评论用户的第二目标策略信息;获取所述第二目标策略信息的情感关键描述,并根据所述情感关键描述调整得到第二解析策略信息;获取所述第二解析策略信息的策略描述特征;通过对所述第二解析策略信息的策略描述特征进行迭代处理得到所述文本同步更新线程的样本训练序列;根据所述样本训练序列以及线性回归模型确定所述文本同步更新线程。

这样一来,能够对文本同步更新线程进行配置和优化,从而确保文本同步更新线程在后续运行时的稳定性。

在一些可以替换的实施例中,在S22所描述的根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息之前,该方法还可以包括以下技术方案:获取同步更新的关联观点文本的最大关联度;获取同步更新的关联观点文本与预设自然语言文本特征分布之间的匹配程度;根据所述最大关联度和所述匹配程度确定所述目标在线评论用户的话题评论可信系数;在所述话题评论可信系数大于第四设定阈值的前提下,确定所述第二组话题观点文本中存在所述目标在线评论用户。

如此设计,可以基于话题评论可信系数准确判断第二组话题观点文本中是否存在所述目标在线评论用户,从而为后续的知识库搭建提供准确可靠的数据依据。

S23、画像分析服务器根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库。

在本申请实施例中,话题评论画像知识库可以理解为话题评判画像的知识图谱,知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。

可以理解,通过不同的评论情感极性信息能够确保话题评论画像知识库在搭建过程中的完整性,避免遗漏部分评论情感极性而导致题评论画像知识库出现缺失。

在一些选择性的实施例中,上述S23所描述的根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库,可以包括以下S231-S236。

S231、根据所述第一评论情感极性信息以及所述第二评论情感极性信息获取评论语义情绪内容集合,其中,所述评论语义情绪内容集合包括相关的x组评论语义情绪内容,所述x为大于1的整数。

S232、根据所述评论语义情绪内容集合获取情绪内容噪声集合,其中,所述情绪内容噪声集合包括相关的x组情绪内容噪声。

例如,情绪内容噪声是存在干扰的情绪内容。

S233、基于所述评论语义情绪内容集合,通过评论语义识别网络所包括的第一描述识别单元获取评论语义关键描述集合,其中,所述评论语义关键描述集合包括x个评论语义关键描述。

S234、基于所述情绪内容噪声集合,通过所述评论语义识别网络所包括的第二描述识别单元获取噪声关键描述集合,其中,所述噪声关键描述集合包括x个噪声关键描述。

S235、基于所述评论语义关键描述集合以及所述噪声关键描述集合,通过所述评论语义识别网络所包括的情绪极性聚类单元获取所述评论语义情绪内容集合所对应的情绪画像聚类结果;根据所述情绪画像聚类结果确定所述评论语义情绪内容集合的情绪画像拼接策略。

例如,情绪画像拼接策略包括标签节点之间的连接关系和标签节点的属性配置信息等。

S236、利用所述情绪画像拼接策略对所述第一评论情感极性信息的情绪画像标签以及以及所述第二评论情感极性信息的情绪画像标签进行图数据化处理,得到所述话题评论画像知识库;

例如,图数据化处理可以理解为将不同的情绪画像标签进行节点化处理,从而形成话题评论画像知识库(知识图谱)。

可以理解,通过实施上述S231-S236,能够将评论语义情绪内容以及情绪内容噪声考虑在内,从而得到情绪画像拼接策略,以通过情绪画像拼接策略对所述第一评论情感极性信息的情绪画像标签以及以及所述第二评论情感极性信息的情绪画像标签进行图数据化处理,得到所述话题评论画像知识库,这样可以确保话题评论画像知识库的完整性,避免出现部分画像节点或者画像节点之间的连边的缺失,以提高话题评论画像知识库的质量。

在一些选择性的实施例中,S235所描述的基于所述评论语义关键描述集合以及所述噪声关键描述集合,通过所述评论语义识别网络所包括的情绪极性聚类单元获取所述评论语义情绪内容集合所对应的情绪画像聚类结果,可以包括以下S2351-S2355。

S2351、基于所述评论语义关键描述集合,通过所述评论语义识别网络所包括的第一全局特征识别层获取x个第一语义特征图,其中,每个第一语义特征图对应于一个评论语义关键描述。

S2352、基于所述噪声关键描述集合,通过所述评论语义识别网络所包括的第二全局特征识别层获取x个第二语义特征图,其中,每个第二语义特征图对应于一个噪声关键描述。

S2353、对所述x个第一语义特征图以及所述x个第二语义特征图进行整合处理,得到x个目标语义特征图,其中,每个目标语义特征图包括一个第一语义特征图以及一个第二语义特征图。

S2354、基于所述x个目标语义特征图,通过所述评论语义识别网络所包括的时间域关注单元获取融合语义特征图,其中,所述融合语义特征图为根据所述x个目标语义特征图以及x个时序权重确定的,每个目标语义特征图对应于一个时序权重。

S2355、基于所述融合语义特征图,通过所述评论语义识别网络所包括的情绪极性聚类单元获取所述评论语义情绪内容集合所对应的情绪画像聚类结果。

在一些可能的实施例中,在S23所描述的根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库的步骤之后,所述方法包括以下S241-S244。

S241、在所述目标在线评论用户在第三组至第四组话题观点文本内不存在互动评论记录的前提下,根据所述话题评论画像知识库分析所述目标在线评论用户在第三组话题观点文本中的第三评论情感极性信息,其中,所述第三组与所述第四组之间间隔n组,n为大于1、且小于第一设定阈值的正整数。

例如,互动评论记录可以是与目标在线评论用户对应的评论记录。

S242、根据所述第三评论情感极性信息确定所述目标在线评论用户的第一解析策略信息。

例如,第一解析策略信息用于确定关联观点文本。

相应的,在一些示例中,S242所描述的根据所述第三评论情感极性信息确定所述目标在线评论用户的第一解析策略信息,包括:以所述目标在线评论用户在第二组话题观点文本中的第一目标策略信息的事理图谱传递路径为所述第一解析策略信息的事理图谱传递路径,以所述目标在线评论用户在所述第二组话题观点文本中所述第一目标策略信息的情感关键描述的特征加权结果为所述第一解析策略信息的情感关键描述,确定所述第一解析策略信息。

例如,事理图谱为一个事理逻辑知识库,描述了事件之间的演化规律和模式。在结构上,事理图谱是一个有向有环图,其中节点代表事件,有向边代表事件之间的顺承、因果、条件和上下位等事理逻辑关系。因此,为了准确将不同分类标识对应的新闻事件的事件内容准确、并高效的呈现给用户,以实现新闻预警的目的,将事件内容以具有逻辑关系的方式映射到事理图谱对应的节点处。进一步地,情感关键描述可以是特征向量。

S243、根据所述文本同步更新线程获取所述第一解析策略信息的关联观点文本的最大关联度。

例如,文本同步更新线程可以是预先配置完成的,用以进行评论文本同步,以避免相关文本信息的丢失。

在一些可能的实施例中,S243所描述的根据所述文本同步更新线程获取所述第一解析策略信息的关联观点文本的最大关联度的步骤,可以包括以下S2431-S2434。

S2431、获取所述第一解析策略信息的策略描述特征。

例如,策略描述特征用于从不同维度表达解析策略信息。

S2432、在所述第一解析策略信息的策略描述特征中确定出m个局部策略描述特征。

在本申请实施例中,所述m个局部策略描述特征的特征维度和特征分布相同,所述m个局部策略描述特征第一个局部策略描述特征的一个特征值为所述策略描述特征的第一特征值,所述m个局部策略描述特征最后一个局部策略描述特征的一个特征值为所述策略描述特征的第二特征值,所述第一特征值和所述第二特征值存在关联,所述m个局部策略描述特征中每相邻的两个局部策略描述特征之间存在相同特征维度的共有策略信息,所述m为大于1的正整数。

S2433、根据所述文本同步更新线程获取所述m个局部策略描述特征对应的m个关联观点文本。

S2434、将所述m个关联观点文本中的最大关联度确定为所述第一解析策略信息的关联观点文本的最大关联度。

如此设计,通过上述S2431-S2434,能够尽可能完整地获取关联观点文本,从而确保第一解析策略信息的关联观点文本的最大关联度的可信度。

S244、在所述最大关联度大于第二设定阈值的前提下,确定所述第三评论情感极性信息为所述目标在线评论用户的话题评论画像知识库的信息。

可以理解的是,通过确定第三评论情感极性信息为所述目标在线评论用户的话题评论画像知识库的信息,能够结合第三评论情感极性信息进一步优化和完善话题评论画像知识库,从而确保话题评论画像知识库处于持续的更新状态中。

在另外的一些实施例中,S23所描述的根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库之后,所述方法还可以包括以下S251-S255。

S251、在所述目标在线评论用户在第三组至第五组话题观点文本内不存在互动评论记录的前提下,根据所述目标话题互动客户端确定所述第三组话题观点文本中所述目标在线评论用户的所有目标备选策略信息,其中所述第三组与所述第五组之间间隔k组,k为大于第一设定阈值的正整数;

S252、将所述所有目标备选策略信息的事理图谱传递路径和策略优先级优化与所述第二组话题观点文本中所述目标在线评论用户所在的第一目标策略信息的事理图谱传递路径和策略优先级一致。

S253、提取所有优化后的所述目标备选策略信息的策略描述向量。

S254、计算每个所述目标备选策略信息的策略描述向量与目标策略描述向量的余弦距离,其中,所述目标策略描述向量是从所述第一目标策略信息中提取所述目标在线评论用户得到的向量。

S255、在最大余弦距离大于第三设定阈值的前提下,将所述最大余弦距离对应的目标备选策略信息中目标在线评论用户的第四评论情感极性信息确定为所述话题评论画像知识库的信息。

可以理解,通过确定第四评论情感极性信息为所述目标在线评论用户的话题评论画像知识库的信息,能够结合第四评论情感极性信息进一步优化和完善话题评论画像知识库,从而确保话题评论画像知识库处于持续的更新状态中。

在一些相关的实施例中,该方法还可以包括以下S31-S34。

S31、根据所述目标话题互动客户端获取所述目标话题评论内容的第一组话题观点文本中所述目标在线评论用户的第一用户绑定信息。

例如,用户绑定信息用于检测目标在线评论用户。

S32、在所述目标话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据事理图谱传递路径和策略优先级关联线程关联观点文本的最大评论情感极性获取所述目标在线评论用户在所述第二组话题观点文本中的事理图谱传递路径和策略优先级。

例如,评论情感极性可以量化表达,比如消极极性为0,积极极性为1。

S33、根据所述第二评论情感极性信息、所述事理图谱传递路径和策略优先级确定所述目标在线评论用户在所述第二组话题观点文本中的第二用户绑定信息。

在一些可能的示例中,S33所描述的根据所述第二评论情感极性信息、所述事理图谱传递路径和策略优先级输出所述目标在线评论用户在所述第二组话题观点文本中的第二用户绑定信息之后,所述方法还可以包括以下步骤a1-步骤a4。

步骤a1、根据所述第一组话题观点文本中所述目标在线评论用户的目标策略描述向量、所述第二组话题观点文本中的第二用户绑定信息数据以及第一全局线程配置参数确定所述目标在线评论用户在所述第二组话题观点文本中的目标策略描述向量。

步骤a2、根据所述第一组话题观点文本中的文本同步更新线程、所述第二组话题观点文本中的第二用户绑定信息数据以及第二全局线程配置参数确定所述第二组话题观点文本中的文本同步更新线程。

步骤a3、根据所述第一组话题观点文本中的事理图谱传递路径和策略优先级关联线程、所述第二组话题观点文本中的第二用户绑定信息数据以及第三全局线程配置参数确定所述第二组话题观点文本中的事理图谱传递路径和策略优先级关联线程。

步骤a4、依次按照以上步骤a1-a3,根据前一组话题观点文本中所述目标在线评论用户的目标策略描述向量、当前组话题观点文本中的用户绑定信息数据以及全局线程配置参数确定所述当前组话题观点文本中所述目标在线评论用户的目标策略描述向量、文本同步更新线程以及事理图谱传递路径和策略优先级关联线程。

S34、通过所述第一用户绑定信息和所述第二用户绑定信息对所述目标在线评论用户进行持续性画像挖掘。

在本申请实施例中,持续性画像挖掘可以是对目标在线评论用户的相关评论文本或者用户操作进行实时不间断的画像分析,从而为知识库的更新提供尽可能多的素材。

基于上述同样的发明构思,还提供了一种大数据画像分析装置20,应用于画像分析服务器10,所述装置包括:

第一获取模块21,用于根据目标话题互动客户端获取目标话题评论内容的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息;

第二获取模块22,用于在所述目标话题评论内容的第二组话题观点文本中存在的所述目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定所述目标在线评论用户的第二评论情感极性信息;

知识确定模块23,用于根据所述第一评论情感极性信息和所述第二评论情感极性信息确定所述目标在线评论用户的话题评论画像知识库。

关于上述功能模块的描述请参阅对图2所示的方法的描述。

综上,在应用上述方案时,能够通过根据目标话题互动客户端获取目标话题评论内容的第一组话题观点文本中目标在线评论用户的第一评论情感极性信息;在目标话题评论内容的第二组话题观点文本中存在的目标在线评论用户的前提下,根据同步更新的具有最大关联度的关联观点文本的评论情感极性确定目标在线评论用户的第二评论情感极性信息;根据第一评论情感极性信息和第二评论情感极性信息确定目标在线评论用户的话题评论画像知识库,达到了根据文本同步更新线程获取的关联观点文本确定目标话题评论内容中每组话题观点文本中目标在线评论用户的评论情感极性信息的目的,从而实现了根据同步更新的关联观点文本完整确定目标在线评论用户评论情感极性信息的技术效果,进而解决了相关技术中,在较为繁杂的话题交互环境下目标在线评论用户的话题评论画像知识库出现缺失的技术问题。

在本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,画像分析服务器10,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 一种大数据画像分析方法、服务器及可读存储介质
  • 基于大数据平台的网络安全分析方法、大数据平台服务器及计算机可读存储介质
技术分类

06120113117080