掌桥专利:专业的专利平台
掌桥专利
首页

基于知识图谱的可解释的情绪逻辑识别方法、系统及介质

文献发布时间:2023-06-19 13:29:16


基于知识图谱的可解释的情绪逻辑识别方法、系统及介质

技术领域

本发明涉及一种数据分析识别技术领域,特别是关于一种基于知识图谱的可解释的情绪逻辑识别方法、系统及介质。

背景技术

一般的情感分析计算中主要针对文本来分析情感极性,一般会分为积极、中立和消极三种,即使在细粒度情感分析任务中,也仅仅是针对文本中的实体进行更细致的极性分析,主要会涉及实体的若干属性。比如在餐饮服务业中,会对其评价进行细粒度分类,主要是要识别出用餐环境、餐馆地理位置、菜品特色、服务员水准等等各个方面的情感极性。但是,这些情感分析存在很多缺陷:首先并没有考虑到情感的来源,也就是说情感的基础是什么;其次,对于为什么会产生此种情感并没有进行可靠的分析,仅仅关注情感分析结果;再次,如果从新闻或者文学作品等文本中去分析情感,就必须确定情感的对象及产生的具体情感状态,此时遇到的情感分析任务会比之前单纯从评价中获取信息要复杂很多;最后,情感施加与被施加对象间的情感关系需要相关专业知识的支撑,计算机领域知识无法从科学理论上满足这种推理要求,计算机技术仅仅能够提供计算技术的支持。

情绪心理学的研究和发展为以上问题带来了解决方案。首先,情绪心理学认为情绪时产生情感的基础,不同的情绪会导致情感的状态变化,而情绪心理学的生理理论依据实验已经给出了情绪的基本种类,因此为情绪状态的判断提供了理论基础;其次,认知心理学研究了人们如何注意和获得关于客观世界的信息,这些信息如何被大脑存储和加工,研究人们如何解决问题、如何思维、如何形成语言,以及如何通过外显行为来证明这些过程,而这些研究可以对情感的产生机理和原因进行有效的解释;再次,情绪评价与认知理论探讨了情绪的认知结构,强调认知评价的作用,Lazarus理论主张情绪是对意义的反应,这个反应需要通过认知评价来决定和完成,因此现实世界中的情绪往往需要有刺激环境作为基础,而新闻事件中多数事件正是这个刺激的来源,文学作品中也会有很多事件或个体成为诱因;最后,利用已有的情绪心理学知识可以帮助构建情绪的分类和因果逻辑关系,帮助去合理的、可解释的做出情绪规则与推理机制,从而达到对情绪的智能分析的目的。

发明内容

针对上述问题,本发明的目的是提供一种基于知识图谱的可解释的情绪逻辑识别方法、系统及介质,其可以对文本通过基本的自然语言处理技术来获取事实中的情绪三元组实例,从而完成相关情绪的预测或推理识别计算。

为实现上述目的,本发明采取以下技术方案:一种基于知识图谱的可解释的情绪逻辑识别方法,其包括:在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,所述输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;在实例层中依据基本的情绪逻辑和推理规则,将若干所述输出集合中的实体和事件映射到知识的概念层中;在所述概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从所述文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

进一步,所述在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,包括:

将所述输入文本进行所述实体识别,得到所述实体集合;

将所述输入文本进行所述谓词识别,得到所述谓词集合;

对所述输入文本进行所述情绪词识别,得到所述情绪词集合;

对所述实体集合和所述谓词集合进行所述事件检测,得到所述事件集合;

对所述情绪词集合进行所述情感极性判别,得到所述情感极性。

进一步,所述实体识别、所述谓词识别、所述情绪词识别、所述情感极性判别和所述事件检测,均采用自然语言处理工具来完成识别。

进一步,所述实体识别、所述谓词识别和所述情绪词识别,包括:

所述实体识是通过训练一个CRF+BiLSTM分类器进行识别;

所述谓词识别是通过词性判断和依存语法树找到相关的谓语动词;

所述情绪词识别是通过情绪词典作为基本依据,再辅以次性分析和语法分析得到判定规则,实现识别。

进一步,所述情感极性判别和事件检测,包括:

所述情感极性判别是通过设置的BiLSTM分类器实现判别;

所述事件检测是通过事件检测模型Subword CNN+BiLSTM分类器,确定事件的描述词语集合。

进一步,所述将若干所述输出集合中的实体和事件映射到知识的概念层中,包括:

将所述实体集合进行代理映射,映射到所述概念层中得到代理;

将所述事件集合进行对象映射,映射到所述概念层中得到对象;

将所述概念层中的代理和对象对齐。

进一步,所述根据该基本的情绪逻辑和推理规则,从所述文本层中得到关于情绪状态推理后的三元组,包括:

根据所述基本的情绪逻辑和推理规则,对所述情感极性,映射得到的代理及映射得到的对象进行逻辑推理、预测及识别,得到对象-事件、代理-对象之间可能存在的情绪状态。

一种基于知识图谱的可解释的情绪逻辑识别系统,其包括:文本模块、实例模块和概念模块;所述文本模块,用于在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,所述输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;所述实例模块,用于在实例层中依据基本的情绪逻辑和推理规则,将若干所述输出集合中的实体和事件映射到知识的概念层中;所述概念模块,用于在所述概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从所述文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行上述方法中的任一方法。

一种计算设备,其包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行上述方法中的任一方法的指令。

本发明由于采取以上技术方案,其具有以下优点:

1、本发明集成了多种自然语言处理的基本模块,不仅为进一步完成各种复杂任务提供了基本输入集合,而且还可以根据现实技术的发展进行模块更新。其主要包括:谓词识别,情绪词识别,实体识别,事件检测,情感极性判别等。

2、本发明可以自动地将基本语言处理模块的结果映射到本体空间,即与知识图谱概念层中的本体进行自动对齐,实现了模块化设计。

3、本发明利用知识图谱基本技术,构建了基于OCC情绪认知模型的概念层次,即抽象出了事件、代理和对象三种基本本体,并在该层次中实现了各本体与情绪类型间的逻辑关系模型。

4、本发明能够对给定的一段文本通过以上功能实现对事件、代理及对象之间的情绪状态推理和情绪预测。

综上,本发明尤其在新闻和文学作品领域取得了较好的分析效果。

附图说明

图1是本发明一实施例中的情绪逻辑识别方法整体流程示意图;

图2是本发明一实施例中的实现结构流程图;

图3是本发明一实施例中的原始OCC情绪认知模型框架;

图4是本发明一实施例中的对OCC模型的逻辑结构重构;

图5是本发明一实施例中的基于OCC模型的逻辑结构构建的知识图谱概念层次的认知模式;

图6是本发明一实施例中的文本分析的一个实例图解;

图7是本发明一实施例中的计算设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种基于知识图谱的可解释的情绪逻辑识别方法、系统及介质,其中的情绪逻辑主要来源于情绪心理学中的认知与评价理论,情绪的极性类别需要借助已有的深度学习模型来构建分类机制,而情绪逻辑则需要借助知识图谱的概念层次来构建其认知模式,在此基础上可以对文本通过基本的自然语言处理技术来获取事实中的情绪三元组实例,从而完成相关情绪的预测或推理计算。

在本发明的一个实施例中,如图1所示,提供一种基于知识图谱的可解释的情绪逻辑识别方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:

步骤1、在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;

步骤2、在实例层中依据基本的情绪逻辑和推理规则,将若干输出集合中的实体和事件映射到知识的概念层中;

步骤3、在概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

上述步骤1中,本发明包括实体识别、谓词识别、情绪词识别、事件检测、情感极性判别、代理映射、对象映射和情绪逻辑推理等功能模块。如图2所示,其中前5个功能可以借助已有的自然语言处理的基础工具或最新技术来实现,可以得到输入文本的若干输出集合:实体集合(ER)、谓词集合(PF)、情绪词集合(ET)、事件集合(ED)、情感极性(SP);之后的两个映射模块主要是为了将实体和事件映射到知识的概念层次中去,而概念层次中的本体有对象、代理和事件,由于事件本身不再需要映射,所以只需将代理和对象完成对齐即可。

具体的,在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,包括以下步骤:

步骤11、将输入文本进行实体识别,得到实体集合;

步骤12、将输入文本进行谓词识别,得到谓词集合;

步骤13、对输入文本进行情绪词识别,得到情绪词集合;

步骤14、对实体集合和谓词集合进行事件检测,得到事件集合;

步骤15、对情绪词集合进行情感极性判别,得到情感极性。

图2中的箭头表示出了各个识别模块间的依赖关系,箭头尾部模块提供输出结果集合,箭头头部模块将该输出集合作为自身的输入以进行下一步的分析和计算,以此类推直至最后一个模块。最后一个模块是进行情绪逻辑推理,其功能就是根据概念层中存储的情绪逻辑来完成最后的推理及预测任务,发现对象-事件、代理-对象等等之间可能存在的情绪状态或者说是情绪关系。

上述步骤1中,实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,均采用自然语言处理工具来完成识别。

其中,实体识是通过训练一个CRF+BiLSTM分类器进行识别;谓词识别是通过词性判断和依存语法树找到相关的谓语动词;情绪词识别是通过情绪词典作为基本依据,再辅以次性分析和语法分析得到判定规则,实现识别。

情感极性判别是通过设置的BiLSTM分类器实现判别;事件检测是通过事件检测模型Subword CNN+BiLSTM分类器,确定事件的描述词语集合。

在本实施例中,如图2所示,各个识别步骤中的基本功能的实现会决定整个流程能否顺利实现。一方面,可以利用现有的自然语言处理工具来完成这些模块。对应谓词识别而言,词性判断和依存语法树就可以很方便的帮助我们找到相关的谓语动词,其准确程度很高;对于情绪词的识别,可以通过现有的情绪词典作为基本依据,再辅以次性分析和语法分析等就可以得到一些非常简单的判定规则来达到很高的准确性;对于实体识别而言,问题稍微复杂一些,利用斯坦福的处理工具在分析新闻事件中是比较准确的,但是换到文学作品领域,还是需要单独训练一个CRF+BiLSTM分类器来提高识别精度,该模型也是普遍公认的实体识别效率最高的模型;对于情感极性判断,采用一个简单的BiLSTM分类器,在训练后可以达到相当高的准确性;对于事件检测,采用一个成熟的事件检测模型Subword CNN+BiLSTM分类器,用以确定事件的描述词语集合。

上述步骤2中,将若干输出集合中的实体和事件映射到知识的概念层中,包括以下步骤:

步骤21、将实体集合进行代理映射,映射到概念层中得到代理;

步骤22、将事件集合进行对象映射,映射到概念层中得到对象;

步骤23、将概念层中的代理和对象对齐。

上述步骤3中,根据该基本的情绪逻辑和推理规则,从文本层中得到关于情绪状态推理后的三元组,具体为:根据基本的情绪逻辑和推理规则,对情感极性,映射得到的代理及映射得到的对象进行逻辑推理、预测及识别,得到对象-事件、代理-对象之间可能存在的情绪状态。

例如:对象“一个男人”对事件“获得遗产”的情绪状态是“开心”;对象“他的远亲”对对象“一个男人”的情绪状态是“嫉妒”;等等。

综上,本发明是基于情绪心理学中的认知与评价理论得来的。如图3所示,由于该模型是由Ortony、Clore和Collins三个人共同提出的,因此以三人的名字命名了该模型。从图3中可以看到,事件往往会引起相对应的后果,而代理则是对事件或者对象的刺激做出相应的反应或应对,而对象则表现为情绪侧面。对于不同的抽象概念而言,与自己是否相关以及极性积极与否都是相应情绪状态的诱因,这些条件之间存在着明显的逻辑关系,因此需要对情绪逻辑进行梳理。根据对情绪状态的由来,可以得到图4所示的情绪的分层逻辑结构。其中可以清晰地分辨出情感极性在情绪逻辑中对应的不同状态,同时还有产生这些情绪状态的逻辑条件。但是,该逻辑关系的分析过于庞杂,有很多条件是计算机自然语言处理技术无法进行分析的,特别是很多关于情绪产生的环境条件,在文本分析中是无法轻易得到的,因此图4中的逻辑尤其是最后一个层次的逻辑条件过为严苛。因此,在实际实践中,将最后一个层次的逻辑进行了简化和改进,以使其更加适应计算和处理。修改后的逻辑模型反应到知识图谱的概念层次中去,就得到了如图5所示的关于本体的认知模式定义,在该模式中,我们将本体层抽象为三个概念:代理(Agent)、事件(Event)和对象(Object)。这三种概念对应了消极或积极的不同情绪状态,进入不同情绪状态的条件已经以关系的形式存储在了模式之中,这也成为系统中的映射模块所要完成的功能。在本实施例中,只要从文本中能够得到相关概念及逻辑条件(或者称为逻辑关系),就可以依据该逻辑来推断当前目标的情绪状态了。

实施例:

下面通过具体的实施例对本发明的方法做进一步的说明,如图6所示。

步骤1:从文本中首先完成实体识别ER={Fred,Mary,She};谓词识别PF={was,won};情绪词识别ER={happy};情感极性SP={Positive};事件检测ED={”won athousand dollars”};

步骤2、开始映射AM={[Fred,Self-agent];[Mary,Self-agent];[Fred,Other-agent];[Mary,Other-agent]};OM={[ED,Act-conseq],[ED,Pro-conseq]};

步骤3、开始逻辑推理:(Fred,Mary)->like;(ED,Mary)->joy;(ED,Fred)->happy;……。

由此可以看到,整个系统的实现可以分为三个层次:文本层、实例层和概念层。概念层保存了基本的情绪逻辑和推理规则,而实例层可以依据概念层从文本层中得到关于情绪状态推理后的三元组,这就是整个系统的运作原理和流程。

在本发明的一个实施例中,提供一种基于知识图谱的可解释的情绪逻辑识别系统,其包括:文本模块、实例模块和概念模块;

文本模块,用于在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;

实例模块,用于在实例层中依据基本的情绪逻辑和推理规则,将若干输出集合中的实体和事件映射到知识的概念层中;

概念模块,用于在概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

本实施例提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。

如图7所示,为本发明一实施例中提供的计算设备结构示意图,该计算设备可以是终端,其可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、显示屏和输入装置。其中,处理器、通信接口、存储器通过通信总线完成相互间的通信。该处理器用于提供计算和控制能力。该存储器包括非易失性存储介质、内存储器,该非易失性存储介质存储有操作系统和计算机程序,该计算机程序被处理器执行时以实现一种情绪逻辑识别方法;该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、管理商网络、NFC(近场通信)或其他技术实现。该显示屏可以是液晶显示屏或者电子墨水显示屏,该输入装置可以是显示屏上覆盖的触摸层,也可以是计算设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。处理器可以调用存储器中的逻辑指令,以执行如下方法:

在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;在实例层中依据基本的情绪逻辑和推理规则,将若干输出集合中的实体和事件映射到知识的概念层中;在概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算设备的限定,具体的计算设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在本发明的一个实施例中,提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;在实例层中依据基本的情绪逻辑和推理规则,将若干输出集合中的实体和事件映射到知识的概念层中;在概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

在本发明的一个实施例中,提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储服务器指令,该计算机指令使计算机执行上述各实施例提供的方法,例如包括:在文本层中输入文本中完成实体识别、谓词识别、情绪词识别、情感极性判别和事件检测,得到若干输出集合,输出集合包括实体集合、谓词集合、情绪词集合、事件集合和情感极性;在实例层中依据基本的情绪逻辑和推理规则,将若干输出集合中的实体和事件映射到知识的概念层中;在概念层中保存了基本的情绪逻辑和推理规则,根据该基本的情绪逻辑和推理规则,从文本层中得到关于情绪状态推理后的三元组,完成情绪逻辑推理及预测识别。

上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 基于知识图谱的可解释的情绪逻辑识别方法、系统及介质
  • 一种基于知识图谱的可解释推荐系统
技术分类

06120113693395