掌桥专利:专业的专利平台
掌桥专利
首页

一种基于多视角相邻跨度增强的方面级情感分类方法

文献发布时间:2024-04-18 19:58:26


一种基于多视角相邻跨度增强的方面级情感分类方法

技术领域

本发明涉及情感分析技术领域,具体涉及一种基于多视角相邻跨度增强的方面级情感分类方法。

背景技术

随着社交媒体和在线评论的普及,人们越来越多地在互联网上表达自己的观点和情感。这导致了大量的文本数据涉及多个方面,例如产品评论、酒店评价和电影评论等,在这些场景中,仅仅了解整体情感是不够的,我们需要深入了解文本中不同方面的情感。例如,在产品评论中,了解哪些方面受到用户的积极评价或负面评价可以帮助企业改进产品的具体要素,提升用户体验。基于方面的情感分类的主要目的是判断表达意见的句子中方面词的情感极性(积极、消极、中性)。方面级情感分类是一个面向实体级、细粒度的情感分析挑战。

进一步地,现有方面级情感分类方法大多关注于如何建立方面词与意见词之间的语义关联,而忽略了方面词与意见词之间的对齐,从而导致了语义不匹配问题。为此,本专利提出了一种基于多视角相邻跨度增强的方面级情感分类方法及系统,解决方面词与意见词的语义不匹配问题,提高分类的准确性。

发明内容

为解决现有技术中存在的问题,本发明提供了一种基于多视角相邻跨度增强的方面级情感分类方法及系统,从方面词相邻单词的不同语义组合出发,利用注意力机制,提出了一种新颖的方面级情感分类模型结构,可有效地从不同视角建模方面词的情感表达以便于将意见词与其对应的方面词对齐,实现方面词情感极性的预测,解决了上述背景技术中提到的问题。

为实现上述目的,本发明提供如下技术方案:一种基于多视角相邻跨度增强的方面级情感分类方法,所述方面级情感分类方法具体步骤如下:

步骤S10:构造基于Bert的句子语义信息表示模型,建立以方面词为导向的上下文表示;

步骤S20:构造移动掩码机制,根据上下文单词与方面词的相对距离构造方面词的多个相邻跨度,生成多个相邻跨度增强的上下文表示;

步骤S30:提取每个相邻跨度增强上下文表示中分类符构造对应的全局表示,构造基于全局表示的多视角注意力机制,建立句子的多视角情感表示;

步骤S40:利用全局平均池化层结合多视角情感表示形成综合情感表示,实现句子情感极性的预测。

优选的,所述步骤S10的具体步骤如下:

步骤S101,句子原始表示为S={w

优选的,所述步骤S20的具体步骤如下:

步骤S201,构建多个内聚单元,称为相邻跨度,以对方面词之前和之后的单词和方面词本身进行建模,不同的相邻跨度包含围绕该方面词的不同范围的上下文单词,采用移动掩码机制,首先计算每个单词相对于方面词的相对距离d

其中,P

步骤S202,为了对上下文相邻单词的各种组成进行建模,基于跨度大小阈值L构建L+1个相邻跨度,其范围为从0到L。在大小为l∈[0,L]的跨度中,每个上下文单词的掩码向量

其中E∈R

其中掩码矩阵

步骤S203,相邻跨度增强表示

其中

优选的,所述步骤S30的具体步骤如下:

步骤S301,使用从

其中W

步骤S302,使用全局表示作为查询向量,相邻跨度增强

Q

其中,W

多头点积注意力机制计算如下:

其中

步骤S303,对每个注意力输出向量

其中,

优选的,所述步骤S40的具体步骤如下:

步骤S401,为了整合从相邻跨度的不同组成中获得的情感表示,使用全局平均池化层,该层有效地组合了多视角情感表示

y

其中

步骤402,综合情感表示y

其中

通过损失函数最小化训练整个网络,如下所示:

其中,

本发明的有益效果是:以需要进行情感分类的方面词及其上下文为研究对象,首先通过引入一个相邻跨度增强模块,用于突出关于方面词相邻单词的各种组合,以便于更灵活地捕捉方面词和相邻词之间的上下文关联;然后,构造了一个多视角注意力模块,利用全局表示来建立每个方面的多视角情感表示,这种平行的注意力机制提高了捕捉关于给定方面的相关意见词的准确性和全面性;最后,通过一个平均池化层聚合多视角情感表示,该层聚合了来自所有相邻跨度的信息形成给定方面的整体综合情感表示,实现情感极性的预测。

附图说明

图1为本发明方法步骤流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种技术方案:

本发明提供如下技术方案:一种基于多视角相邻跨度增强的方面级情感分类方法,所述方面级情感分类方法具体步骤如下:

步骤1:构造基于Bert的句子语义信息表示模型,建立以方面词为导向的上下文表示;

步骤1-1,句子原始表示为S={w

步骤2:构造移动掩码机制,根据上下文单词与方面词的相对距离构造方面词的多个相邻跨度,生成多个相邻跨度增强的上下文表示;

步骤2-1,构建多个内聚单元,称为相邻跨度,以对方面词之前和之后的单词和方面词本身进行建模,不同的相邻跨度包含围绕该方面词的不同范围的上下文单词。采用移动掩码机制,首先计算每个单词相对于方面词的相对距离d

其中,P

步骤2-2,为了对上下文相邻单词的各种组成进行建模,基于跨度大小阈值L构建L+1个相邻跨度,其范围为从0到L。在大小为l∈[0,L]的跨度中,每个上下文单词的掩码向量

其中E∈R

其中掩码矩阵

步骤2-3,相邻跨度增强表示

其中

步骤3:提取每个相邻跨度增强上下文表示中分类符构造对应的全局表示,构造基于全局表示的多视角注意力机制,建立句子的多视角情感表示;

步骤3-1,使用从

其中W

步骤3-2,使用全局表示作为查询向量,相邻跨度增强表示

Q

其中,W

多头点积注意力机制计算如下:

其中

步骤3-3,对每个注意力输出向量

其中,

步骤4:利用全局平均池化层结合多视角情感表示形成综合情感表示,实现句子情感极性的预测。

步骤4-1,为了整合从相邻跨度的不同组成中获得的情感表示,使用全局平均池化层,该层有效地组合了多视角情感表示

y

其中

步骤4-2,综合情感表示y

其中

通过损失函数最小化训练整个网络,如下所示:

其中,

一种基于多视角相邻跨度增强的方面级情感分类方法及系统,包含了一个以方面词为导向的编码器模块、一个相邻跨度增强模块、一个多视角注意力机制模块、一个情感极性预测模块,具体为:

根据输入句子和给定的方面词,构造基于Bert的句子语义信息表示模型,建立以方面词为导向的上下文表示,通过构造的移动掩码机制,根据上下文单词与方面词的相对距离构造方面词的多个相邻跨度,生成多个相邻跨度增强的上下文表示,提取每个相邻跨度增强上下文表示中分类符构造对应的全局表示,构造基于全局表示的多视角注意力机制,建立句子的多视角情感表示,利用全局平均池化层结合多视角情感表示形成综合情感表示,实现句子情感极性的预测;

本发明的方法及系统,以需要进行情感分类的方面词及其上下文为研究对象,首先通过引入一个相邻跨度增强模块,用于突出关于方面词相邻单词的各种组合,以便于更灵活地捕捉方面词和相邻词之间的上下文关联;然后,构造了一个多视角注意力模块,利用全局表示来建立每个方面的多视角情感表示,这种平行的注意力机制提高了捕捉关于给定方面的相关意见词的准确性和全面性;最后,通过一个平均池化层聚合多视角情感表示,该层聚合了来自所有相邻跨度的信息形成给定方面的整体综合情感表示,实现句子情感极性的预测。

尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于双记忆注意力的方面级别情感分类模型及方法
  • 基于依赖关系增强的图卷积方面级情感分类方法及系统
  • 基于增强语义句法信息的方面级情感分类方法
技术分类

06120116486244