掌桥专利:专业的专利平台
掌桥专利
首页

一种情感分析的装置和方法

文献发布时间:2023-06-19 13:26:15


一种情感分析的装置和方法

技术领域

本发明涉及自然语言处理领域,尤其涉及一种情感分析的装置和方法。

背景技术

随着网络技术的发展,越来越多的产品通过互联网进行销售,电商平台以及品牌方需要持续关注用户的评价,通过分析评价数据,抽取评价词的正负面,对产品和服务的反馈舆情进行挖掘,统计情感走势,以此为依据进一步对产品和服务进行改进。

目前现有的技术通常是采用两个模型,一个模型用于抽取产品名称,如药品、水杯,一个模型用于分析评价词的情感类型,在实际应用中,采用两个模型,存在重复建设、效率低下的缺陷,同时由于两个模型的输出数据相互独立,存在输出存在信息残缺不完整、缺乏关联性,数据利用率差的缺陷,例如一个句子中通过一个模型获得AB两个实体,通过另一个模型获得评价,但是不知道评价是对谁。

发明内容

本发明为解决现有技术中存在的上述缺陷,提出一种情感分析的装置和方法。

为了实现以上目的,本发明提出了一种情感分析的装置,包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:

特征抽取模块用以从输入的带标签的句子文本中抽取每个字的特征,得到句子特征向量集;

特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;

实体抽取网络模块用以根据实体识别特征集抽取实体词;

情感提取网络模块用以根据句子特征向量集得到情感词特征向量;;

特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征;

情感分类模块根据增强的情感特征输出情感类型。

进一步地,所述特征抽取模块采用Bert神经网络模型实现。

进一步地,所述特征优化模块采用双层LSTM神经网络模型实现。

进一步地,所述实体抽取网络模块包括分类器和抽取实体词模块,所述分类器用于得到实体词的位置,所述抽取实体词模块用于得到实体词的内容。

进一步的,所述实体抽取网络模块包括三个分类器,所述三个分类器分别用于抽取实体词的开始位置、中间位置和结束位置。

进一步的,所述情感提取网络模块包括动态特征加权模块、特征屏蔽模块和情感特征抽取模块,其中:

动态特征加权模块:用以根据离中心字特征向量的距离远近设置句子中每个字特征向量的权重,距离越远权重越小;

特征屏蔽模块:用以对距离中心字特征向量的值大于阈值的字进行屏蔽处理;

情感特征抽取模块:用以从处理过的句子特征向量集中抽取情感词特征向量。

进一步的,所述阈值是5个字长。

进一步的,所述情感特征抽取模块采用三层神经网络。

本发明还公开一种情感分析的方法,包括:

情感分析的装置读入有标签的句子;

对有标签的句子进行特征抽取,获取句子特征向量集;

将字特征向量进行优化处理,获得实体识别特征集;

从实体识别特征集中得到实体词的位置,进一步得到实体词;

从句子特征向量集中得到情感词特征向量;

将实体识别特征集和情感词特征向量进行拼接,得到增强的情感特征;

对增强的情感特征进行分类,得到情感类型;

所述的情感分析的装置为上述任一项所述的情感分析的装置。

本发明还公开一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行所述情感分析的方法。

本发明还公开一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行所述情感分析的方法。

本发明公开的方法和系统中所述模块,在实际应用中,即可以在一台目标服务器上部署多个模块,也可以每一模块独立部署在不同的目标服务器上,特别的,根据需要,为了提供更强大的计算处理能力,也可以根据需要将模块部署到集群目标服务器上。

由此可见,本发明的情感分析的装置通过一个模型同时实现了实体的识别和情感分析和分类的功能,节约了资源,提高了效率,并且,同一个模型输出的结果可以获得有关联性的输出,信息更加完整,数据利用率高。

为了对本发明有更清楚全面的了解,下面结合附图,对本发明的具体实施方式进行详细描述。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例的一种情感分析的装置的结构示意图。

图2为本申请实施例的一种实体抽取网络模块的具体实施结构示意图。

图3为本申请实施例的一种情感提取网络模块的具体实施结构示意图。

其中:特征抽取模块1、特征优化模块2、实体抽取网络模块3、情感提取网络模块4、特征融合模块5、情感分类模块6。

具体实施方式

请参阅图1,图1示出了一种情感分析的装置的结构示意图。

本申请提出一种新型的情感分析的装置,读入有标签句子,获取句子中每个字的特征向量,然后分别经过特征优化处理和特征融合处理,再通过实体抽取网络模块得到实体词,通过情感分类模块得到情感的分类。

作为一种实施方式,本申请实施例的情感分析的装置包括特征抽取模块、特征优化模块、实体抽取网络模块、情感提取网络模块、特征融合模块、情感分类模块,其中:

特征抽取模块用以从输入的带标签的句子文本中抽取每个字的特征,得到句子特征向量集;

特征优化模块用以对句子特征向量集进行处理,获得实体识别特征集;

实体抽取网络模块用以根据实体识别特征集抽取实体词;

情感提取网络模块用以根据句子特征向量集得到情感词特征向量;

特征融合模块将实体特征集和情感词特征向量进行拼接,得到增强的情感特征;

情感分类模块根据增强的情感特征输出情感类型。

作为一种举例,输入的句子:“A品牌的电脑质量很好,但是手机质量很差”,数据的处理过程如下:

1、先标注句子中的实体和情感面:(电脑质量,很好),(手机质量,很差),得到带标签的数据;

2、把此句子放入特征抽取模块抽取每个字的特征,得到句子特征向量集。

3、将句子特征向量集分别送入特征优化模块和情感提取网络模块,用于获得实体词和情感分类。

作为一种优选的实施方式,本申请实施例中所述的抽取模块采用Bert神经网络模型实现。

作为一种优选的实施方式,本申请实施例中所述的特征优化模块采用双层LSTM神经网络模型实现。

请参阅图2,图2示出了一种实体抽取网络模块的具体实施结构示意图。

作为一种实施方式,本申请实施例包括分类器201和抽取实体词模块202,所述分类器201用于得到实体词的位置,所述取实体词模块202用于得到实体词的内容。

作为一种优选的实施方式,本申请实施例中分类器的数量为3个,分别是第一分类器2011,第二分类器2022,第三分类器2023,所述三个分类器分别用于获取实体词的开始位置、中间位置和结束位置。

作为一种举例,如:“A品牌的电脑质量很好,但是手机质量很差。”,其中“电脑质量”和“手机质量”为实体词,那么实体词的开始位置、中间位置和结束位置分别表示为:

[0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0]

[0,0,0,0,0,1,1,0,0,0,0,0,0,0,1,1,0,0,0,0]

[0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0]

请参阅图3,图3示出了一种情感提取网络模块的具体实施结构示意图。

作为一种实施方式,本申请实施例中情感提取网络模块包括动态特征加权模块401、特征屏蔽模块402和情感特征抽取模块403,其中:

动态特征加权模块401:用以根据离中心字特征向量的距离远近设置句子中每个字特征向量的权重,距离越远权重越小;

特征屏蔽模块402:用以对距离中心字特征向量的值大于阈值的字进行屏蔽处理;

情感特征抽取模块403:用以从处理过的句子特征向量集中抽取情感词特征向量。

作为一种优选的实施方式,本申请实施例中所述的所述阈值是5个字长。

作为一种优选的实施方式,本申请实施例中所述的所述情感特征抽取模块采用三层神经网络。

基于上述实施例的情感分析的装置,本申请还公开情感分析的方法,其步骤包括:

情感分析的装置读入有标签的句子;

对有标签的句子进行特征抽取,获取句子特征向量集;

将字特征向量进行优化处理,获得实体识别特征集;

从实体识别特征集中得到实体词的位置,进一步得到实体词;

从句子特征向量集中得到情感词特征向量;

将实体识别特征集和情感词特征向量进行拼接,得到增强的情感特征;

对增强的情感特征进行分类,得到情感类型;

所述的情感分析的装置为上述任意一种实施例的情感分析的装置。

本申请还提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述实施例所述的方法。

本申请还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述实施例所述的方法。

需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述存储介质可以包括但不限于:只读存储器(ROM,ReadOnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁盘或光盘等。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的条件下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 情感分析模型的训练方法、情感分析方法、装置和设备
  • 文本情感分析方法、情感分析模型训练方法、装置、设备及介质
技术分类

06120113678364