掌桥专利:专业的专利平台
掌桥专利
首页

情感分析方法及相关装置

文献发布时间:2023-06-19 19:28:50


情感分析方法及相关装置

技术领域

本申请涉及数据处理领域,具体而言,涉及一种情感分析方法及相关装置。

背景技术

循环神经网络作为一种时间循环神经网络,可用于分析待识别文本中蕴含的情感类型。

发明人研究发现,当前的循环神经网络在分析待识别文本时,未充分发掘待识别文本的上下文信息。

发明内容

为了克服现有技术中的至少一个不足,本申请提供一种情感分析方法及相关装置,包括:

第一方面,本申请实施例提供一种情感分析方法,应用于数据处理设备,所述数据处理设备配置有情感分析模型,所述情感分析模型包括循环神经网络以及为所述循环神经网络配置的交互单元,所述方法包括:

获取待识别文本的词向量序列,其中,所述词向量序列包括多个词向量;

按照序列顺序将所述多个词向量输入所述情感分析模型进行情感分析,获得所述待识别文本蕴含的情感类型;

其中,所述情感分析,包括:

针对所述词向量序列中的当前词向量,将所述当前词向量以及上一词向量的特征信息输入到所述交互单元,获得所述交互单元输出的增强特征,其中所述上一词向量的特征信息通过所述情感分析模型对所述上一词向量进行计算获得;

将所述增强特征输入所述循环神经网络,获得所述当前词向量的特征信息,其中,所述当前词向量的特征信息携带有所述待识别文本的情感信息。

第二方面,本申请实施例提供一种情感分析装置,应用于数据处理设备,所述数据处理设备配置有情感分析模型,所述情感分析模型包括循环神经网络以及为所述循环神经网络配置的交互单元,所述情感分析装置包括:

向量模块,用于获取待识别文本的词向量序列,其中,所述词向量序列包括多个词向量;

迭代模块,用于按照序列顺序将所述多个词向量输入所述情感分析模型进行情感分析,获得所述待识别文本蕴含的情感类型;

其中,分析模块用于实现所述情感分析的方式,包括:

针对所述词向量序列中的当前词向量,将所述当前词向量以及上一词向量的特征信息输入到所述交互单元,获得所述交互单元输出的增强特征,其中所述上一词向量的特征信息通过所述情感分析模型对所述上一词向量进行计算获得;

将所述增强特征输入所述循环神经网络,获得所述当前词向量的特征信息,其中,所述当前词向量的特征信息携带有所述待识别文本的情感信息。

第三方面,本申请实施例提供一种数据处理设备,所述数据处理设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述的情感分析方法。

第四方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的情感分析方法。

第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述的情感分析方法。

相对于现有技术而言,本申请具有以下有益效果:

本申请实施例提供的情感分析方法及相关装置中,数据处理设备配通过交互单元对当前词向量以及上一词向量的特征信息进行增强处理,获得所述增强特征,以达到充分发掘出其中可能蕴藏的上下文信息的目的;最后,将增强特征输入到循环神经网络进行进一步的分析;由于该增强特征携带有更多的关于待识别文本上下文特征的信息,因此,能够提高对待识别文本情感类型的识别精度。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的LSTM网络的示意图;

图2为本申请实施例提供的数据处理设备的结构示意图;

图3为本申请实施例提供的情感分析方法的流程示意图;

图4为本申请实施例提供的情感分析模型的数据流转示意图;

图5为本申请实施例提供的量子线路之间的数据流转示意图;

图6为本申请实施例提供的GRU网络的结构示意图;

图7为本申请实施例提供的增强型网络的结构示意图;

图8为本申请实施例提供的量子线路的结构示意图之一;

图9为本申请实施例提供的量子线路的结构示意图之二;

图10为本申请实施例提供的情感分析装置的结构示意图。

图标:120-存储器;130-处理器;140-通信单元;201-向量模块;202-迭代模块;203-分析模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。此外,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

发明人研究发现,使用循环神经网络分析待识别文本的相关技术中,未充分发掘待识别文本的上下文信息。例如,LSTM(Long Short-Term Memory,长短期记忆)网络作为一种循环神经网络,虽然实现了长短记忆功能,但发明人研究发现,当前的LSTM在分析待识别文本时,存在未充分发掘待识别文本的上下文信息的问题。

为便于本领域技术人员实施本方案,下面就以LSTM为例对相关技术中所存在的技术问题进行示例性介绍。如图1所示,LSTM网络中的数据流转关系可以表示为:

f

i

g

o

c

h

其中,待识别文本在输入到LSTM网络进行分析之前,需要先将其转化成LSTM模型能够处理的词向量序列,然后,按照序列顺序将多个词向量依次输入到LSTM网络中,式中的x

鉴于此,本实施例提供一种应用于数据处理设备的情感分析方法。该方法中,数据处理设备配置有情感分析模型,而该情感分析模型包括循环神经网络以及交互单元;并由交互单元对当前词向量以及上一词向量的特征信息进行增强处理,获得增强特征,最后,将增强特征输入到循环神经网络进行进一步的分析;以达到充分发掘出其中可能蕴藏的上下文信息的目的。

其中,在一些实施方式中,数据处理设可以是服务器,例如Web(网站)服务器、FTP(File Transfer Protocol,文件传输协议)服务器、数据处理服务器等。此外,该服务器可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器可以是分布式系统)。在一些实施例中,服务器相对于用户终端,可以是本地的、也可以是远程的。在一些实施例中,服务器可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(Community Cloud)、分布式云、跨云(Inter-Cloud)、多云(Multi-Cloud)等,或者它们的任意组合。在一些实施例中,服务器可以在具有一个或多个组件的电子设备上实现。

当然,在其他一些实施方式中,该数据处理设备还可以是用户终端,例如,移动终端、平板计算机、膝上型计算机、或机动车辆中的内置设备等,或其任意组合。在一些实施例中,移动终端可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,或其任意组合。在一些实施例中,智能家居设备可以包括智能照明设备、智能电器设备的控制设备、智能监控设备、智能电视、智能摄像机、或对讲机等,或其任意组合。在一些实施例中,可穿戴设备可包括智能手环、智能鞋带、智能玻璃、智能头盔、智能手表、智能服装、智能背包、智能配件等、或其任何组合。在一些实施例中,智能移动设备可以包括智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏设备、导航设备、或销售点(point of sale,POS)设备等,或其任意组合。

进一步地,本实施例还提供该数据处理设备的一种结构示意图。如图2所示,该数据处理设备包括存储器120、处理器130、通信单元140。

该存储器120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。

其中,该存储器120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器120用于存储程序,该处理器130在接收到执行指令后,执行该程序。

该通信单元140用于通过网络收发数据。网络可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(WideArea Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched Telephone Network,PSTN)、蓝牙网络、ZigBee网络、或近场通信(NearField Communication,NFC)网络等,或其任意组合。在一些实施例中,网络可以包括一个或多个网络接入点。例如,网络可以包括有线或无线网络接入点,例如基站和/或网络交换节点,服务请求处理系统的一个或多个组件可以通过该接入点连接到网络以交换数据和/或信息。

该处理器130可能是一种集成电路芯片,具有信号的处理能力,并且,该处理器可以包括一个或多个处理核(例如,单核处理器或多核处理器)。仅作为举例,上述处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、专用指令集处理器(Application SpecificInstruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital SignalProcessor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing,RISC)、或微处理器等,或其任意组合。

为了使得本领域技术人员能够使用本申请内容,下面就通过上述情感分析模型对待识别文本进行情感分析,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。如图3所示,该方法包括:

S101,获取待识别文本的词向量序列。

其中,词向量序列包括多个词向量。

S102,该数据处理设备按照序列顺序将多个词向量输入情感分析模型进行情感分析,获得待识别文本蕴含的情感类型;其中,该情感分析的方式,包括:

针对词向量序列中的当前词向量,将当前词向量以及上一词向量的特征信息输入到交互单元,获得交互单元输出的增强特征;将增强特征输入循环神经网络,获得当前词向量的特征信息。

其中,上一词向量的特征信息通过情感分析模型对上一词向量进行计算获得;当前词向量的特征信息携带有待识别文本的情感信息。

而应理解的是,相较于将当前词向量以及上一词向量的特征信息直接进行拼接的方式,本实施例中通过交互单元对当前词向量以及上一个词向量的特征信息进行特征发掘,使得增强特征携带有更多关于待识别文本上下文特征的信息。

示例性的,假定将待分析文本的词向量序列表示为X,则多个词向量可以表示为X=(x

该示例中,将情感分析模型沿时间序列展开,并且假定交互单元表示为f(h,x),循环神经网络表示为RNN,其展示效果如图4所示。如图4所示,该数据处理设备依据序列顺序选取x

然后,如图4所示,数据处理设备从X中选取x

其中,该情感类型可以包括积极、中立以及消极,当然,本领域技术人员可以根据需要进行适当的增加或者减少,本实施例不做具体的限定。

由此,本实施例提供的上述情感分析方法中,该据处理设备配通过交互单元对当前词向量以及上一词向量的特征信息进行增强处理,获得增强特征,以达到充分发掘出其中可能蕴藏的上下文信息的目的;最后,将增强特征输入到循环神经网络进行进一步的分析;由于该增强特征携带有更多的关于待识别文本上下文特征的信息,因此,能够提高对待识别文本情感类型的识别精度。

在一些实施方式中,该交互单元可以是特定的神经网络,用于对输入其中的当前词向量以及上一词向量的特征信息进行二次编码,以发掘其中蕴含的上下文特征,从而获得增强特征。

在其他一些实施方式中,该数据处理设备配置有量子线路,该数据处理设备通过该交互单元使用该量子线路对当前词向量以及上一词向量的特征信息进行二次编码,获得增强特征。

其中,该量子线路的数量为多个,增强特征包括第一增强特征和第二增强特征。一种可选地实施方式中,该循环神经网络可以是GRU(Gate Recurrent Unit)网络或者LSTM网络,下面以GRU网络为例,对交互单元使用该量子线路时的数据流转关系进行说明。如图5所示,VQC为本实施例中的量子线路;而交互单元使用该量子线路时的数据流转关系可以表示为:

x

h

式中,i∈[1,r],r表示二次编码的次数,VQC(W

继续参见图5,假定r的值为4,并且为了便于对二次编码过程进行描述,将每次从词向量序列中选取的当前词向量均表示为x

当r=1(基数)时,x

当r=2(偶数)时,h

当r=3(基数)时,x

当r=4(偶数)时,h

其中,h

另一种可选地实施方式中,该循环神经网络可以是基于GRU网络的增强型网络,其中,该增强型网络通过量子线路替换所述GRU网络中的全连接层获得,如此,使得该增强型网络进一步使用量子线路发掘蕴含在文本中的情感信息。

示例性的,该GRU网络的网络结构如图6所示,图中的FC表示全连接层。通过量子线路替换所述GRU网络中的全连接层,所获得的增强型网络的结构如图7所示,图中的VQC即为本实施中的量子线路。因此,如图7所示,增强型网络中的数据流转关系可以表示为:

z

r

g

h

值得说明的是,该量子线路可以是一种具有可迭代优化的参数的量子电路,并且每组词向量的向量维度与该电路所使用的量子位数保持一致。该量子线路包括数据编码层、变分层以及量子测量层,因此,通过量子线路对R

数据编码层用于将R

变分层用于对数据编码层的输出结果进行幺正操作;

量子测量层用于对变分层的输出结果进行测量,获得第二增强特征。

下面结合图8以及图9对上述数据编码层、变分层以及量子测量层各自的工作原理进行详细阐述,其中,图9为图8的细节示意图,图中的I(x)表示数据编码层,G(θ)表示变分层。

数据编码层:

应该理解的是,量子比特是量子计算和量子信息的基本概念,单量子比特的量子态可以表示为:

其中α和β是复数,且|α|

其中,

数据编码层则用于将待识别文本的词向量编码到量子态中,也就是将经典的输入向量转换为旋转角度,以指导单量子位元的旋转。

其中,每个词向量的向量维度与实际使用的量子位数保持一致。如图9所示,假定一汉字的词向量表示为[x

变分层:

继续参见图9,变分层中的θ

量子测量层:

VQC最后一层是量子测量层,用于测量每个量子位上的期望值。本实施例中使用QPanda实现描述的VQC层,因此,返回的结果的维度为设置的量子位数,也就是返回的结果是一个需要在经典计算机上进一步处理的固定长向量。

此外,为实现对使用了量子线路的情感分析模型进行训练,本实施例使用参数位移的方法进行优化,相应的表达式为:

式中,x是表示的输入词向量,

依据该表达式,在网络的训练中输入训练样本,将量子线路中待优化的参数向前位移

基于与情感分析方法相同的发明构思,本实施例还提供一种情感分析装置,应用于数据处理设备,数据处理设备配置有情感分析模型,情感分析模型包括循环神经网络以及为循环神经网络配置的交互单元。

其中,情感分析装置包括至少一个可以软件形式存储于存储器中的功能模块。如图10所示,从功能上划分,情感分析装置可以包括:

向量模块201,用于获取待识别文本的词向量序列,其中,词向量序列包括多个词向量。

本实施例中,该向量模块201用于实现图3中的步骤S101,关于该向量模块201的详细描述,可以参见步骤S101的详细描述。

迭代模块202,用于按照序列顺序将多个词向量输入情感分析模型进行情感分析,获得待识别文本蕴含的情感类型;

其中,分析模块203用于实现情感分析的方式,包括:

针对词向量序列中的当前词向量,将当前词向量以及上一词向量的特征信息输入到交互单元,获得交互单元输出的增强特征,其中上一词向量的特征信息通过情感分析模型对上一词向量进行计算获得;

将增强特征输入循环神经网络,获得当前词向量的特征信息,其中,当前词向量的特征信息携带有待识别文本的情感信息。

本实施例中,迭代模块202以及分析模块203用于实现图3中的步骤S102,关于迭代模块202以及分析模块203的详细描述,可以参见步骤S102的详细描述。

可选地,数据处理设备配置有量子线路,分析模块203获取增强特征的方式,包括:

通过交互单元使用量子线路对当前词向量以及上一词向量的特征信息进行二次编码,获得增强特征。

而应该理解的是,该情感分析装置还可以包括其他软件功能模块或者子模块,用于实现该情感分析方法的其他步骤或者子步骤;当然,上述向量模块201、迭代模块202以及分析模块203同样可以用于实现该情感分析方法的其他步骤或者子步骤,本领域技术人员可以基于不同的模块划分标准进行适当调整,本实施例不做具体的限定。

本申请实施例还提供一种数据处理设备,数据处理设备包括处理器以及存储器,存储器存储有计算机程序,计算机程序被处理器执行时,实现本申请实施例提供的情感分析方法。

本申请实施例还提供一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序被处理器执行时,实现本实施例提供的情感分析方法。

本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现本实施例提供的情感分析方法。

综上所述,本申请实施例提供的情感分析方法及相关装置中,数据处理设备配通过交互单元对当前词向量以及上一词向量的特征信息进行增强处理,获得增强特征,以达到充分发掘出其中可能蕴藏的上下文信息的目的;最后,将增强特征输入到循环神经网络进行进一步的分析;由于该增强特征携带有更多的关于待识别文本上下文特征的信息,因此,能够提高对待识别文本情感类型的识别精度。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

相关技术
  • 舆情评论信息的情感分析方法、装置及存储介质
  • 一种基于emoji的跨语言情感分析方法和装置
  • 一种基于情感分析的预警方法及装置
  • 新闻情感分析的方法、装置、计算机设备和存储介质
  • 一种电商评论情感分析降噪的方法和装置
  • 神经网络模型生成方法、文本情感分析方法、及相关装置
  • 一种基于情感分析的谣言检测方法、装置及相关介质
技术分类

06120115927749