掌桥专利:专业的专利平台
掌桥专利
首页

基于多模态用户生成内容的酒店品牌形象智能测量方法

文献发布时间:2024-04-18 20:01:23


基于多模态用户生成内容的酒店品牌形象智能测量方法

技术领域

本发明属于文本信息挖掘领域和图像处理领域,具体涉及一种基于多模态用户生成内容的酒店品牌形象智能测量方法,可用于从在线评论文本和图片中提取酒店品牌形象。

背景技术

酒店品牌形象(hotel brand image,HBI),即消费者对某个品牌的整体感知,对于旨在动态市场中寻求竞争优势的酒店管理者而言至关重要。有文献指出酒店品牌形象对消费者的感知价值、好感度、忠诚度、以及消费者决策存在重要影响;因此,了解酒店品牌在消费者心中的形象,有助于管理者明确消费者对酒店的态度和定位,从而为后续营销战略的制定提供有用的信息。为了测量消费者对酒店品牌形象的感知,一些文献采取了调查问卷、结构化访谈等基于调查的方法,为酒店品牌形象的相关研究提供了基于个人深度报告的丰富洞察。然而这些方法往往受限于样本大小,测量出的结果缺乏普适性。

受益于移动设备的飞速发展和Web 2.0的技术优势,越来越多的消费者倾向于在社交媒体平台上以数字评分、文字、图片、视频等形式分享他们对品牌的认知和体验。这些海量的信息也被称为用户生成内容,直接反映了消费者对酒店品牌的真实看法和偏好,具有实时性、高频性和易于传播等特点,对于酒店品牌的相关研究具有重要价值。对此,有文献使用在线平台的海量话题标签、在线评论这类文本数据来揭示品牌联想、品牌定位、竞争模式等内容。也有文献利用深度卷积神经网络模型,提出了一种通过深度分析用户生成图片来量化消费者品牌感知的方法。但目前的研究使用的数据模态较为单一,且没有研究针对酒店这类体验品,只使用单一模态的数据无法全面地构建动态、多样的酒店品牌形象的复杂结构。

发明内容

为了解决上述存在的问题,本发明提出:一种基于多模态用户生成内容的酒店品牌形象智能测量方法,包括以下步骤:

S11、提取酒店品牌形象的图片主题;

S12、提取酒店品牌形象的文本主题;

S21、测量图片主题的好感度;

S22、测量文本主题的好感度;

S23、将图片和文本主题的好感度合并为主题好感度;

S31、测量主题强度;

S41、构造酒店品牌形象。

进一步地,所述步骤S11中,提取图片主题包括如下步骤:

①根据酒店官方相册确定主题;

②为每个主题构建情感词典:1)利用DeepSentiBank解析图片获取形容词-名词对(Adjective-Noun Pairs,ANPs)及其响应值;2)设置响应值阈值以保留ANPs响应值较高的名词,并将其添加到相应的主题词典中;3)统计词典中的词频,并设置阈值去除低频词后得到每个主题的词典;4)对于每个主题词典,使用用户生成的图片进行调整;

③基于构建好的主题词典,根据ANPs的响应值计算每张图片与每个主题之间的匹配概率,并将图片分配给概率最高的主题;

进一步地,所述步骤S12中,提取文本主题包括如下步骤:

①利用BIOES标注模式标注情感三元组<属性词,情感词,修饰词>;

②利用双向长短时记忆网络-条件随机场模型(Bi-LSTM-CRF)提取情感三元组;

③根据从S11中得到的主题设置初始中心词,使用嵌入Word2Vec模型的K-means聚类算法对情感三元组中的属性词进行聚类;

④对于未被主题词覆盖的属性词进行人工分类,并拟定主题。

进一步地,所述步骤S21中,需利用与好感度密切相关的情感值来测量评论图片主题好感度,步骤如下:

①保留每张图片响应值最高的4个ANPs,并对其响应值进行如下指数变换,其中r

②使用SentiWordNet计算第j个ANP中形容词和名词的情感值:

③使用加权和模型(weighted sum model,WSM)计算第i张照片的情感值:

进一步地,所述步骤S22中,测量评论文本主题的好感度时使用情感三元组<属性词,情感词,修饰词>中情感词的情感极性及其相应修饰语的权重计算属性词的情感。具体包括如下步骤:

①利用BiLSTM-CRF对情感三元组<属性词,情感词,修饰词>中情感词的极性和修饰词的程度赋值;

②计算属性词的情感:1)若情感词-修饰词的组合为“ne+dg”,其中ne表示否定副词,dg表示程度副词,那么情感三元组的情感值S按如下公式计算,其中|ne|表示情感三元组中否定副词的数量;W

2)若情感词-修饰语的组合为“dg+ne”,则情感三元组的情绪值S按如下公式计算:

S=(-1)

进一步地,所述步骤S23中,计算主题好感度包括如下步骤:

①分别计算每个主题下的图片情感值总和和文本情感值总和;

②将图片情感值总和与文本情感值总和相加后除以该主题下的图片数量与评论情感三元组数量之和,得到该主题的平均情感值,即主题好感度,公式如下,其中φ

进一步地,所述步骤S31中,利用与强度密切相关的图片频率和单词频率分别测量图片和文本的主题强度,包括如下步骤:

分别统计每个主题下的图片数量f

进一步地,所述步骤S41中,将每个主题对应的好感度和强度相乘后求并,所得酒店品牌形象如下,其中Φ

HBI≡Φ

本发明的有益效果为:本发明结合酒店评论中的文字和图像数据来量化酒店品牌形象,实现不同模态数据之间的信息互补,有利于对顾客偏好和情感进行全局把握。基于此,本发明利用多模态用户生成内容提出一个酒店品牌形象的测量方法。本发明基于在线评论文本和在线评论图片,利用自然语言处理技术和图片处理技术识别这两类数据中消费者更关注的酒店主题,作为酒店品牌形象的不同方面。本发明根据品牌联想的三个维度,基于品牌联想具有好感度、强度和独特性三个方面测量酒店品牌形象,其中:好感度代表消费者因酒店提供的属性和利益而形成的积极或消极的态度;强度反映了品牌相关记忆的强度;独特性则指该品牌与其他品牌的差异。对此,本发明通过计算每个酒店主题的情感来衡量好感度;计算其在文本和图片中出现的频率来衡量记忆强度。最后,通过将每个主题的好感度和强度相乘并求并,即得到了所测量的酒店品牌形象。

附图说明

图1为本发明基于多模态用户生成内容的酒店品牌形象测量流程图。

图2为本发明基于多模态用户生成内容的酒店品牌形象测量框架图。

图3为将本发明提出的酒店品牌形象测量框架图应用于3个酒店品牌后测量出的3种酒店品牌形象。

图4为从时间角度监测酒店品牌形象的测量结果。

图5为从旅客群体角度监测酒店品牌形象的测量结果。

具体实施方式

实施例1

为使本发明采用的技术手段和达成目的易于明白了解,下面结合具体实施方式,进一步阐述本发明,一种基于多模态用户生成内容的酒店品牌形象智能测量方法,包括如下步骤:

S1、提取酒店品牌形象的主题;

S2、测量主题好感度;

S3、测量主题强度;

S4、构造酒店品牌形象。

通过四个步骤来实现基于多模态用户生成内容的酒店品牌形象测量:

本发明首先收集了2017年8月26日至2020年10月26日期间,某地区3个高端酒店品牌(A、B和C)共16家酒店的所有在线评论数据,包括41,287条评论。数据清洗后,得到共26,834条评论的图片和文本用于提取酒店品牌形象的主题。针对图片主题,本发明利用DeepSentiBank对图片数据进行解析并获取图片主题。针对文本主题,本发明利用Bi-LSTM-CRF识别文本中的情感三元组,进一步利用嵌入Word2Vec模型的K-means聚类算法分析情感三元组并提取文本主题。

其次,测量主题好感度,该步骤同时考虑了用户发布的评论文本和图片数据,分别计算了文本和图片的情感。

然后,测量主题强度,该步骤同时考虑了用户发布的评论文本和图片数据,通过计算不同模态数据中主题出现的频率,分别得到了文本和图片的主题强度。

最后,构造酒店品牌形象。通过同时考虑酒店主题以及主题的好感度和强度,实现对酒店品牌形象的测量。

所述步骤S1中,提取酒店品牌形象的图片主题和文本主题包括如下步骤:

S11、提取图片主题;

S12、提取文本主题;

所述步骤S2中,测量主题好感度包括如下步骤:

S21、测量图片主题的好感度;

S22、测量文本主题的好感度;

S23、将图片和文本主题的好感度合并为主题好感度。

(1)图片和文本主题的提取阶段

①图片的主题提取

图片主题提取共分为三个模块:主题确定模块,主题词典构建模块以及图片-主题分配模块。主题的确定参考了酒店官方相册和相关文献,将图片主题确定为浴室、房间、环境、公共区域和食物。主题词典构建模块,在确定的主题下分别收集100张酒店官方相册的图片,利用DeepSentiBank对这些图片进行解析,每张图片都得到2089个ANPs及其响应值(较高的响应值代表其能更准确地表达图像内容)并设置响应值阈值保留较高响应值的ANPs。保留ANPs中的名词部分,并将其添加到相应主题的字典中。统计词典中的词频,去除低频词后,得到浴室、房间、环境、公共区域和食物5个主题的词典。对于每个主题,使用100张图片进行训练。图片-主题分配模块,本发明基于构建好的主题词典,根据ANPs的响应值计算图片与每个主题之间的匹配概率,并将图片分配给概率最高的主题。

②文本的主题提取

文本主题提取分为三个模块:情感三元组标注模块,情感三元组抽取模块和文本聚类模块。情感三元组标注模块利用BIOES标注模式将评论文本分别标注成三种实体,分别为属性词、情感词和修饰词,即情感三元组。情感三元组抽取模块利用Bi-LSTM-CRF实现对情感三元组<属性词,情感词,修饰词>的提取。文本聚类模块根据图片主题提取阶段获得的浴室、房间、环境、公共区域和食物这5个主题,通过使用嵌入Word2Vec模型的K-means算法对提取出的属性词进行聚类。由于5个主题未能覆盖所有的属性词,本发明对剩余的属性词进行了人工检查,并将其归纳为价格与服务。因此,本发明提取出的酒店主题分别为:食物、浴室、环境、房间、公共区域、价格和服务。

(2)主题好感度的测量阶段

本发明分别计算文本主题和图片主题的情感值并将其作为主题好感度。主题好感度测量分为三个模块:图片情感计算模块,文本情感计算模块和主题情感计算模块。

①图片情感计算模块

根据由DeepSentiBank解析得到的图片ANPs的响应值,保留每张图片响应值最高的前四个ANPs,并对响应值进行如下指数变换,其中r

接着,使用SentiWordNet计算第j个ANP中形容词和名词的情感值:

最后,使用加权和模型来计算第i张图片的情感s′

②文本情感计算模块

文本的情感计算模块使用情感三元组<属性词,情感词,修饰词>中情感词的情感极性及其相应修饰语的权重计算属性词的情感。本发明利用BiLSTM-CRF对情感词极性和修饰词程度赋值。对于属性词情感的计算:若句中情感词-修饰词的组合为“ne+dg”,ne表示否定副词,dg表示程度副词,那么情感三元组的情感值S按下公式计算:

若句中情感词-修饰词的组合为“dg+ne”,则情感三元组的情绪值S按下公式计算:

S=(-1)

其中|ne|表示情感三元组中否定副词的数量;W

③主题情感计算模块

计算每个主题下的图片情感值总和

(3)主题强度的测量阶段

主题强度由数据中出现的主题频率衡量。评论中每出现属于某一主题的图片或情感三元组,该主题的强度就增加1。统计每个主题下的图片数量f

(4)酒店品牌形象的构造阶段

酒店品牌形象的构造阶段根据图片和文本主题的提取阶段获得的7个主题:食物、浴室、环境、房间、公共区域、价格和服务,主题好感度测量阶段获得的主题好感度以及主题强度测量阶段获得的主题强度,构建酒店品牌形象的测量框架如图2所示。根据上述数据,依下式分别构建3家酒店的品牌形象:

HBI=Φ

其中,Φ表示主题好感度,λ表示主题强度;F、B、E、R、A、P、S分别对应7个主题:食物、浴室、环境、房间、公共区域、价格和服务;∪表示并集。

经测量,得出三个酒店品牌的品牌形象如图3所示。

实施例2

一种基于多模态用户生成内容的酒店品牌形象智能测量方法,如图2和公式(8)所示,能分别从时间和旅客群体的角度实现对酒店品牌形象的实时监测。

为实现从时间角度监测酒店品牌形象,将所获数据按春(3-5月)、夏(6-8月)、秋(9-11月)、冬(12-2月)四季划分,然后按酒店品牌形象的四个计算阶段,分别计算每年4个季节的酒店品牌形象。

为实现从旅客群体角度监测酒店品牌形象,将所获数据根据旅客类型划分为:商务旅客,家庭旅客,个人旅客,朋友旅客以及情侣旅客。然后按酒店品牌形象的四个计算阶段,分别计算每年4个季节的酒店品牌形象。

第一阶段分别从图片和文本中提取主题。对于图片主题,根据确定好的酒店主题,利用DeepSentiBank对各个主题下图片解析得到ANPs及其响应值。然后利用构建好的主题词典,根据ANPs的响应值计算图片与每个主题之间的匹配概率,并将图片分配给概率最高的主题。对于文本主题,利用Bi-LSTM-CRF实现对情感三元组<属性词,情感词,修饰词>的提取,然后根据确定好的酒店主题,使用嵌入Word2Vec模型的K-means算法对提取出的属性词进行聚类。

第二阶段分别计算图片主题和文本主题的好感度。使用情感代替主题的好感度。对于图片主题的情感,利用由DeepSentiBank解析得到的图片ANPs的响应值、SentiWordNet以及加权和模型按照公式(1),(2)和(3)计算图片主题的情感。对于文本主题的情感,利用BiLSTM-CRF对情感三元组的情感词极性和修饰词程度赋值,并根据公式(4)和(5)计算情感三元组的情感值。最后,将计算出的图片主题情感和文本主题情感代入公式(6),得到主题好感度。

第三阶段分别计算图片主题和文本主题的强度。使用主题出现的频率代替主题强度。统计每个主题下的图片数量和评论情感三元组数量,根据公式(7),得到主题强度。

第四阶段计算每个季度的酒店品牌形象。将计算出的主题好感度和主题强度代入公式(8),得到相应时间段的酒店品牌形象。

从时间角度监测酒店品牌形象的测量结果如图4所示。

从旅客群体角度监测酒店品牌形象的测量结果如图5所示。

实施例3

一种基于多模态用户生成内容的酒店品牌形象智能测量方法,如图2和公式(8)所示,能用于酒店销量预测。

使用GRU(Gate Recurrent Unit)作为预测算法,对A、B、C3个酒店品牌的酒店销量进行预测。GRU由重置门r

z

r

采用评论数量代替实际销售数量,然后并构建基线模型1,其输入变量为平均评分,平均图片数量,平均文本长度。在模型1的基础上增加输入变量酒店品牌形象,即计算出的7主题的值,构建模型2。在模型1的基础上增加输入变量主题强度,构建模型3。在模型1的基础上增加输入变量主题好感度,构建模型4。采用如下表1所示的5个指标以及模型损失值对预测结果进行评估,所得预测结果如表2所示。

表1评估指标

表2预测结果

根据表2,在基线模型1中加入酒店品牌形象后,大部分预测指标值相对于模型1都有所下降。具体而言,与模型1相比,Loss、MAE、MAPE、RMSE、RMSRE和MASE这些指标的值分别下降了1.25%、3.01%、7.07%、1.68%、7.06%和4.64%。这些下降趋势表明,加入酒店品牌形象后,预测精度有所提高。从表2中还可以看出,模型2的预测结果优于模型3和模型4。因此,可以得出结论,单独增加酒店品牌形象对预测酒店需求的效果优于单独添加强度或好感度的效果。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

技术分类

06120116551916