掌桥专利:专业的专利平台
掌桥专利
首页

基于评论的评价方法及装置

文献发布时间:2023-06-19 10:00:31


基于评论的评价方法及装置

技术领域

本发明涉及大数据处理领域,尤其涉及一种基于评论的评价方法及装置。

背景技术

随着互联网的发展以及在线支付技术的普及,越来越多的人习惯通过手机APP、网站等在线方式预订酒店,并在入住酒店后留下自己对该酒店的评价,评价包括文本评论和评分数据,通过这些评价的反馈,酒店获知顾客的关注点,以此改善酒店运营,提高服务质量。

现有技术中对评价的处理,主要是预设点评关键词和对应的评分项,经顾客在线评价后,系统后台采集并分析每个关键词的打分得到,这种处理方式的点评关键词很少,比如只给出“卫生”、“环境”、“服务”、“设施”让顾客评分;同时对应的评分项也不多,比如给出“非常满意”、“满意”、“一般”、“不满意”。由于预设的点评关键词和对应的评分项过于简单,精度不足,导致无法精确获知顾客对酒店的针对性评价,从而不能有效改善酒店运营、精准提高服务质量。

因此,如何能够精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量是一个亟待解决的问题。

发明内容

本发明提供一种基于评论的评价方法,实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。

第一方面,本发明提供一种基于评论的评价方法,包括:

获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;

根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;

根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;

根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。

在一种可能的设计中,根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,包括:

根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;

将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;

根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;

根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;

根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。

在一种可能的设计中,根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果,包括:

根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;

根据重要度,降序排列评论数据,确定评价结果。

在一种可能的设计中,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。

在一种可能的设计中,获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据之后,还包括:

建立第一评论文本与第一评分数据之间的第一对应关系;

将第一对应关系存储在服务器的数据库中。

在一种可能的设计中,根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果之前,还包括:

根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;

将第二对应关系存储在数据库中。

在一种可能的设计中,目标对象为酒店。

第二方面,本发明还提供一种基于评论的评价装置,包括:

获取模块,用于获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;

第一确定模块,用于根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据的第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;

第二确定模块,用于根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。

在一种可能的设计中,第二确定模块,用于:

根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;

将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;

根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;

根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;

根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。

在一种可能的设计中,第二确定模块,具体用于:

根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;

根据重要度,降序排列评论数据,确定评价结果。

在一种可能的设计中,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。

在一种可能的设计中,获取模块,还用于:

建立第一评论文本与第一评分数据之间的第一对应关系;

将第一对应关系存储在服务器的数据库中。

在一种可能的设计中,第二确定模块,还用于:

根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;

将第二对应关系存储在数据库中。

在一种可能的设计中,目标对象为酒店。

第三方面,本发明还提供一种评价系统,包括:

处理器;以及,

存储器,用于存储处理器的可执行指令;

其中,处理器配置为经由执行可执行指令来执行第一方面中任意一种基于评论的评价方法。

第四方面,本发明实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意一种基于评论的评价方法。

本发明提供一种基于评论的评价方法及装置,通过获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,从而实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明根据一示例实施例示出的基于评论的评价方法的应用场景图;

图2为本发明根据一示例实施例示出的基于评论的评价方法的流程示意图;

图3为本发明根据一示例实施例示出的基于评论的评价方法的评论文本和评分数据对应示意图;

图4为本发明根据一示例实施例示出的基于评论的评价方法的评论文本预处理示意图;

图5为本发明根据一示例实施例示出的基于评论的评价方法的数据向量化示意图;

图6为本发明根据一示例实施例示出的基于评论的评价方法的评价结果示意图;

图7为本发明根据一示例实施例示出的基于评论的评价方法中整体流程示意图;

图8为本发明根据一示例实施例示出的基于评论的评价装置的结构示意图;

图9为本发明根据一示例实施例示出的评价系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面将结合附图,对本发明的实施例进行描述。

图1为本发明根据一示例实施例示出的基于评论的评价方法的应用场景图,如图1所示,包括获取信息101、文本处理102、决策树回归模型103以及评价结果104;具体的,获取信息101包括在系统平台上获取评论文本和评分数据,文本处理102包括文本预处理和数据向量化,在获取评论文本和评分数据后,对评论文本应用自然语言处理法进行移除标点符号、分词、去停用词、词干提取在内的预处理,得到预处理后的多个文本,对这些多个文本应用词频逆文本频率算法进行向量化操作,转化为计算机能够识别的、表达文本语义的向量数据;根据向量数据和评分数据,应用决策树回归模型进行训练及验证,得到评价结果。通过这种处理方式,挖掘评论的真实价值,实现精确获知顾客对酒店的针对性评价以有效改善酒店运营、精准提高服务质量。

图2为本发明根据一示例实施例示出的基于评论的评价方法的流程示意图;如图2所示,本实施例提供的基于评论的评价方法,包括:

步骤201、获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;

具体的,举例来说,图3为本发明根据一示例实施例示出的基于评论的评价方法的评论文本和评分数据对应示意图,如图3所示,第一条顾客评论“只有酒店外面的公园很漂亮;我很生气,使我在计划行程时可以在所有可能的网站上发布此帖子,因此没有人会犯错误地预定这个地方”等,这条评论对应的顾客评分为2.9分。

进一步具体的,建立第一评论文本与第一评分数据之间的第一对应关系;将第一对应关系存储在服务器的数据库中。举例来说,如图3所示,第一条顾客评论和对应的顾客评分为2.9分;第二条顾客评论和对应的顾客评分为7.5分;第三条顾客评论和对应的顾客评分为7.1分;第四条顾客评论和对应的顾客评分为3.8分;第五条顾客评论和对应的顾客评分为6.7分;第六条顾客评论和对应的顾客评分为6.7分;将这些顾客评论和对应的顾客评分一一对应,建立对应关系,并存储在服务器的数据库中。

进一步具体的,目标对象为酒店。这里针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据适用的场景包括:1)酒店、商场、博物馆等与人互动的场所;2)产品、服务等体验的效果;本发明实施例以酒店为例,其他情况不再赘述。

步骤202、根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;

具体的,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取;举例来说,图4为本发明根据一示例实施例示出的基于评论的评价方法的评论文本预处理示意图,如图4所示,对图3中的第一条顾客评论应用自然语言处理法进行预处理,确定得到的第二评论文本包括“公园、外部、酒店、漂亮、生气”等词语。

经过步骤201-202的处理得到的第二评论文本已能够完整、准确的体现出顾客评论的全部内容。由于第二评论文本的描述方式是文字的语言方式,为了能够更好地将这种语言方式与顾客评分的数据结合起来进行模型训练时,需要预先对第二评论文本进行转化,将文本数据转化成计算机能识别、表达文本语义的向量数据,具体处理过程如下所述。

步骤203、根据第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;

具体的,应用词频逆文本频率算法对第二评论文本进行向量化操作;图5为本发明根据一示例实施例示出的基于评论的评价方法的数据向量化示意图,如图5所示,对第二评论文本中的每个词语进行向量化处理,得到一串数字形式的向量数据,从而便于与顾客评分数据结合进行模型训练。

步骤204、根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。

具体的,根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;再将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;

根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。

举例来说,根据上述步骤201-203的方法,将所有用户的评论文本和评分数据转化成评论数据和评分数据的对应;再按照预设的比例X,比如X取值为60%,将所有用户中60%用户的评论数据和评分数据归类为训练数据集;剩下40%用户的评论数据和评分数据归类为验证数据集。对训练数据集应用决策树回归模型进行训练,确定第一模型参数;根据第一模型参数,将验证数据集的评论数据和评分数据输入至决策树回归模型进行验证,同时优化模型参数,确定第二模型参数,其中,将验证数据集在训练后的决策树回归模型中运行时,产生均方误差(Mean Squared Error,MSE),均方误差表示预测值与真实值间差异的均方值,越小越好;通过均方误差验证决策树回归模型的准确性,不断优化参数,并确定最终的第二模型参数。

进一步具体的,根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;将第二对应关系存储在数据库中。举例来说,所有用户的的评论文本与评分数据间有对应关系,这些对应关系存储在服务器的数据库中;在将所有用户的评论文本转化为评论数据后,为了能准确无误的对应评分数据,需要根据已存储的评论文本与评分数据间的对应关系、评论文本转化后的评论数据以及评分数据建立评论数据和评分数据间的对应关系,并存储在数据库中。

进一步具体的,根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;根据重要度,降序排列评论数据,确定评价结果。

举例来说,在确定第二模型参数后,输入所有用户的评论数据、评分数据至决策树回归模型中,得到的评论数据的重要度如图6所示,图6为本发明根据一示例实施例示出的基于评论的评价方法的评价结果示意图,图中根据重要度,降序排列评论数据依次为:脏、粗鲁、员工、小、嘈杂、旧、无等,剔除掉对评价无用的词汇:员工、无、房间,得到对该酒店最为重要的5个评价是:肮脏、粗鲁、小、吵杂、旧。

通过上述步骤201-204的方法处理得到的顾客对酒店的评价结果,图7为本发明根据一示例实施例示出的基于评论的评价方法中整体流程示意图,如图7所示,通过上述处理方法得到的评价结果能够真实地体现评论的价值,精确获知顾客对酒店的针对性关注点以有效改善酒店运营、精准提高服务质量。

图8为本发明根据一示例实施例示出的基于评论的评价装置的结构示意图。如图8所示,本实施例提供的基于评论的评价装置80,包括:

获取模块801,用于获取用户针对目标对象发布的第一评论文本以及与第一评论文本对应的第一评分数据;

第一确定模块802,用于根据第一评论文本,应用自然语言处理法进行预处理,确定第二评论文本;根据的第二评论文本,应用词频逆文本频率算法进行向量化处理,确定第一评论数据;

第二确定模块803,用于根据第一评论数据和第一评分数据,应用决策树回归模型,确定评价结果,其中,第一评论数据和第一评分数据对应。

在一种可能的设计中,第二确定模块803,用于:

根据第一评论数据和第一评分数据,确定所有用户的评论数据和评分数据;

将评论数据和评分数据按预设比例X划分归类为训练数据集和验证数据集,其中,训练数据集包括占比为X的评论数据和对应占比为X的评分数据;验证数据集包括占比为1-X的评论数据和对应占比为1-X的评分数据,X为大于0且小于1的小数;

根据训练数据集,应用决策树回归模型进行训练,确定第一模型参数;

根据验证数据集和第一模型参数,应用决策树回归模型进行参数优化,确定第二模型参数;

根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评价结果。

在一种可能的设计中,第二确定模块803,具体用于:

根据评论数据、评分数据以及第二模型参数,应用决策树回归模型,确定评论数据的重要度;

根据重要度,降序排列评论数据,确定评价结果。

在一种可能的设计中,自然语言处理法包括:移除标点符号、去除分词、去停用词以及词干提取。

在一种可能的设计中,获取模块801,还用于:

建立第一评论文本与第一评分数据之间的第一对应关系;

将第一对应关系存储在服务器的数据库中。

在一种可能的设计中,第二确定模块802,还用于:

根据第一对应关系、第一评论数据以及第一评分数据,建立第一评论数据与第一评分数据之间的第二对应关系;

将第二对应关系存储在数据库中。

在一种可能的设计中,目标对象为酒店。

图9为本发明根据一示例实施例示出的评价系统的结构示意图。如图9所示,本实施例提供的一种评价系统90,包括:

处理器901;以及,

存储器902,用于存储处理器的可执行指令,该存储器还可以是flash(闪存);

其中,处理器901配置为经由执行可执行指令来执行上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。

可选地,存储器902既可以是独立的,也可以跟处理器901集成在一起。

当存储器902是独立于处理器901之外的器件时,数据库90,还可以包括:

总线903,用于连接处理器901以及存储器902。

此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。

其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 基于商家评论的服务质量评价方法、装置、设备及介质
  • 一种基于评论数据的软件特征评价方法
技术分类

06120112379622