掌桥专利:专业的专利平台
掌桥专利
首页

酒店推荐方法、系统、设备及存储介质

文献发布时间:2023-06-19 11:44:10


酒店推荐方法、系统、设备及存储介质

技术领域

本发明涉及计算机技术领域,具体地说,涉及一种酒店推荐方法、系统、设备及存储介质。

背景技术

现有的商品推荐系统通常依赖于用户对项目的历史评分记录来预测新的商品的打分,从而实现商品推荐。但是针对一些商品,如酒店、餐馆等,用户只有对商品的文字点评记录,没有打分的情况,现有技术则没有较好的办法进行处理,实现为用户推荐合适的酒店。

发明内容

针对现有技术中的问题,本发明的目的在于提供一种酒店推荐方法、系统、设备及存储介质,解决现有技术无法利用酒店的文字点评记录,为用户推荐合适酒店的问题。

为实现上述目的,本发明提供了一种酒店推荐方法,所述方法包括以下步骤:

S110,获取多个酒店各自对应的所有文本评价数据;

S120,对所述文本评价数据进行语句切分,提取出目标语句;每个所述目标语句中包含有评价项目和对应的评价关键词;

S130,建立评价关键词和第一评分相关联的第一映射表;

S140,获取所述目标语句中的评价项目和对应的评价关键词,依据所述评价关键词和所述第一映射表,得到每个评价项目对应的第一评分;

S150,根据每个所述目标语句的评价项目对应的第一评分,获得各个酒店对应的总评分;对酒店按照总评分从高到低的顺序排序,并将总评分最高的酒店推荐给用户。

可选地,所述方法还包括步骤:

S160,当总评分最高的有多个酒店时,将所述多个酒店作为待筛选酒店,并获取用户在历史酒店预订订单中的历史文本点评数据;

S170,自用户的所述历史文本点评数据中提取出出现次数最多的评价项目,作为参考项目;

S180,获取所述待筛选酒店在所述参考项目上的第三评分,将所述待筛选酒店中第三评分最高的酒店推荐给用户。

可选地,每一所述评价关键词归属于一评价类别,所述评价类别为正面或负面;在所述第一映射表中,评价关键词、所述评价类别与所述第一评分相关联;

所述步骤S180包括:

自所述待筛选酒店中筛除参考项目对应的评价类别包含有负面的酒店,被保留的待筛选酒店作为备选酒店;

获取所述备选酒店在所述参考项目上的第三评分,将所述待筛选酒店中第三评分最高的酒店推荐给用户。

可选地,所述步骤S120包括:

S121,依据标点符号对所述文本评价数据进行语句切分,得到初始语句库;

S123,仅保留所述初始语句库中包含评价项目和对应的评价关键词的语句,作为目标语句。

可选地,在所述第一映射表中,评价关键词对应的评价类别为负面时,所述评价关键词对应的第一评分为负数;评价关键词对应的评价类别为正面时,所述评价关键词对应的第一评分为正数。

可选地,所述步骤S121和步骤S123之间还包括步骤:

S122,对所述初始语句库中的语句进行预处理,将完成预处理之后的语句作为训练好的深度学习模型的输入,得到各个语句中包含的评价项目和/或对应的评价关键词。

可选地,所述步骤S110包括:

通过爬虫抓取多个酒店各自对应的所有文本评价数据。

本发明还提供了一种酒店推荐系统,用于实现上述酒店推荐方法,所述系统包括:

评价文本获取模块,用于获取多个酒店各自对应的所有文本评价数据;

目标语句提取模块,用于对所述文本评价数据进行语句切分,提取出目标语句;每个所述目标语句中包含有评价项目和对应的评价关键词;

映射表建立模块,用于建立评价关键词和第一评分相关联的第一映射表;

第一评分获取模块,用于获取所述目标语句中的评价项目和对应的评价关键词,依据所述评价关键词和所述第一映射表,得到每个评价项目对应的第一评分;

总评推荐模块,用于根据每个所述目标语句的评价项目对应的第一评分,获得各个酒店对应的总评分;对酒店按照总评分从高到低的顺序排序,并将总评分最高的酒店推荐给用户。

本发明还提供了一种酒店推荐设备,包括:

处理器;

存储器,其中存储有所述处理器的可执行指令;

其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项酒店推荐方法的步骤。

本发明还提供了一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现上述任意一项酒店推荐方法的步骤。

本发明与现有技术相比,具有以下优点及突出性效果:

本发明提供的酒店推荐方法、系统、设备及存储介质能够根据酒店的文本评价数据,并且仅保留完整包含评价项目和评价关键词的评价语句,进行分析转化成各个酒店对应的总评分,实现能够基于网络文字评论,转换成酒店的评分进行推荐,有利于提升酒店推荐效果,也提升了用户体验。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。

图1为本发明一实施例公开的一种酒店推荐方法的示意图;

图2为本发明另一实施例公开的一种酒店推荐方法的示意图;

图3为本发明一实施例公开的一种酒店推荐系统的结构示意图;

图4为本发明一实施例公开的一种酒店推荐设备的结构示意图;

图5为本发明一实施例公开的一种计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。

如图1所示,本发明一实施例公开了一种酒店推荐方法,该方法包括以下步骤:

S110,获取多个酒店各自对应的所有文本评价数据。具体来说,该步骤可通过现有技术中的爬虫技术来抓取多个酒店各自对应的文本评价数据。每一个酒店对应的文本评价数据即为使用过该酒店的所有用户对该酒店的文字点评记录。

S120,对上述文本评价数据进行语句切分,提取出目标语句。每个上述目标语句中包含有评价项目和对应的评价关键词。具体来说,步骤S120包括:

S121,依据标点符号对上述文本评价数据进行语句切分,得到初始语句库。比如,用户的一条文本评价数据为:“位置在城北门一二百米处,旅馆隔音很差很差很差,其他都还好”。由于该条数据中有两个标点符号,所以该条文本评价数据可以切分为三条语句:“位置在城北门一二百米处”、“旅馆隔音很差很差很差”、“其他都还好”。对所有酒店对应的文本评价数据切分后得到的所有语句就构成了上述初始语句库。

S122,对所述初始语句库中的语句进行预处理,将完成预处理之后的语句作为训练好的深度学习模型的输入,得到各个语句中包含的评价项目和/或对应的评价关键词。上述预处理可以包括有去重、去掉垃圾评论和词性标注以及中文分词等。因为获取到的文本评价数据中可能会出现一些垃圾评论、重复语句、水军评论和跟酒店无关的评论。进行预处理之后有利于提高算法推荐的准确率。该步骤利用现有技术即可实现,本申请不再赘述。上述深度学习模型可以为现有技术中的卷积神经网络模型等。

关于酒店的文本评价数据通常包含酒店的评价项目和/或对应的评价关键词。酒店的评价项目就是涉及酒店的具体各个方面,比如酒店的地理位置、环境、设施、价格和卫生状况等。评价关键词就是文本评价数据中用来修饰评价项目的词语,包含了评论人即用户对酒店某一个特征的情感倾向。例如上述文本评价数据“旅馆隔音很差很差很差”中,“旅馆隔音”是评价项目,“很差很差很差”代表评价关键词,这就说明写评论的人对于酒店的价格是持有好感的。根据这一关系,根据上述深度学习模型,即可抽取出评价项目和评价关键词。

S123,仅保留上述初始语句库中包含评价项目和对应的评价关键词的语句,作为目标语句。具体来说,初始语句库中有的语句仅能提取出评价项目,比如文本评价语句“位置在城北门一二百米处”对应的评价项目就是“地理位置”,但是由于评论人并未表示该位置属于远还是近,所以该语句提取不出评价关键词,无法判定评论人的情感倾向属于正面还是负面。有的语句比如“旅馆隔音很差很差很差”,既能提取出评价项目,也能提取出评价关键词。有的语句比如“其他都还好”,仅能提取出评价关键词“还好”,并不能提取出评价项目。

所以,本实施例不是将所有语句都保留下来,而是仅保留具有完整的评价项目和评价关键词的语句,能够尽可能避免部分评价关键词无法匹配评价项目,或者匹配出现错误的问题。这样可以有利于提高后续在目标语句中定位评价项目和对应评价关键词的准确性,进而有利于提升后续算法的推荐效果。

S130,建立评价关键词和第一评分相关联的第一映射表。具体而言,每一上述评价关键词归属于一评价类别。上述评价类别为正面或负面。在上述第一映射表中,评价关键词、上述评价类别与上述第一评分相关联。比如,评价关键词“很新”、“好”、“不错”等归属的评价类别为正面。评价关键词“很差”、“不好”、“很差很差”等归属的评价类别为负面。

在上述第一映射表中,评价关键词对应的评价类别为负面时,上述评价关键词对应的第一评分为负数。评价关键词对应的评价类别为正面时,上述评价关键词对应的第一评分为正数。这样可以避免有的酒店的文本评价数据中存在对某些评价项目的评价数据,而有些酒店的文本评价数据中不存在对这些评价项目的评价数据。比如,有的酒店存在对卫生状况项目的评价且评价为负面的,比如说很差等;有的酒店不存在对卫生状况项目的评价,如果对评价为负面的第一评分依然为正数,那么就将导致对没有该类项目评价数据的酒店的不公平。所以,该技术方案有利于提升酒店推荐效果的准确性。

S140,获取上述目标语句中的评价项目和对应的评价关键词,依据上述评价关键词和上述第一映射表,得到每个评价项目对应的第一评分。需要说明的是,对于一酒店,在一评价项目上,如果该酒店所有的目标语句中均没有涉及该评价项目,那么就对该酒店的该评价项目,设置一预设分数,比如为60分等。

S150,根据每个上述目标语句的评价项目对应的第一评分,获得各个酒店对应的总评分;对酒店按照总评分从高到低的顺序排序,并将总评分最高的酒店推荐给用户。具体而言,获取用户在搜索页面上的搜索条件,根据搜索条件筛选出符合搜索条件的酒店。将各个酒店下提取的所有的目标语句中的评价项目对应的第一评分,进行求和,得到各个酒店对应的总评分。然后将总评分最高的酒店或者最高的N个酒店推荐给该用户。其中,N为正整数。并且,将各个酒店依据总评分从高到低的排序,显示于用户设备的搜索结果中。

如图2所示,本申请另一实施例公开了另一种酒店推荐方法,该方法在上述实施例的基础上,还包括步骤:

S160,当总评分最高的有多个酒店时,将上述多个酒店作为待筛选酒店,并获取用户在历史酒店预订订单中的历史文本点评数据。需要说明的是,上述历史酒店预订订单不局限于在待筛选酒店上的订单,是在所有的酒店上的订单。上述历史文本点评数据也属于是文本点评记录。

S170,自用户的上述历史文本点评数据中提取出出现次数最多的评价项目,作为参考项目。具体而言,比如,用户有100条历史文本点评数据的记录,其中出现次数最多的是酒店隔音的评价项目,那么就将“酒店隔音”作为参考项目。该参考项目出现次数最多,说明用户最在意酒店的该设施状况。

S180,获取上述待筛选酒店在上述参考项目上的第三评分,将上述待筛选酒店中第三评分最高的酒店推荐给用户。具体而言,比如上述待筛选酒店具有三个,分别为第一酒店、第二酒店、第三酒店,获取三个酒店分别在“酒店隔音”评价项目上的第三评分,比如对应的第三评分分别为60分、70分和80分,那么就将80分对应的第三酒店推荐给用户。这样实现了针对用户在意的评价项目上,将该评价项目设施最好比如酒店隔音表现最好的酒店推荐给用户,利于提升酒店的推荐效果,可以根据用户对于酒店各个评价项目的关注程度来自动调整推荐的结果,获得更符合用户个性需求的体验。

这样实现了能够结合用户的历史文字点评记录与酒店的历史文字点评记录,有效利用了用户的历史文字点评记录,将最合适的酒店推荐给用户,提升用户体验。

本申请另一实施例公开了另一种酒店推荐方法,该方法在上述实施例的基础上,步骤S180包括:

S181,自上述待筛选酒店中筛除参考项目对应的评价类别包含有负面的酒店,被保留的待筛选酒店作为备选酒店。以及

S182,获取上述备选酒店在上述参考项目上的第三评分,将上述待筛选酒店中第三评分最高的酒店推荐给用户。

具体而言,也即若用户在历史文本点评数据中比较在意“酒店隔音”,那么对于评价关键词中出现过反映酒店隔音不好的情况时,就筛除该酒店。这样有利于减少算法在进行推荐过程中的计算量,提高系统性能。

本申请另一实施例公开了另一种酒店推荐方法,该方法在上述实施例的基础上,还包括步骤:

在一预设时段后,重复执行步骤S110至步骤S150,获取一个新的酒店排序结果。以对酒店排序结果进行更新,保证酒店排序结果的时效性。上述预设时段可以为一个星期。

需要说明的是,本实施例公开的酒店推荐方法适用于其他商品,比如餐馆时,同样在本申请的保护范围之内。本申请的上述所有实施例可以进行自由组合,组合后得到的技术方案也在本申请的保护范围之内。

如图3所示,本发明一实施例还公开了一种酒店推荐系统3,该系统包括:

评价文本获取模块31,用于获取多个酒店各自对应的所有文本评价数据。

目标语句提取模块32,用于对上述文本评价数据进行语句切分,提取出目标语句;每个上述目标语句中包含有评价项目和对应的评价关键词。

映射表建立模块33,用于建立评价关键词和第一评分相关联的第一映射表。

第一评分获取模块34,用于获取上述目标语句中的评价项目和对应的评价关键词,依据上述评价关键词和上述第一映射表,得到每个评价项目对应的第一评分。

总评推荐模块35,用于根据每个上述目标语句的评价项目对应的第一评分,获得各个酒店对应的总评分;对酒店按照总评分从高到低的顺序排序,并将总评分最高的酒店推荐给用户。

可以理解的是,本发明的酒店推荐系统还包括其他支持酒店推荐系统运行的现有功能模块。图3显示的酒店推荐系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

本实施例中的酒店推荐系统用于实现上述的酒店推荐的方法,因此对于酒店推荐系统的具体实施步骤可以参照上述对酒店推荐的方法的描述,此处不再赘述。

本发明一实施例还公开了一种酒店推荐设备,包括处理器和存储器,其中存储器存储有所述处理器的可执行指令;处理器配置为经由执行可执行指令来执行上述酒店推荐方法中的步骤。图4是本发明公开的酒店推荐设备的结构示意图。下面参照图4来描述根据本发明的这种实施方式的电子设备600。图4显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述酒店推荐方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。

存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。

存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。

本发明还公开了一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述酒店推荐方法中的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述酒店推荐方法中描述的根据本发明各种示例性实施方式的步骤。

如上所示,该实施例的计算机可读存储介质的程序在执行时,能够根据酒店的文本评价数据,并且仅保留完整包含评价项目和评价关键词的评价语句,进行分析转化成各个酒店对应的总评分,实现能够基于网络文字评论,转换成酒店的评分进行推荐,有利于提升酒店推荐效果,也提升了用户体验。

图5是本发明的计算机可读存储介质的结构示意图。参考图5所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本发明实施例提供的酒店推荐方法、系统、设备及存储介质能够根据酒店的文本评价数据,并且仅保留完整包含评价项目和评价关键词的评价语句,进行分析转化成各个酒店对应的总评分,实现能够基于网络文字评论,转换成酒店的评分进行推荐,有利于提升酒店推荐效果,也提升了用户体验。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

相关技术
  • 酒店推荐方法、推荐系统、可读存储介质、及电子设备
  • 酒店推荐方法、系统、设备及存储介质
技术分类

06120113033433