掌桥专利:专业的专利平台
掌桥专利
首页

一种基于MNLP的景区多维度漏洞评估方法

文献发布时间:2023-06-19 11:16:08


一种基于MNLP的景区多维度漏洞评估方法

技术领域

本发明涉及大数据旅游技术领域,尤其涉及一种基于MNLP的景区多维度漏洞评估方法。

背景技术

据国家网信办有关数据统计,截至2020年12月,我国网民规模高达8.29亿,全年共计新增网民5700万人。互联网普及率高达59.6%,相比2019年底提升3.8个百分点。上述数据充分说明,绝大多数游客在旅游前喜欢通过PC端或移动端等网络平台来获取该景区的信息,旅游景区的营销方式已经不再只是传统的通过旅行社营销的方式,而更多的是现代的游客通过查询网络平台获取景区信息的新型网络营销方式。随着移动平板和手机的普及,更多的游客偏向使用这两种设备来查询景区资讯,在智慧化旅游时代的今天,旅游业从卖方市场转为买方市场,应该如何分析并使用旅游景区口碑营销策略显得十分重要,亟待解决。

一个景区的口碑在很大程度上决定了游客对这个景区的印象,一个景区口碑的好坏决定着这个景区的产品和服务是否有升值的空间。由此,网络口碑被认定为旅游景区评定的重要指标。同时景区口碑评论数据是游客游玩后对景区管理、服务体验等方面作出的综合反馈。通过挖掘游客对景区的评论数据,掌握景区管理漏洞,提高景区管理能力。

当前,OTA(Online Travel Agency)平台众多,景区评论数据分布于各个OTA上,单一的OTA评论数据并不具有显著代表性。因此,相比于基于单个OTA的景区管理洞察,纳入多个OTA评价数据具有重要作用。但不同OTA平台的综合评价标准不一,因此对其进行标准化处理,尤为重要。

因此为了更加方便快捷的了解游客对景区的评价,从而提高景区的管理能力,本发明提出了一种基于MNLP(Modified Natural Language Processing)的景区多维度漏洞评估方法,对各平台的数据进行标准化处理,统一运算,及时发现景区的管理漏洞问题。

发明内容

本发明的目的是为了克服上述背景技术中的不足之处,提出了一种基于MNLP的景区多维度漏洞评估方法,其中M代表Modified(改进型),其MNLP即是一种改进型的自然语言处理技术。

本发明的实施例提供了一种基于MNLP的景区多维度漏洞评估方法,所述方法包括:

步骤S1:建立景区多维度漏洞评估体系;

步骤S2:收集主流OAT平台景区评论数据;

步骤S3:挖掘文本内容并利用MNLP方法剔除无效数据;

步骤S4:对评论数据的各个维度进行分类和打分;

步骤S5:将数据进行标准化处理;

步骤S6:计算景区综合口碑指数;

步骤S7:输出景区多维度漏洞评估结果。

优选地,所述步骤S1景区多维度漏洞评估体系包含三级指标,一级指标为景区综合口碑指数,二级指标为景区口碑维度好评率,三级指标分为九个维度,分别为公共设施、卫生环境、客流状态、旅游交通、景区管理、景点景色、服务质量、门票物价和文化特色。

优选地,所述步骤S2中主流OAT平台包括携程、美团、大众点评、马蜂窝、驴妈妈、去哪儿、同程、途牛和猫途鹰。

优选地,所述步骤S3中MNLP方法先定义数组dictionary[]和hash[],所述数组dictionary[]用来存放步骤S2中收集的主流OAT平台景区评论数据,所述hash[]用来存放key值相同的词,即只要key值相同的词都存放于相同的数组hash[key]中,所述数组hash[]存放词组的具体步骤如下:

步骤S31:获取词库中词的首字w和长度L;

步骤S32:采用哈希MD5算法计算w对应的MD5值,得出value值,即

value=MD5(w)+L;

步骤S33:定义哈希函数key=value%n,其中n代表词库规模,%代表取余运算;

步骤S34:将词的key值存储到相应的hash[key]中,并重复上述过程,直到所有的词都存储在hash[]中。

优选地,所述步骤S34中得到储存所有词的hash[]数组,对hash[]数组进行分词运算,从而提出无效数据,其具体步骤如下:

步骤S341:将带切分的字串定义为T,最大词长L;输出切分后的字串T’;

步骤S342:令指针P指向T首位地址,T’初始化为空集;

步骤S343:计算length为P至T尾部的长度,如果length=0则输出字串T’,反之则执行下一步;

步骤S344:在所述dictionary[]中搜索以P为首字的词,如果搜索不到则将后移一位P,返回步骤S343,反之则执行下一步;

步骤S345:设置最大词长为L,当length的值大于L时,赋值length=L;

步骤S346:在P后提取长度为length的字符串t;

步骤S347:计算P指向的首字和长度为length的key值,在hash[key]对应链表中查找字符串t,如果存在则在T’中添加t并赋予词性,同时P后移length的长度,返回步骤S342;否则令length减1,在P后提取长度为length的字串t,重复步骤S347,直到length=0时,将P后移1个单位,返回步骤S343。

优选地,所述步骤S4中依托大数据对评论内容进行拆分,一方面提取观点,另一方面对词性进行拆分;其次,根据拆分主体,按照九个维度的类型,对评价内容进行归类,并获取该评论观点的极性和强度,其中所述极性分为正面极性和负面极性;所述强度分为一般、喜欢、很喜欢、非常喜欢。

优选地,所述步骤S5中通过数据的标准化处理,消除量纲所带来的运算影响。

优选地,所述步骤S6中基于Delphi算法通过征询、整理、归纳和统计进行景区评论数据近乎一致归一化处理;基于AHP算法进行权重构建,最终计算出景区综合口碑指数。

优选地,采用AHP构建权重时,将判断矩阵记为A,并将A定义如下:

其中:

对判断矩阵进行计算,并以一致性比率对其合理性进行检验,矩阵A特征向量:W=(W

最终形成景区综合口碑指数

式中:i、j、n∈{1,2,3…9},对应为景区多维度漏洞评估体系中的第三级指标,具体为公共设施、卫生环境、客流状态、旅游交通、景区管理、景点景色、服务质量、门票物价和文化特色。W代表矩阵A特征向量,W

本发明的有益效果在于以下几个方面:

(1)对各大OAT平台上的景区评论进行收集,通过挖掘游客对景区的评价,从而发现景区现有的管理漏洞,提高景区管理的能力。

(2)该评估方法将各大OTA平台上的评论标准化,利于后期数据的处理,本发明将数据按照100分制进行综合评分和结果输出。

附图说明

图1显示了本发明优选实施例的方法流程图;

图2显示了本发明优选实施例的景区多维度漏洞评估体系各级指标维度分类图;

图3显示了对hash[]数组进行分词运算的方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述,实施例并不构成对本发明实施例的限定。

参考图1所示一种基于MNLP的景区多维度漏洞评估方法包括:

步骤S1:建立景区多维度漏洞评估体系。

其中多维度漏洞评估体系如图2所示包含三级指标,一级指标为景区综合口碑指数,二级指标为景区口碑维度好评率,三级指标分为九个维度,分别为公共设施、卫生环境、客流状态、旅游交通、景区管理、景点景色、服务质量、门票物价和文化特色。

步骤S2:收集主流OAT平台景区评论数据。

其中所述主流OAT平台包括携程、美团、大众点评、马蜂窝、驴妈妈、去哪儿、同程、途牛和猫途鹰。

步骤S3:挖掘文本内容并利用MNLP方法剔除无效数据。

所述MNLP方法先定义数组dictionary[]和hash[],其中数组dictionary[]用来存放步骤S2中收集的主流OAT平台景区评论数据,所述hash[]用来存放key值相同的词,即只要key值相同的词都存放于相同的数组hash[key]中,具体存放词的流程包括:

步骤S31:获取词库中词的首字w和长度L;

步骤S32:采用哈希MD5算法计算w对应的MD5值,得出value值,即

value=MD5(w)+L;

步骤S33:定义哈希函数key=value%n,其中n代表词库规模,%代表取余运算;

步骤S34:将词的key值存储到相应的hash[key]中,并重复上述过程,直到所有的词都存储在hash[]中。

通过以上初始化,所有首字母相同且字数相同的词都别存储在同一链表中,该方法能快速定位关键词,这样有利于缩短算法的运行时间。在词都别存储在同一链表后,在进行分词算法,将有效的出具输出,无效的词句剔除,该分词算法参考图3所示,其具体操作流程如下:

步骤S341:将带切分的字串定义为T,最大词长L;输出切分后的字串T’;

步骤S342:令指针P指向T首位地址,T’初始化为空集;

步骤S343:计算length为P至T尾部的长度,如果length=0则输出字串T’,反之则执行下一步;

步骤S344:在所述dictionary[]中搜索以P为首字的词,如果搜索不到则将后移一位P,返回步骤S343,反之则执行下一步;

步骤S345:设置最大词长为L,当length的值大于L时,赋值length=L;

步骤S346:在P后提取长度为length的字符串t;

步骤S347:计算P指向的首字和长度为length的key值,在hash[key]对应链表中查找字符串t,如果存在则在T’中添加t并赋予词性,同时P后移length的长度,返回步骤S342;否则令length减1,在P后提取长度为length的字串t,重复步骤S347,直到length=0时,将P后移1个单位,返回步骤S343。

以上步骤最终输出有效字串T’,该T’所对应的评论数据即为有效数据。

步骤S4:对评论数据的各个维度进行分类和打分。

该步骤中的评论数据是经过步骤S3筛选出来的有效数据,该数据依托大数据对评论内容进行拆分,一方面提取观点,另一方面对词性进行拆分;其次,根据拆分主体,按照九个维度的类型,对评价内容进行归类,并获取该评论观点的极性和强度,其中所述极性分为正面极性和负面极性;所述强度分为一般、喜欢、很喜欢、非常喜欢。

步骤S5:将数据进行标准化处理,消除量纲所带来的运算影响。

步骤S6:计算景区综合口碑指数。

基于Delphi算法通过征询、整理、归纳和统计进行景区评论数据归一化处理;基于AHP算法进行权重构建,最终计算出景区综合口碑指数。

采用AHP构建权重时,将判断矩阵记为A,并将A定义如下:

其中:

对判断矩阵进行计算,并以一致性比率对其合理性进行检验,矩阵A特征向量:W=(W

最终形成景区综合口碑指数

式中:i、j、n∈{1,2,3…9},对应为景区多维度漏洞评估体系中的第三级指标,具体为公共设施、卫生环境、客流状态、旅游交通、景区管理、景点景色、服务质量、门票物价和文化特色。W代表矩阵A特征向量,W

步骤S7:输出景区多维度漏洞评估结果。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。

以上所述的具体实施方式,对本发明实施例的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明实施例的保护范围,凡在本发明实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

相关技术
  • 一种基于MNLP的景区多维度漏洞评估方法
  • 基于开放漏洞评估语言的系统漏洞评估方法、装置和系统
技术分类

06120112859513