掌桥专利:专业的专利平台
掌桥专利
首页

基于大数据的景区客流趋势预测方法及系统

文献发布时间:2024-04-18 19:58:30


基于大数据的景区客流趋势预测方法及系统

技术领域

本发明涉及大数据技术领域,具体涉及一种基于大数据的景区客流趋势预测方法及系统。

背景技术

近年来,随着文旅行业的蓬勃发展,尤其是景区宣传逐渐从线下转向了线上,使得宣传渠道和宣传范围存在急速扩张和难以控制的趋势,这种趋势一方面为景区带来了巨大的收益,但是过于庞大的客流同样会导致景区内的各行业无法很好的承受和消化,这同样会导致服务质量的下降或其他恶性的影响。因此需要对客流的趋势进行预测,以使得景区内针对未来的客流情况能够做好充分准备。

然而传统的景区客流预测一般只是针对单一维度的历史数据进行分析和判断,相较于餐饮、住宿等文旅配套产业,景区的产业结构复杂,除了游玩观光还会同时含有餐饮、住宿等多种影响对客流产生影响的因素,因此传统单一维度和方向的客流数据分析的准确度较低,无法作为景区相关文旅监管部门和文旅资源配置接待和配套资源的依据。

因此,如何提高对于景区客流趋势预测的准确性成为了亟待解决的问题。

发明内容

本发明所要解决的技术问题是,如何提高对于景区客流趋势预测的准确性。

本发明解决其技术问题所采用的其中一种技术方案是:一种基于大数据的景区客流趋势预测方法,包括如下步骤:

获取预设时长周期内的每日客流数据;

将目标日期与预设时长周期内的各个每日客流数据进行对比获得第一预测结果;

根据预设时长周期内的每日客流数据签获取客流预测模型,并通过客流预测模型获取第二预测结果;

将第一预测结果和第二预测结果进行对比;

若第二预测结果和第一预测结果的相似度大于或等于预设的第一阈值,则将第二预测结果作为目标日期的客流数据的最终预测结果;

若第一预测结果和第二预测结果的相似度小于预设的第一阈值,则对第一预测结果和第二预测结果进行加权计算后得到目标日期的客流数据的最终预测结果。

进一步的,所述将目标日期与预设时长周期内的各个每日客流数据进行对比获得第一预测结果,包括如下步骤:

对每日客流数据匹配对应的第一特征标签;

获取目标日期的第二特征标签;

将第二特征标签与各个每日客流数据所对应的第一特征标签进行对比;

若存在与第二特征标签一致的第一特征标签,则根据该第二特征标签所对应的每日客流数据获取目标日期的第一预测结果;

若不存在与第二特征标签一致的第一特征标签,则获取与第一特征标签相似度大于或等于预设第二阈值的第二特征标,并根据该第二特征标签所对应的每日客流数据获取目标日期的第一预测结果。

进一步的,所述根据预设时长周期内的每日客流数据签获取客流预测模型,包括如下步骤:

所述每日客流数据包括多个每日客流子数据;(每日客流子数据包括每日客流总数、)

对每日客流数据匹配对应的第一特征标签,所述第一特征标签包括多个第一特征子标签;

根据各个第一特征子标签对各个每日客流子数据的影响权重获取权重系数;

并根据每日客流子数据和对应的权重系数获取客流预测模型。

进一步的,所述根据各个第一特征子标签对各个每日客流子数据的影响权重获取权重系数,包括如下步骤:

对各个第一特征子标签进行分组;

获取各组内的第一特征子标签下每日客流子数据的统计指标数据;

对所述统计指标数据进行归一化处理;

根据归一化处理结果获取各个第一特征子标签对应的权重系数。

进一步的,所述获取预设时长周期内的每日客流数据,包括如下步骤:

设定预设的时长周期;

获取预设时长周期内的每日客流数据的数据源,通过所述数据源获取原始数据;

对获取到的原始数据进行清洗;

对经过清洗的原始数据进行整合得到数据集;

将数据集中的各个原始数据进行信息标注得到每日客流数据。

进一步的,还包括如下步骤:

获取目标日期和/或目标日期之前一段时间的舆情数据;

通过所述舆情数据获得舆情影响系数;

利用所述舆情影响系数对客流预测模型所获取的第二预测结果进行修正。

进一步的,还包括如下步骤:

获取最终预测结果与目标日期的实际客流数据的误差情况;

根据所述情况调整所述客流预测模型。

通过以上技术方案可知,本申请中,基于大数据的景区客流趋势预测方法通过多次预测和对比,结合预设时长周期内的每日客流数据和客流预测模型,解决了客流数据预测准确性和数据不确定性的问题。通过设定阈值和加权计算,提高了预测结果的准确性和可靠性,为景区管理人员提供了更准确的客流预测结果,有助于优化资源配置和提供更好的接待服务。

本发明解决其技术问题所采用的另一种技术方案是:一种基于大数据的景区客流趋势预测系统,包括:

数据获取模块,所述数据获取模块用于获取预设时长周期内的每日客流数据;

数据对比模块,所述数据对比模块用于将目标日期与预设时长周期内的各个每日客流数据进行对比获得第一预测结果;

模型构建模块,所述模型构建模块用于根据预设时长周期内的每日客流数据签获取客流预测模型,并通过客流预测模型获取第二预测结果;

结果判断模块,所述结果判断模块用于将第一预测结果和第二预测结果进行对比;

若第二预测结果和第一预测结果的相似度大于或等于预设的第一阈值,则将第二预测结果作为目标日期的客流数据的最终预测结果;

若第一预测结果和第二预测结果的相似度小于预设的第一阈值,则对第一预测结果和第二预测结果进行加权计算后得到目标日期的客流数据的最终预测结果。

进一步的,还包括:

舆情监控模块,所述舆情监控模块用于获取目标日期和/或目标日期之前一段时间的舆情数据,并通过所述舆情数据获得舆情影响系数,利用所述舆情影响系数对客流预测模型所获取的第二预测结果进行修正。

进一步的,还包括:

模型迭代模块,所述模型迭代模块用于获取最终预测结果与目标日期的实际客流数据的误差情况,并根据所述情况调整所述客流预测模型。

通过以上技术方案可知,本申请中,基于大数据的景区客流趋势预测系统能够通过结果判断模块对比第一预测结果和第二预测结果的相似度,并通过考虑数据不确定性,能够提高预测结果的可靠性;通过系统化的设计和自动化的处理,可以简化预测过程,提高预测效率。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1为本发明具体实施方式中基于大数据的景区客流趋势预测方法的流程图;

图2为本发明具体实施方式中获取第一预测结果的流程图;

图3为本发明具体实施方式中获取客流预测模型的流程图;

图4为本发明具体实施方式中获取权重系数的流程图;

图5为本发明具体实施方式中获取预设时长周期内的每日客流数据的流程图;

图6为本发明具体实施方式中舆情监控方法的流程图;

图7为本发明具体实施方式中客流预测模型迭代方法的流程图;

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

下面对本发明实施例中的技术方案进行清楚、完整地描述,显然所述的实施例仅仅是本发明的实施例之一,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所推广的其他实施例,都属于本发明保护的范围。

本申请提供如下的一种实施例,请参照图1所示,一种基于大数据的景区客流趋势预测方法,包括如下步骤:

S1、获取预设时长周期内的每日客流数据;

S2、将目标日期与预设时长周期内的各个每日客流数据进行对比获得第一预测结果;

S3、根据预设时长周期内的每日客流数据签获取客流预测模型,并通过客流预测模型获取第二预测结果;

S4、将第一预测结果和第二预测结果进行对比;

若第二预测结果和第一预测结果的相似度大于或等于预设的第一阈值,则将第二预测结果作为目标日期的客流数据的最终预测结果;

若第一预测结果和第二预测结果的相似度小于预设的第一阈值,则对第一预测结果和第二预测结果进行加权计算后得到目标日期的客流数据的最终预测结果。

其中,预设时长周期优先选择包括与目标日期存在相同特征的日期的周期,例如,目标日期为春节,则预设时长周期优先选择包括上一个春节的时长周期,在某些进一步的实施例中,目标日期存在相同特征的日期在预设时长周期中不位于预设时长周期的起始位置,即预设时长周期的起始日期优先选择为春节前一周,或春节前一个月。这样不仅能够使第一预测结果准确性更高,同时也能够使客流预测模型的构建更加准确。

在某些更进一步的实施例中,请参照图2所示,所述步骤S2中,将目标日期与预设时长周期内的各个每日客流数据进行对比获得第一预测结果,包括如下步骤:

S21、对每日客流数据匹配对应的第一特征标签;

S22、获取目标日期的第二特征标签;

S23、将第二特征标签与各个每日客流数据所对应的第一特征标签进行对比;

若存在与第二特征标签一致的第一特征标签,则根据该第二特征标签所对应的每日客流数据获取目标日期的第一预测结果;

若不存在与第二特征标签一致的第一特征标签,则获取与第一特征标签相似度大于或等于预设第二阈值的第二特征标,并根据该第二特征标签所对应的每日客流数据获取目标日期的第一预测结果。

其中,第一特征标签或第二特征标签具体可以包括天气情况、工作日、节假日、寒暑假、活动日、优惠日等特征,以天气情况为例,第一特征标签或第二特征标签可以具体设置为气温温度、晴天、阴天、雨天、雪天等第一特征子标签或第二特征子标签。其中,每日客流数据能够匹配多个第一特征子标签,目标日期同样能够具有多个第二特征子标签,若每日客流数据的所有第一特征子标签与目标日期的所有第二特征子标签完全相同,则确定该每日客流数据的第一特征标签与目标日期的第二特征标签一致。其中,对于第二阈值的设置,可以直接设定为第一特征子标签和第二特征子标签相同的数量,也可以是特定第一特征子标签和第二特征子标签的相似度。第二阈值根据每日数据的数据源获取情况确定,本申请对此不做具体限制。

在某些更进一步的实施例中,请参照图3所示,所述步骤S3中,根据预设时长周期内的每日客流数据签获取客流预测模型,包括如下步骤:

S31、所述每日客流数据包括多个每日客流子数据;

S32、对每日客流数据匹配对应的第一特征标签,所述第一特征标签包括多个第一特征子标签;

S33、根据各个第一特征子标签对各个每日客流子数据的影响权重获取权重系数;

S34、并根据每日客流子数据和对应的权重系数获取客流预测模型。

其中,每日客流子数据具体包括每日客流总数数据,除此以外,每日客流数据还可以由多个维度的子数据组成,例如,每日客流子数据还可以包括行业接待数据、过夜游客数据、出入市区数据、消费数据、游客画像数据等数据中的一个或多个。这些子数据可以提供更详细和全面的客流信息,有助于更准确地预测客流趋势。

其中,每个每日客流子数据可以与对应的第一特征标签进行匹配。天气情况、工作日、节假日、寒暑假、活动日、优惠日等特征。而第一特征子标签则是对应于每个第一特征标签的具体取值,例如具体的天气情况,具体的日期、特定的节假日等。其中,通过对每个第一特征子标签对各个每日客流子数据的影响进行权重分析,可以获取权重系数。这些权重系数反映了不同特征对客流的影响程度。可以使用统计分析方法、机器学习算法或专家知识等进行权重系数的计算和获取。其中,基于每日客流子数据和对应的权重系数,可以构建客流预测模型。这可以是基于统计方法的回归模型、时间序列分析模型、机器学习模型等。通过模型的训练和优化,可以预测未来客流趋势。上述步骤中通过包含多个每日客流子数据和第一特征子标签,可以考虑更多的因素对客流的影响,提高预测的准确性和全面性。同时,通过获取各个第一特征子标签对每日客流子数据的影响权重系数,可以更精确地反映不同特征对客流的重要性,提高预测模型的可靠性和准确性。并且通过基于每日客流子数据和权重系数构建客流预测模型,可以利用这些信息进行预测,提高预测结果的准确性和可解释性。

在某些更进一步的实施例中,请参照图4所示,所述步骤S33中,根据各个第一特征子标签对各个每日客流子数据的影响权重获取权重系数,包括如下步骤:

S331、对各个第一特征子标签进行分组;

S332、获取各组内的第一特征子标签下每日客流子数据的统计指标数据;

S333、对所述统计指标数据进行归一化处理;

S334、根据归一化处理结果获取各个第一特征子标签对应的权重系数。

其中,针对每个第一特征标签下的多个第一特征子标签,可以进行分组操作。第一特征子标签的分组可以直接参考第一特征标签的分类形成,即气温温度、晴天、阴天、雨天、雪天等第一特征子标签归属于天气情况这一第一特征标签下,这样可以将具有相似特征或属性的子标签归为一组,方便后续的统计和处理操作。其中,在每个分组内,针对第一特征子标签下的每日客流子数据,可以计算各种统计指标,统计指标可以包括但不限于平均值、最大值、最小值、标准差等。这些统计指标可以反映客流数据的分布和变化情况。对于每个分组内的统计指标数据,可以进行归一化处理。归一化可以将不同范围和单位的指标数据映射到统一的标准区间,例如0到1之间。这样可以消除指标间的量纲差异,确保它们具有可比性。基于归一化处理后的统计指标数据,可以计算各个第一特征子标签对应的权重系数。这可以通过一些算法或方法来进行计算,例如基于权重分配、回归分析、聚类分析等。最终的权重系数反映了不同特征子标签对客流的影响程度。通过对第一特征子标签进行分组、获取统计指标数据、归一化处理和计算权重系数,该方法可以更全面地考虑不同特征子标签对客流的影响,并提高权重计算的准确性,为客流预测模型提供更准确的特征权重,增强了预测结果的可靠性。

在某些更进一步的实施例中,请参照图5所示,所述步骤S1中,获取预设时长周期内的每日客流数据,包括如下步骤:

S11、设定预设的时长周期;

S12、获取预设时长周期内的每日客流数据的数据源,通过所述数据源获取原始数据;

S13、对获取到的原始数据进行清洗;

S14、对经过清洗的原始数据进行整合得到数据集;

S15、将数据集中的各个原始数据进行信息标注得到每日客流数据。

其中,设定一个预设的时长周期,例如一周、一个月或一年作为预测的时间跨度。这个周期可以根据具体需求和预测目标来确定。其中,数据源可以是景区的记录、门票销售系统、移动应用程序、传感器设备等。通过这些数据源,可以获得客流量的原始数据。其中,获取到的原始数据可能会包含噪声、异常值或缺失值。因此,需要对原始数据进行清洗,去除异常值、处理缺失值,并进行数据格式的标准化,以确保数据的质量和准确性。其中,清洗后的原始数据可以来自不同的数据源或不同的时间段。为了进行客流预测,需要将这些数据整合到一个数据集中。可以根据日期或时间戳将数据进行排序和组织,以便后续的处理和分析。其中,在数据集中,可以对每个原始数据进行信息标注,例如日期、时间段、天气情况、节假日等。这些标注信息可以为特征匹配提供更多的依据,有助于后续的分析和预测。

在某些更进一步的实施例中,请参照图6所示,基于大数据的景区客流趋势预测方法,还包括如下步骤:

S5、获取目标日期和/或目标日期之前一段时间的舆情数据;

S6、通过所述舆情数据获得舆情影响系数;

S7、利用所述舆情影响系数对客流预测模型所获取的第二预测结果进行修正。

其中,为了考虑舆情对客流的影响,需要获取目标日期和/或目标日期之前一段时间的舆情数据。舆情数据可以来自社交媒体、新闻报道、在线评论等渠道,涵盖与景区相关的话题和事件。其中,利用获取到的舆情数据,可以进行舆情分析,识别出与客流相关的舆情因素,并计算舆情影响系数。舆情影响系数反映了舆情对客流的影响程度,可以用于调整客流预测结果。其中,在客流预测模型得到第二预测结果后,可以根据舆情影响系数对其进行修正。通过乘以舆情影响系数,可以调整预测结果,考虑舆情对客流的影响,使预测结果更加准确。通过获取舆情数据,可以考虑舆情因素对客流的影响,提高预测模型的准确性和解释性。而通过计算舆情影响系数,可以量化舆情对客流的影响程度,为预测结果的修正提供依据。并通过利用舆情影响系数对预测结果进行修正,可以更准确地反映舆情对客流的影响,提高预测结果的准确性。

在某些更进一步的实施例中,请参照图7所示,基于大数据的景区客流趋势预测方法,还包括如下步骤:

S8、获取最终预测结果与目标日期的实际客流数据的误差情况;

S9、根据所述情况调整所述客流预测模型。

其中,在实际情况中,可以获取最终预测结果与目标日期的实际客流数据之间的误差情况。通过比较预测结果和实际数据,可以评估预测模型的准确性和可靠性。在某些具体的实施例中,可以通过调整模型参数、引入新的特征或改变模型结构等方式来提高预测的准确性。通过与实际客流数据的对比和模型的调整,可以不断提升预测模型的准确性和可靠性,实现客流预测模型的迭代,直到最终预测结果达到满意的准确性或收敛为止。

本申还请提供了如下的一种实施例,一种基于大数据的景区客流趋势预测系统,包括:

数据获取模块,所述数据获取模块用于获取预设时长周期内的每日客流数据;

数据对比模块,所述数据对比模块用于将目标日期与预设时长周期内的各个每日客流数据进行对比获得第一预测结果;

模型构建模块,所述模型构建模块用于根据预设时长周期内的每日客流数据签获取客流预测模型,并通过客流预测模型获取第二预测结果;

结果判断模块,所述结果判断模块用于将第一预测结果和第二预测结果进行对比;

若第二预测结果和第一预测结果的相似度大于或等于预设的第一阈值,则将第二预测结果作为目标日期的客流数据的最终预测结果;

若第一预测结果和第二预测结果的相似度小于预设的第一阈值,则对第一预测结果和第二预测结果进行加权计算后得到目标日期的客流数据的最终预测结果。

在某些更进一步的实施例中,基于大数据的景区客流趋势预测系统还包括:

舆情监控模块,所述舆情监控模块用于获取目标日期和/或目标日期之前一段时间的舆情数据,并通过所述舆情数据获得舆情影响系数,利用所述舆情影响系数对客流预测模型所获取的第二预测结果进行修正。

在某些更进一步的实施例中,基于大数据的景区客流趋势预测系统还包括:

模型迭代模块,所述模型迭代模块用于获取最终预测结果与目标日期的实际客流数据的误差情况,并根据所述情况调整所述客流预测模型。

其中,本发明的基于大数据的景区客流趋势预测系统的工作原理及调整方法可参考上述基于大数据的景区客流趋势预测方法中所列举的各个实施例,此处不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施方式和说明书中的描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入本发明要求保护的范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

相关技术
  • 一种基于大数据的景区客流预测系统
  • 基于大数据的景区客流量统计评估系统及方法
技术分类

06120116501299