一种大型主题公园日客流量预测方法及系统
文献发布时间:2023-06-19 18:46:07
技术领域
本发明涉及数据统计领域,尤其涉及一种大型主题公园日客流量预测方法及系统。
背景技术
大型主题公园的短期客流预测对于主题公园的运营、管理具有重要意义,一方面可以为主题公园的资源配置提供参考,另一方面大型主题公园一般吸引范围广、游客量庞大,尤其是在旅游旺季、黄金周期间,游客量激增容易发生区域交通瘫痪、旅客滞留等危险,因而,准确的客流预测可以对相关风险进行有效规避;此外,短期客流预测结果同样能够对游客出游日期的选择提供重要参考,引导游客错峰出行,具有十分重要的意义。
对大型主题公园开展短期(如,以日为单位)客流预测的技术方法较少,该技术领域相对空白。
目前技术方法大多集中于对主题公园远景年的大尺度客流进行预测,如远景1年、3年、5年或10年的年平均客流量、季度平均客流量等,大尺度预测结果更多是为了指导主题公园管理战略的部署,无法对近期运营管理工作提供指导,更不能对游客出游提供参考。
而目前现有的短期客流预测技术存在局限性,一方面,从预测对象上来看,目前的客流预测主要面向于一般旅游景点、市属公园等,该类公园与大型主题公园(如环球影城)对游客的吸引特征据具有较大差异,大型主题公园对游客具有更广域范围的吸引力,受经济等更多因素影响,进行客流预测中需要考虑更多层面的影响因素,不完全适用该类技术,需要对现有技术进行适用性改进与优化。另一方面,从技术本身来看,目前的客流预测技术大多建立在考虑单一因素影响下的预测(主要为人体舒适度因素、天气因素或者历史同期值因素等,对其他因素考虑较少);最后,仅有的少部分考虑多因素开展客流预测的技术也并未给出不同因素对客流量的影响程度,无法实现对特定因素变化带来的客流量变动的量化估计,面向相应需求需要开展技术研发。
发明内容
鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种大型主题公园日客流量预测方法及系统。
根据本发明的一个方面,提供了一种大型主题公园日客流量预测方法包括:
步骤S1:识别影响大型主题公园客流的多类因子;
步骤S2:判断是否存在影响大型主题公园客流的差异因子;
步骤S3:对数值型因子,计算不同日期各因子的历史值;
步骤S4:对类别型因子,对各因子进行历史数据赋值;
步骤S5:按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型;
步骤S6:以各自变量回归系数值定量评估不同因子对客流量的影响作用。
可选的,所述步骤S1中影响大型主题公园客流的多类因子具体包括:
面向大型主题公园吸引游客群体的特征,识别影响不同游客群体出游的日期类因子,包括影响学生群体的是否寒暑假因子;影响职工群体的是否工作日、周末、节假日因子;影响非工作者的星期因子;
大型主题公园票价高、且不同日期的票价浮动较大,对游客游玩起着重要影响作用,识别影响游客出游的经济类因子,包括票价因子;
社会背景因素对游客出游产生显著影响,识别影响游客出游的社会类因子,包括当地病例数因子、全国病例数因子;
气候与天气也是影响游客出游的重要因素,识别影响游客出游的天气类因子,包括出游舒适度因子。
可选的,所述步骤S2:判断是否存在影响大型主题公园客流的差异因子具体包括:
采用单一变量法,逐一分析每个类别型因子不同类别所对应日期下,其他因子不同值或类别对应日期下的平均客流量趋势特征,识别造成其他因子客流趋势特征有显著差异的因子。
可选的,所述步骤S3:对数值型因子,计算不同日期各因子的历史值具体包括:
数值型因子,为每日有具体数值的因子;
所识别的票价因子、当地病例数因子、全国病例数因子、出游舒适度因子为数值型因子;
历史值计算方法为:
票价因子直接使用当日票价量值;
当地病例数因子直接使用当日当地病例数值;
全国病例数因子直接使用当日全国病例数值;
出游舒适度因子通过当日当地最高温度、最大风速、最高湿度进行计算,计算模型为:
y
可选的,所述步骤S4:对类别型因子,对各因子进行历史数据赋值具体包括:
类别型因子,为可对日期进行分类,但各类别无法量化为具体数值的因子;所识别的是否寒暑假因子、是否工作日、周末、节假日因子、星期因子为类别型因子;
差异因子,划分差异类别,无需赋数值;
按照差异因子各类别拆分,计算每个差异因子类别下,剩余因子不同类别所对应日期的历史客流量均值,将所述历史客流量均值赋予所述剩余因子的相应类别。
可选的,所述差异因子,划分差异类别具体包括:
对于识别为差异因子的是否寒暑假因子,划分是寒暑假、非寒暑假两个差异类。
可选的,所述将历史客流量均值赋予所述剩余因子的相应类别具体包括:
对于是否工作日、周末、节假日因子,具体划分工作日、周末、节假日三个类别;
差异因子=非寒暑假,相应日期内,计算工作日类别日期日均客流为J
则相应工作日类别日期赋值j
差异因子=是寒暑假,相应日期内,计算工作日类别日期日均客流为J
相应工作日类别日期赋值j
对于星期因子,具体划分周一、周二、周三、周四、周五、周六、周日七个类别;
差异因子=非寒暑假,相应日期内,计算周一至周日类别日期日均客流分别为W
相应周一至周日类别日期分别赋值w
差异因子=是寒暑假,相应日期内,计算周一至周日类别日期日均客流分别为W
相应“周一”至“周日”类别日期分别赋值w
可选的,所述步骤S5:按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型具体包括:
采用多元回归的方法,以所识别的除差异因子外的其他各因子值为自变量,大型主题公园日客流量为因变量,分别构建差异因子各类别下的多元回归方程;
求出回归方程系数,合并为分段模型。
可选的,所述步骤S6:以各自变量回归系数值定量评估不同因子对客流量的影响作用具体包括:
判断回归模型各因子对应自变量系数正负,正值系数因子对客流量是正向影响,负值系数因子对客流为负向影响;
分析回归模型各因子对应自变量系数绝对值大小,所述自变量系数绝对值越大,则对客流变化影响程度越高;
所述自变量系数绝对值最大的因子为对客流影响的最主要因子。
本发明还提供了一种大型主题公园日客流量预测系统包括:
多类因子识别模块,用于识别影响大型主题公园客流的多类因子;
差异因子判断模块,用于判断是否存在影响大型主题公园客流的差异因子;
历史值计算模块,用于对数值型因子,计算不同日期各因子的历史值;
数据赋值模块,用于对类别型因子,对各因子进行历史数据赋值;
回归模型构建模块,用于按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型;
评估模块,用于以各自变量回归系数值定量评估不同因子对客流量的影响作用。
本发明提供的一种大型主题公园日客流量预测方法及系统,方法包括:识别影响大型主题公园客流的多类因子;判断是否存在影响大型主题公园客流的差异因子;对数值型因子,计算不同日期各因子的历史值;对类别型因子,对各因子进行历史数据赋值;按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型;以各自变量回归系数值定量评估不同因子对客流量的影响作用。对客流量最主要的影响因素的识别、识别各影响因素的影响方向,并能够定量计算出不同影响因素变化带来的客流量波动值。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种大型主题公园日客流量预测方法的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
如图1所示,一种大型主题公园日客流量预测方法包括:
步骤S1:识别影响大型主题公园客流的多类因子;
步骤S2:判断是否存在影响大型主题公园客流的差异因子;
步骤S3:对数值型因子,计算不同日期各因子的历史值;
步骤S4:对类别型因子,对各因子进行历史数据赋值;
步骤S5:按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型;
步骤S6:以各自变量回归系数值定量评估不同因子对客流量的影响作用。
步骤S1中影响大型主题公园客流的多类因子具体包括:
面向大型主题公园吸引游客群体的特征,识别影响不同游客群体出游的日期类因子,包括影响学生群体的是否寒暑假因子;影响职工群体的是否工作日、周末、节假日因子;影响非工作者的星期因子;
大型主题公园票价高、且不同日期有票价浮动较大,对游客游玩起着重要影响作用,识别影响游客出游的经济类因子,包括票价因子;
社会背景因素对游客出游产生显著影响,识别影响游客出游的社会类因子,包括当地病例数因子、全国病例数因子;
气候与天气也是影响游客出游的重要因素,识别影响游客出游的天气类因子,包括出游舒适度因子。
步骤S2:判断是否存在影响大型主题公园客流的差异因子具体包括:
采用单一变量法,逐一分析每个类别型因子不同类别所对应日期下,其他因子不同值或类别对应日期下的平均客流量趋势特征,识别造成其他因子客流趋势特征有显著差异的因子。
步骤S3:对数值型因子,计算不同日期各因子的历史值具体包括:
数值型因子,为每日有具体数值的因子;
所识别的票价因子、当地病例数因子、全国病例数因子、出游舒适度因子为数值型因子;
历史值计算方法为:
票价因子直接使用当日票价量值;
当地病例数因子直接使用当日当地病例数值;
全国病例数因子直接使用当日全国病例数值;
出游舒适度因子通过当日当地最高温度、最大风速、最高湿度进行计算,计算模型为:
y
步骤S4:对类别型因子,对各因子进行历史数据赋值具体包括:
类别型因子,为可对日期进行分类,但每日无法量化为具体数值的因子;所识别的是否寒暑假因子、是否工作日、周末、节假日因子、星期因子为类别型因子;
差异因子,划分差异类别,无需赋数值;
按照差异因子各类别拆分,计算每个差异因子类别下,剩余因子不同类别所对应日期的历史客流量均值,将所述历史客流量均值赋予所述剩余因子的相应类别。
差异因子,划分差异类别具体包括:
对于识别为差异因子的是否寒暑假因子,划分是寒暑假、非寒暑假两个差异类。
将历史客流量均值赋予所述剩余因子的相应类别具体包括:
对于是否工作日、周末、节假日因子,具体划分工作日、周末、节假日三个类别;
差异因子=非寒暑假,相应日期内,计算工作日类别日期日均客流为J
则相应工作日类别日期赋值j
差异因子=是寒暑假,相应日期内,计算工作日类别日期日均客流为J
相应工作日类别日期赋值j
对于星期因子,具体划分周一、周二、周三、周四、周五、周六、周日七个类别;
差异因子=非寒暑假,相应日期内,计算周一至周日类别日期日均客流分别为W
相应周一至周日类别日期分别赋值w
差异因子=是寒暑假,相应日期内,计算周一至周日类别日期日均客流分别为W
相应“周一”至“周日”类别日期分别赋值w
步骤S5:按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型具体包括:
采用多元线性回归的方法,以所识别的除差异因子外的其他各因子值为自变量,大型主题公园日客流量为因变量,分别构建差异因子各类别下的多元回归方程;
求出回归方程系数,合并为分段模型。
1)差异因子=非寒暑假,相应日期内,构建回归方程:
y
其中,y
2)差异因子=是寒暑假,相应日期内,构建回归方程:
y
其中,y
3)合并得到回归模型为:
以各自变量回归系数值定量评估不同因子对客流量的影响作用,实现方法为:
分析a
按照a
按照a
本发明还提供了一种大型主题公园日客流量预测系统包括:
多类因子识别模块,用于识别影响大型主题公园客流的多类因子;
差异因子判断模块,用于判断是否存在影响大型主题公园客流的差异因子;
历史值计算模块,用于对数值型因子,计算不同日期各因子的历史值;
数据赋值模块,用于对类别型因子,对各因子进行历史数据赋值;
回归模型构建模块,用于按照差异因子分段,以所识别的各因子值为自变量,大型主题公园日客流量为因变量,构建分段多元回归模型;
评估模块,用于以各自变量回归系数值定量评估不同因子对客流量的影响作用。
有益效果:对客流影响因子的选择更适用于大型主题公园的预测。综合考虑了多种影响因子(涵盖天气、经济、日期属性、社会等多个方面)。
实现了对大型主题公园的日客流量预测。对疫情特殊背景下的客流预测也具有适用性。
实现了对客流量最主要的影响因素的识别、判断各影响因素的影响方向(正向或负向),并能够定量计算出不同影响因素变化带来的客流量波动值。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。