掌桥专利:专业的专利平台
掌桥专利
首页

基于BP神经网络模型的公园日游客流量预测方法与系统

文献发布时间:2024-04-18 19:58:26


基于BP神经网络模型的公园日游客流量预测方法与系统

技术领域

本发明涉及神经网络以及人流量预测技术领域,更具体的,涉及一种基于BP神经网络模型的公园日游客流量预测方法与系统。

背景技术

城市化进程的不断推进,配套的公园或者绿地也逐步在加快建设,从而可以丰富市民的日常生活,提升生活体验。

目前,各公园或者绿地景区采用的入口闸门检票或利用摄像头统计人数,可以适当控制公园的人数范围,但是,这些统计办法存在滞后性,当发现景区游客人流量超过阈值时,景区内游客已经处于拥堵状态,存在一定的安全隐患。所以,提前预测预警越来越有必要,可以避免交通拥堵,保证人们的人身安全。

发明内容

本发明的目的是提供一种基于BP神经网络模型的公园日游客流量预测方法与系统,可以用于在人流量高峰来临之前提前预测出人流量高峰,避免公园或者绿地景区拥堵。

本发明第一方面提供了一种基于BP神经网络模型的公园日游客流量预测方法,包括以下步骤:

采集用户信令数据以及参考数据,基于所述信令数据得到用户对应的行动轨迹,所述参考数据至少包括节假日历史数据、天气数据以及寒暑假数据;

基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,其中,预设划分区域用户至少包括工作区域用户、居住区域用户;

基于所述日游客用户利用训练好的BP神经网络模型进行测试得到预测结果,从而基于所述预测结果反馈给用户端。

本方案中,所述基于所述信令数据得到用户对应的行动轨迹,具体包括:

基于预设运营商的信令数据获取划分区域内的用户识别码的基站扇信息,所述基站扇信息包括扇区位置信息以及进出扇区时间信息;

基于用户实时轨迹信息接入预设订阅系统结合用户对应的信令数据得到所述行动轨迹。

本方案中,采集参考数据,具体包括:

建立与预设用户端的通信连接以获取用户输入数据;

基于所述输入数据进行数据分析得到不同数据因子,从而基于不同的所述数据因子得到对应的参考数据,其中,

基于节假日因子得到所述节假日历史数据;以及基于天气因子得到所述天气数据;以及基于寒暑假因子得到所述寒暑假数据,其中,所述天气数据还包括最高气温以及最低气温。

本方案中,所述基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,具体包括:

基于所述行动轨迹获取统计区域内的目标活跃用户;

基于所述目标活跃用户结合划分区域以及停留时长得到所述日游客用户其中,具体包括剔除统计区域内属于工作区域和/或居住区域的目标活跃用户;以及保留停留时长属于预设时间阈值范围的目标活跃用户。

本方案中,所述方法还包括构建所述BP神经网络模型,具体包括:

获取训练数据集以及测试数据集;

建立BP神经网络初始回归模型,其中,所述BP神经网络初始回归模型包括BP反响传播和神经网络,所述神经网络中的神经元数量大于或者等于所述参考数据的数量值;

基于所述训练数据集对所述BP神经网络初始回归模型进行训练,其中,模型的激活函数采用ReLu函数,求解器采用1bfgs求解器;

基于预设迭代次数对初始回归模型进行迭代训练,并在每次训练结束后用测试数据集进行交叉验证以筛选得到所述BP神经网络模型。

本方案中,所述方法还包括:对所述信令数据进行异常值修正以及缺失数据补充;以及基于参考数据中的假期政策类数据进行定类变量编码;以及将参考数据中除所述假期政策类数据之外的数据作归一化处理。

本发明第二方面还提供一种基于BP神经网络模型的公园日游客流量预测系统,包括存储器和处理器,所述存储器中包括基于BP神经网络模型的公园日游客流量预测方法程序,所述基于BP神经网络模型的公园日游客流量预测方法程序被所述处理器执行时实现如下步骤:

采集用户信令数据以及参考数据,基于所述信令数据得到用户对应的行动轨迹,所述参考数据至少包括节假日历史数据、天气数据以及寒暑假数据;

基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,其中,预设划分区域用户至少包括工作区域用户、居住区域用户;

基于所述日游客用户利用训练好的BP神经网络模型进行测试得到预测结果,从而基于所述预测结果反馈给用户端。

本方案中,所述基于所述信令数据得到用户对应的行动轨迹,具体包括:

基于预设运营商的信令数据获取划分区域内的用户识别码的基站扇信息,所述基站扇信息包括扇区位置信息以及进出扇区时间信息;

基于用户实时轨迹信息接入预设订阅系统结合用户对应的信令数据得到所述行动轨迹。

本方案中,采集参考数据,具体包括:

建立与预设用户端的通信连接以获取用户输入数据;

基于所述输入数据进行数据分析得到不同数据因子,从而基于不同的所述数据因子得到对应的参考数据,其中,

基于节假日因子得到所述节假日历史数据;以及基于天气因子得到所述天气数据;以及基于寒暑假因子得到所述寒暑假数据,其中,所述天气数据还包括最高气温以及最低气温。

本方案中,所述基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,具体包括:

基于所述行动轨迹获取统计区域内的目标活跃用户;

基于所述目标活跃用户结合划分区域以及停留时长得到所述日游客用户其中,具体包括剔除统计区域内属于工作区域和/或居住区域的目标活跃用户;以及保留停留时长属于预设时间阈值范围的目标活跃用户。

本方案中,所述方法还包括构建所述BP神经网络模型,具体包括:

获取训练数据集以及测试数据集;

建立BP神经网络初始回归模型,其中,所述BP神经网络初始回归模型包括BP反响传播和神经网络,所述神经网络中的神经元数量大于或者等于所述参考数据的数量值;

基于所述训练数据集对所述BP神经网络初始回归模型进行训练,其中,模型的激活函数采用ReLu函数,求解器采用1bfgs求解器;

基于预设迭代次数对初始回归模型进行迭代训练,并在每次训练结束后用测试数据集进行交叉验证以筛选得到所述BP神经网络模型。

本方案中,所述方法还包括:对所述信令数据进行异常值修正以及缺失数据补充;以及基于参考数据中的假期政策类数据进行定类变量编码;以及将参考数据中除所述假期政策类数据之外的数据作归一化处理。

本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括机器的一种基于BP神经网络模型的公园日游客流量预测方法程序,所述基于BP神经网络模型的公园日游客流量预测方法程序被处理器执行时,实现如上述任一项所述的一种基于BP神经网络模型的公园日游客流量预测方法的步骤。

本发明公开的一种基于BP神经网络模型的公园日游客流量预测方法与系统,通过手机信令数据计算出公园范围内的历史日游客数据,结合影响公园游客量的多个因素,包含自然、社会经济等多种因素建立BP神经网络模型,可以用于在人流量高峰来临之前提前预测出人流量高峰,避免公园或者绿地景区拥堵。

附图说明

图1示出了本发明一种基于BP神经网络模型的公园日游客流量预测方法的流程图;

图2示出了本发明一种基于BP神经网络模型的公园日游客流量预测方法的神经元模型图;

图3示出了本发明一种基于BP神经网络模型的公园日游客流量预测方法的预测示意图;

图4示出了本发明一种基于BP神经网络模型的公园日游客流量预测系统的框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了本申请一种基于BP神经网络模型的公园日游客流量预测方法的流程图。

如图1所示,本申请公开了一种基于BP神经网络模型的公园日游客流量预测方法,包括以下步骤:

S102,采集用户信令数据以及参考数据,基于所述信令数据得到用户对应的行动轨迹,所述参考数据至少包括节假日历史数据、天气数据以及寒暑假数据;

S104,基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,其中,预设划分区域用户至少包括工作区域用户、居住区域用户;

S106,基于所述日游客用户利用训练好的BP神经网络模型进行测试得到预测结果,从而基于所述预测结果反馈给用户端。

需要说明的是,于本实施例中,本申请目的在于根据手机信令信息反映在连续时间段内,不同时间点手机用户所在的空间位置,从而可以计算出某个特定公园的日游客数据,根据这些日游客历史值,并结合这一连续时间段对应的期的双休节假日、寒暑假、最高气温、最低气温、天气、防控政策等数据,建立对应的BP神经网络模型,来预测未来一定时期的日游客数,以帮助管理公园的运营,具体地,首先采集用户信令数据得到用户的行动轨迹,以及采集参考数据,相应地,所述参考数据即包括节假日历史数据、天气数据、寒暑假数据以及防控政策数据,其中,天气数据相应地也包括了最高气温和最低气温等数据,而后基于所述行动轨迹结合不同的划分区域以及停留时长进行识别,从而区分开工作区域用户以及居住区域用户,在停留时长满足时间跨度要求的信令数据中得到日游客用户,而后基于日游客数据利用训练好的BP神经网络模型进行测试得到预测结果,从而预测下一时间段的游客预测结果,以反馈给用户端(公园管理者)进行参考,帮助其可以在人流量高峰来临之前提前得知人流量高峰,从而避免公园或者绿地景区拥堵。

根据本发明实施例,所述基于所述信令数据得到用户对应的行动轨迹,具体包括:

基于预设运营商的信令数据获取划分区域内的用户识别码的基站扇信息,所述基站扇信息包括扇区位置信息以及进出扇区时间信息;

基于用户实时轨迹信息接入预设订阅系统结合用户对应的信令数据得到所述行动轨迹。

需要说明的是,于本实施例中,预设运营商可以包括市场已存在的运营商,从而利用运营商的信令数据,在每个规范后的区域内,对每个用户识别码(IMSI,InternationalMobile Subscriber Identity)所有发生切换的基站扇区信息,其包括扇区位置、进出扇区时间信息进行采集,针对获取手机用户实时轨迹的信息,使用Spark Streaming接入Kafka消息系统订阅实时信令数据,以获取手机用户每天对应的行动轨迹。

根据本发明实施例,采集参考数据,具体包括:

建立与预设用户端的通信连接以获取用户输入数据;

基于所述输入数据进行数据分析得到不同数据因子,从而基于不同的所述数据因子得到对应的参考数据,其中,

基于节假日因子得到所述节假日历史数据;以及基于天气因子得到所述天气数据;以及基于寒暑假因子得到所述寒暑假数据,其中,所述天气数据还包括最高气温以及最低气温。

需要说明的是,于本实施例中,所述参考数据需要用户输入,所以首先建立与预设用户端的通信连接以获取用户输入数据;

基于所述输入数据进行数据分析得到不同数据因子,从而基于不同的所述数据因子得到对应的参考数据,从而基于节假日因子得到所述节假日历史数据,以及基于天气因子得到所述天气数据,以及基于寒暑假因子得到所述寒暑假数据,以及基于政策因子得到所述防控政策数据,其中,所述天气数据还包括最高气温以及最低气温。

根据本发明实施例,所述基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,具体包括:

基于所述行动轨迹获取统计区域内的目标活跃用户;

基于所述目标活跃用户结合划分区域以及停留时长得到所述日游客用户其中,具体包括剔除统计区域内属于工作区域和/或居住区域的目标活跃用户;以及保留停留时长属于预设时间阈值范围的目标活跃用户。

需要说明的是,于本实施例中,由于公园设立在城市中央,周边会有居住区和/或工作区,所以需要结合行动轨迹以及停留时长来筛选目标活跃用户,所述目标活跃用户即对应于公园游客,具体地,基于所述目标活跃用户结合划分区域以及停留时长得到所述日游客用户其中,具体包括剔除统计区域内属于工作区域和/或居住区域的目标活跃用户;以及保留停留时长属于预设时间阈值范围的目标活跃用户,相应地,所述时间阈值范围可设为“30-480”分钟。

根据本发明实施例,所述方法还包括构建所述BP神经网络模型,具体包括:

获取训练数据集以及测试数据集;

建立BP神经网络初始回归模型,其中,所述BP神经网络初始回归模型包括BP反响传播和神经网络,所述神经网络中的神经元数量大于或者等于所述参考数据的数量值;

基于所述训练数据集对所述BP神经网络初始回归模型进行训练,其中,模型的激活函数采用ReLu函数,求解器采用1bfgs求解器;

基于预设迭代次数对初始回归模型进行迭代训练,并在每次训练结束后用测试数据集进行交叉验证以筛选得到所述BP神经网络模型。

需要说明的是,于本实施例中,基于训练数据集对BP神经网络回归模型进行训练,将建立的BP神经网络模型应用到训练、测试数据,得到模型评估结果。其中,由于BP神经网络具有随机性,每次运算的结果不一样,若保存当次训练模型,后续可以直接上传数据代入到当次训练模型进行计算预测以进行迭代训练,由于BP神经网络回归无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。具体地,对历史值建立BP神经网络模型,实现预测过程。具体实施步骤如下:由于是BP神经网络,其可以分为两个部分,BP和神经网络,其中,BP是 Back Propagation 的简写,意思是反向传播,BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程,它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,最主要的特点是:信号是正向传播的,而误差是反向传播的。

根据本发明实施例,所述方法还包括:对所述信令数据进行异常值修正以及缺失数据补充;以及基于参考数据中的假期政策类数据进行定类变量编码;以及将参考数据中除所述假期政策类数据之外的数据作归一化处理。

需要说明的是,于本实施例中,首先进行修正异常值和补充缺失数据,其中,对信令数据进行异常值修正以及缺失数据补充是本领域技术人员的常规技术手段,在此不做赘述,然后将双休节假日、寒暑假、以及防控政策数据作为定类变量编码,还要将最高气温、最低气温、天气数据进行归一化处理,本申请中归一化使用min-max标准化,作用是对原始数据的线性变换,使结果落到特定区间内,具体地,可以是[0,1]区间。

值得一提的是,本申请说明的BP神经网络模型中的每个神经元都接受来自其它神经元的输入信号,如图2所示,每个信号都通过一个带有权重的连接传递,神经元把这些信号加起来得到一个总输入值,然后将总输入值与神经元的阈值进行对比(模拟阈值电位),然后通过一个“激活函数”处理得到最终的输出(模拟细胞的激活),这个输出又会作为之后神经元的输入一层一层传递下去,其中输出为

表1 模型各项参数配置以及模型训练时长

需要说明的是,引入激活函数是为了增加神经网络模型的非线性能力。其中,本模型选择ReLu激活函数,求解器的目标是希望找到一组模型参数,使模型在所有训练数据上的平均损失最小,本模型选择lbfgs为求解器,其中,lbfgs在二阶泰勒展开式进行局部近似平均损失的基础上进行改进的,以降低了迭代过程中的存储量,加快收敛速率。

进一步地,关于学习率而言,合适的学习率能够使目标函数在合适的时间内收敛到局部最小值,学习率设置太小,结果收敛非常缓慢;学习率设置太大,结果在最优值附近徘徊,难以收敛,因此本模型学习率设置为“0.1”。而对于L2正则化项,由于L2范数容易得到平滑解,可以用来考虑降低过拟合,增加此值将增大惩罚,使模型更加保守,因此,本模型L2正则化项设置为“1”。而对于迭代次数,神经网络通过反向传播误差逐步更新权值,达到误差逐步收敛的目的,(每一次反向传播误差更新权值,都是一次迭代过程),因此,本模型迭代次数为“1000”,对于隐藏层,其中,隐藏层的意义就是把输入数据的特征,抽象到另一个维度空间,来展现其更抽象化的特征。一般来说,一或两层的隐藏层已经能够解决很多问题了,如果数据量多,可以在防止出现过拟合的情况下适当的增加层数。而隐藏层数量也要适当,一般来说,隐藏层的节点数必须小于n-1,其中n是训练样本数量,通过训练和调整,本模型隐藏层神经元数量选择为“20”。进一步对,对于交叉验证,其中,k折交叉验证将数据集划分为k个大小相似的互斥子集,每次用k-1个子集的并集作为训练集,剩下的那一个子集作测试集,进行k次训练和测试,最后返回k个评估结果的均值,可以避免由于数据集划分不合理而导致的在训练集上过拟合问题。

表2中展示了训练集和测试集的预测评价指标,通过量化指标来衡量BP神经网络回归的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。模型评估结果如下:

表2 模型评估结果

如图3所示,展示了BP神经网络对测试数据的预测情况,其中,对历史日游客量和双休日、节假日、寒暑假、最高气温、最低气温、天气、防控政策七类影响因子,建立BP神经网络模型,实现日游客预测,可以有效地避免公园景区交通拥堵。

图4示出了本发明一种基于BP神经网络模型的公园日游客流量预测系统的框图。

如图4所示,本发明公开了一种基于BP神经网络模型的公园日游客流量预测系统,包括存储器和处理器,所述存储器中包括基于BP神经网络模型的公园日游客流量预测方法程序,所述基于BP神经网络模型的公园日游客流量预测方法程序被所述处理器执行时实现如下步骤:

采集用户信令数据以及参考数据,基于所述信令数据得到用户对应的行动轨迹,所述参考数据至少包括节假日历史数据、天气数据以及寒暑假数据;

基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,其中,预设划分区域用户至少包括工作区域用户、居住区域用户;

基于所述日游客用户利用训练好的BP神经网络模型进行测试得到预测结果,从而基于所述预测结果反馈给用户端。

需要说明的是,于本实施例中,本申请目的在于根据手机信令信息反映在连续时间段内,不同时间点手机用户所在的空间位置,从而可以计算出某个特定公园的日游客数据,根据这些日游客历史值,并结合这一连续时间段对应的期的双休节假日、寒暑假、最高气温、最低气温、天气、防控政策等数据,建立对应的BP神经网络模型,来预测未来一定时期的日游客数,以帮助管理公园的运营,具体地,首先采集用户信令数据得到用户的行动轨迹,以及采集参考数据,相应地,所述参考数据即包括节假日历史数据、天气数据、寒暑假数据以及防控政策数据,其中,天气数据相应地也包括了最高气温和最低气温等数据,而后基于所述行动轨迹结合不同的划分区域以及停留时长进行识别,从而区分开工作区域用户以及居住区域用户,在停留时长满足时间跨度要求的信令数据中得到日游客用户,而后基于日游客数据利用训练好的BP神经网络模型进行测试得到预测结果,从而预测下一时间段的游客预测结果,以反馈给用户端(公园管理者)进行参考,帮助其可以在人流量高峰来临之前提前得知人流量高峰,从而避免公园或者绿地景区拥堵。

根据本发明实施例,所述基于所述信令数据得到用户对应的行动轨迹,具体包括:

基于预设运营商的信令数据获取划分区域内的用户识别码的基站扇信息,所述基站扇信息包括扇区位置信息以及进出扇区时间信息;

基于用户实时轨迹信息接入预设订阅系统结合用户对应的信令数据得到所述行动轨迹。

需要说明的是,于本实施例中,预设运营商可以包括市场已存在的运营商,从而利用运营商的信令数据,在每个规范后的区域内,对每个用户识别码(IMSI,InternationalMobile Subscriber Identity)所有发生切换的基站扇区信息,其包括扇区位置、进出扇区时间信息进行采集,针对获取手机用户实时轨迹的信息,使用Spark Streaming接入Kafka消息系统订阅实时信令数据,以获取手机用户每天对应的行动轨迹。

根据本发明实施例,采集参考数据,具体包括:

建立与预设用户端的通信连接以获取用户输入数据;

基于所述输入数据进行数据分析得到不同数据因子,从而基于不同的所述数据因子得到对应的参考数据,其中,

基于节假日因子得到所述节假日历史数据;以及基于天气因子得到所述天气数据;以及基于寒暑假因子得到所述寒暑假数据,其中,所述天气数据还包括最高气温以及最低气温。

需要说明的是,于本实施例中,所述参考数据需要用户输入,所以首先建立与预设用户端的通信连接以获取用户输入数据;

基于所述输入数据进行数据分析得到不同数据因子,从而基于不同的所述数据因子得到对应的参考数据,从而基于节假日因子得到所述节假日历史数据,以及基于天气因子得到所述天气数据,以及基于寒暑假因子得到所述寒暑假数据,以及基于政策因子得到所述防控政策数据,其中,所述天气数据还包括最高气温以及最低气温。

根据本发明实施例,所述基于所述行动轨迹结合预设划分区域用户以及停留时长得到日游客用户,具体包括:

基于所述行动轨迹获取统计区域内的目标活跃用户;

基于所述目标活跃用户结合划分区域以及停留时长得到所述日游客用户其中,具体包括剔除统计区域内属于工作区域和/或居住区域的目标活跃用户;以及保留停留时长属于预设时间阈值范围的目标活跃用户。

需要说明的是,于本实施例中,由于公园设立在城市中央,周边会有居住区和/或工作区,所以需要结合行动轨迹以及停留时长来筛选目标活跃用户,所述目标活跃用户即对应于公园游客,具体地,基于所述目标活跃用户结合划分区域以及停留时长得到所述日游客用户其中,具体包括剔除统计区域内属于工作区域和/或居住区域的目标活跃用户;以及保留停留时长属于预设时间阈值范围的目标活跃用户,相应地,所述时间阈值范围可设为“30-480”分钟。

根据本发明实施例,所述方法还包括构建所述BP神经网络模型,具体包括:

获取训练数据集以及测试数据集;

建立BP神经网络初始回归模型,其中,所述BP神经网络初始回归模型包括BP反响传播和神经网络,所述神经网络中的神经元数量大于或者等于所述参考数据的数量值;

基于所述训练数据集对所述BP神经网络初始回归模型进行训练,其中,模型的激活函数采用ReLu函数,求解器采用1bfgs求解器;

基于预设迭代次数对初始回归模型进行迭代训练,并在每次训练结束后用测试数据集进行交叉验证以筛选得到所述BP神经网络模型。

需要说明的是,于本实施例中,基于训练数据集对BP神经网络回归模型进行训练,将建立的BP神经网络模型应用到训练、测试数据,得到模型评估结果。其中,由于BP神经网络具有随机性,每次运算的结果不一样,若保存当次训练模型,后续可以直接上传数据代入到当次训练模型进行计算预测以进行迭代训练,由于BP神经网络回归无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。具体地,对历史值建立BP神经网络模型,实现预测过程。具体实施步骤如下:由于是BP神经网络,其可以分为两个部分,BP和神经网络,其中,BP是 Back Propagation 的简写,意思是反向传播,BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程,它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,最主要的特点是:信号是正向传播的,而误差是反向传播的。

根据本发明实施例,所述方法还包括:对所述信令数据进行异常值修正以及缺失数据补充;以及基于参考数据中的假期政策类数据进行定类变量编码;以及将参考数据中除所述假期政策类数据之外的数据作归一化处理。

需要说明的是,于本实施例中,首先进行修正异常值和补充缺失数据,其中,对信令数据进行异常值修正以及缺失数据补充是本领域技术人员的常规技术手段,在此不做赘述,然后将双休节假日、寒暑假、以及防控政策数据作为定类变量编码,还要将最高气温、最低气温、天气数据进行归一化处理,本申请中归一化使用min-max标准化,作用是对原始数据的线性变换,使结果落到特定区间内,具体地,可以是[0,1]区间。

值得一提的是,本申请说明的BP神经网络模型中的每个神经元都接受来自其它神经元的输入信号,如图2所示,每个信号都通过一个带有权重的连接传递,神经元把这些信号加起来得到一个总输入值,然后将总输入值与神经元的阈值进行对比(模拟阈值电位),然后通过一个“激活函数”处理得到最终的输出(模拟细胞的激活),这个输出又会作为之后神经元的输入一层一层传递下去,其中输出为

表1 模型各项参数配置以及模型训练时长

需要说明的是,引入激活函数是为了增加神经网络模型的非线性能力。其中,本模型选择ReLu激活函数,求解器的目标是希望找到一组模型参数,使模型在所有训练数据上的平均损失最小,本模型选择lbfgs为求解器,其中,lbfgs在二阶泰勒展开式进行局部近似平均损失的基础上进行改进的,以降低了迭代过程中的存储量,加快收敛速率。

进一步地,关于学习率而言,合适的学习率能够使目标函数在合适的时间内收敛到局部最小值,学习率设置太小,结果收敛非常缓慢;学习率设置太大,结果在最优值附近徘徊,难以收敛,因此本模型学习率设置为“0.1”。而对于L2正则化项,由于L2范数容易得到平滑解,可以用来考虑降低过拟合,增加此值将增大惩罚,使模型更加保守,因此,本模型L2正则化项设置为“1”。而对于迭代次数,神经网络通过反向传播误差逐步更新权值,达到误差逐步收敛的目的,(每一次反向传播误差更新权值,都是一次迭代过程),因此,本模型迭代次数为“1000”,对于隐藏层,其中,隐藏层的意义就是把输入数据的特征,抽象到另一个维度空间,来展现其更抽象化的特征。一般来说,一或两层的隐藏层已经能够解决很多问题了,如果数据量多,可以在防止出现过拟合的情况下适当的增加层数。而隐藏层数量也要适当,一般来说,隐藏层的节点数必须小于n-1,其中n是训练样本数量,通过训练和调整,本模型隐藏层神经元数量选择为“20”。进一步对,对于交叉验证,其中,k折交叉验证将数据集划分为k个大小相似的互斥子集,每次用k-1个子集的并集作为训练集,剩下的那一个子集作测试集,进行k次训练和测试,最后返回k个评估结果的均值,可以避免由于数据集划分不合理而导致的在训练集上过拟合问题。

表2中展示了训练集和测试集的预测评价指标,通过量化指标来衡量BP神经网络回归的预测效果,其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。模型评估结果如下:

表2 模型评估结果

如图3所示,展示了BP神经网络对测试数据的预测情况,其中,对历史日游客量和双休日、节假日、寒暑假、最高气温、最低气温、天气、防控政策七类影响因子,建立BP神经网络模型,实现日游客预测,可以有效地避免公园景区交通拥堵。

本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于BP神经网络模型的公园日游客流量预测方法程序,所述基于BP神经网络模型的公园日游客流量预测方法程序被处理器执行时,实现如上述任一项所述的一种基于BP神经网络模型的公园日游客流量预测方法的步骤。

本发明公开的一种基于BP神经网络模型的公园日游客流量预测方法与系统,通过手机信令数据计算出公园范围内的历史日游客数据,结合影响公园游客量的多个因素,包含自然、社会经济等多种因素建立BP神经网络模型,可以用于在人流量高峰来临之前提前预测出人流量高峰,避免公园或者绿地景区拥堵。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

相关技术
  • 一种大型主题公园日客流量预测方法及系统
  • 一种基于BP神经网络模型的故障预测方法及预测系统
技术分类

06120116487728