掌桥专利:专业的专利平台
掌桥专利
首页

一种基于时间序列分析的城市迁移指数分析预测方法

文献发布时间:2024-01-17 01:26:37


一种基于时间序列分析的城市迁移指数分析预测方法

技术领域

本发明涉及动态人员人口迁移行为预测技术领域,尤其涉及一种基于时间序列分析的城市迁移指数分析预测方法。

背景技术

城市人口迁移指数是一种衡量城市人口迁移规模和趋势的指标,研究城市人口迁移指数的背景可以追溯到人类社会城市化的历史,随着人口增长和城市化进程的加速,城市人口迁移已经成为一个重要的社会现象,影响着城市的经济、社会和环境发展。

现有技术中,掌握实有人口基础信息、快递、铁路、航运、旅店、上海市统计局相关数据,需要一种基于时间序列分析,预测城市人口迁移指数的方法和模型,解决大城市面临的动态人员人口迁移行为预测的问题。

发明内容

本发明的目的在于,提供一种基于时间序列分析的城市迁移指数分析预测方法,解决以上技术问题;

一种基于时间序列分析的城市迁移指数分析预测方法,包括:

步骤S1,基于人口迁移数据库动态更新城市经济水平信息数据,将所述城市经济水平信息数据分为训练数据和测试数据,并作为初始数据;

步骤S2,对所述初始数据进行数据预处理得到不同维度的数据,并基于所述不同维度的数据得到迁入数据和迁出数据,基于所述迁入数据和迁出数据计算得到迁移指数;

步骤S3,对所述不同维度的数据进行特征提取,获得不同维度的特征数据;

步骤S4,基于所述特征数据的维度与所述迁移指数的相关性筛选可用维度;

步骤S5,通过残差序列方法进行平稳性检验,选定模型并进行拟合,得到时间序列模型;

步骤S6,对所述时间序列模型进行预测估计,得到预测迁移指数。

优选地,步骤S1中所述城市经济水平信息数据包括:就业数据、房屋租赁/房价数据、城市治安数据、生活成本数据。

优选地,所述就业数据包括新增就业岗位、全市就业人数、职工基本养老保险参保人数、求职人数、海内及海外的人才引进人数;

所述房屋租赁/房价数据包括全市住房租赁价格、新建商品住宅价格、二手住宅销售价格;

所述生活成本数据包括人均可支配收入,人均消费支出,居民消费价格指数。

优选地,步骤S2包括:

步骤S21,对所述初始数据进行校验处理,所述校验处理包括数据总量,非空数据量;

步骤S22,对校验后的数据进行异常数据剔除,得到剔除后的数据;

步骤S23,将剔除后的数据汇总到所有维度,通过所述迁入数据和迁出数据来计算所述迁移指数,计算式为:

迁移数据=(迁入人数-迁出人数)/总人数

优选地,步骤S4中通过计算所述特征数据的维度的各个维度值与指数的皮尔逊系数、卡方值和维度间的皮尔逊系数来筛选可用维度。

优选地,步骤S5包括:

步骤S51,模型特征根的倒数的模小于1,符合平稳性要求,再运用BG检验对所述残差序列的自相关性进行检验,判定所述残差序列存在自相关性;

步骤S52,通过计算得到所述模型的T统计量、F统计量伴随概率P值都大于5%,判定所述残差序列是平稳序列;

步骤S53,基于赤池信息量准则,判定所述平稳序列属于AR(p)、MA(q)、ARMA(p,q)模型,并确定阶数p,q;

步骤S54,对所述模型定阶,并且当q=2、p=2时,赤池信息量准则的值最小,选用ARMA(2,2)模型进行拟合,得到所述时间序列模型。

优选地,步骤S6中预测估计的区间为近一年的每月数据。

优选地,步骤S6之后还包括步骤S7,基于所述测试数据对所述时间序列模型进行检验。

本发明的有益效果是:由于采用以上技术方案,本发明建立了日常城市数据移入、移出机制,能动态管理人口迁入、迁出信息。

附图说明

图1是本发明的较佳的实施例中基于时间序列分析的城市迁移指数分析预测方法的示意图;

图2是本发明的较佳的实施例中特征提取模块的示意图;

图3是本发明的较佳的实施例中基于时间序列分析的城市迁移指数分析预测方法的步骤示意图;

图4是本发明的较佳的实施例中步骤S2的具体示意图;

图5是本发明的较佳的实施例中步骤S5的具体示意图。

附图中:1、城市经济水平信息数据;11、就业数据;12、房屋租赁/房价数据;13、城市治安数据;14、生活成本数据;21、训练数据;22、测试数据;3、数据预处理;4、特征提取模块;5、相关性检验;51、维度筛选;6构建模型;61、时间序列分析;7、预测迁移指数。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。

一种基于时间序列分析的城市迁移指数分析预测方法,如图1、图2、图3所示,包括:

步骤S1,基于人口迁移数据库动态更新城市经济水平信息数据1,将城市经济水平信息数据1分为训练数据21和测试数据22,并作为初始数据;

步骤S2,对初始数据进行数据预处理得到不同维度的数据,并基于不同维度的数据得到迁入数据和迁出数据,基于迁入数据和迁出数据计算得到迁移指数;

步骤S3,对不同维度的数据进行特征提取,获得不同维度的特征数据;

步骤S4,基于特征数据的维度与迁移指数的相关性筛选可用维度;

步骤S5,通过残差序列方法进行平稳性检验,选定模型并进行拟合,得到时间序列模型;

步骤S6,对时间序列模型进行预测估计,得到预测迁移指数7。

具体地,本发明提供了一种基于时间序列分析的城市迁移指数分析预测方法,主要应用于动态人员人口迁移行为预测,根据实时预测判定迁移指数,建立日常城市数据移入移出机制,动态管理相关迁入迁出信息。

进一步具体地,根据上海市统计局公开的统计数据构建而成的人口迁移专题库数据,从而构建人口迁移指标体系,城市经济水平信息数据1包括第一、二、三产业生产总值;批发零售、建筑业、交通运输仓储和邮政业、住宿和餐饮业、信息传输软件和信息技术服务业,金融业、房地产业、租赁和商业服务业等,经过数据预处理3之后,经过特征提取模块4,并进行相关性检验5,维度筛选51后,构建模型6并进行时间序列分析61,最后得到预测迁移指数7。

在一种较优的实施例中,步骤S1中城市经济水平信息数据1包括:就业数据11、房屋租赁/房价数据12、城市治安数据13、生活成本数据14。

在一种较优的实施例中,就业数据11包括新增就业岗位、全市就业人数、职工基本养老保险参保人数、求职人数、海内及海外的人才引进人数;

房屋租赁/房价数据12包括全市住房租赁价格、新建商品住宅价格、二手住宅销售价格;

生活成本数据14包括人均可支配收入,人均消费支出,居民消费价格指数。

在一种较优的实施例中,如图4所示,步骤S2包括:

步骤S21,对初始数据进行校验处理,校验处理包括数据总量,非空数据量;

步骤S22,对校验后的数据进行异常数据剔除,得到剔除后的数据;

步骤S23,将剔除后的数据汇总到所有维度,通过迁入数据和迁出数据来计算迁移指数,计算式为:

迁移数据=(迁入人数-迁出人数)/总人数

具体地,梳理人员特征,按月圈定近5年上海市的相关维度特征数据,为以消除因量纲不同对评价结果的影响,例如:人均可支配收入6.45万元,上海市城镇新增就业377000人,为避免部分数据起到主导作用从而遮盖住其他的特征,归一化后就不会有这样的问题;选取Min-Max归一化对原始数据的线性变换,使结果值映射到[0-1]之间,把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行统计和计算。

在一种较优的实施例中,步骤S4中通过计算特征数据的维度的各个维度值与指数的皮尔逊系数、卡方值和维度间的皮尔逊系数来进行维度筛选51。

具体地,从特征维度与迁移指数的关系出发,通过计算维度与指标的相关性(各维度值与指数的皮尔逊系数、卡方值)和维度间的相关性(维度之间的皮尔逊系数)筛选可用维度,若皮尔逊系数的p值小于0.05,有95%的把握可以拒绝原假设H0:两变量间不存在线性关联,即两变量间存在线性关系;若表中p值大于等于0.05,则接受原假设,即两变量间不存在线性关联;如:计算平均养老金和迁移指数间的相关性以及计算平均养老金和步骤S3中其他29个指标的相关性,通过计算相关性对数据特征进行初步筛选。

在一种较优的实施例中,如图5所示,步骤S5包括:

步骤S51,模型特征根的倒数的模小于1,符合平稳性要求,再运用BG检验对残差序列的自相关性进行检验,判定残差序列存在自相关性;

步骤S52,通过计算模型的T统计量、F统计量伴随概率P值都大于5%,判定残差序列是平稳序列;

步骤S53,利用赤池信息量准则,判定平稳序列属于AR(p)、MA(q)、ARMA(p,q)模型,并确定阶数p,q;

步骤S54,对模型定阶,通过比较得到当q=2、p=2时,赤池信息量准则的值最小,选用ARMA(2,2)模型进行拟合,得到时间序列模型。

具体地,对模型进行平稳性检验,选择ADF进行平稳性检验,原假设是该时间序列是非平稳的,由于计算出的模型特征根的倒数的模小于1,说明时间序列的单位根系数的绝对值小于1,即满足平稳性的条件,时间序列平稳,再运用BG检验对残差序列的自相关性进行检验,检验时间序列的残差是否存在自相关性,若存在,则时间序列非平稳;计算得到的模型的T统计量、F统计量伴随概率P值均大于5%,结果得出残差序列是平稳序列。

进一步具体地,利用AIC准则,判断该序列是属于AR(p)、MA(q)、ARMA(p,q)模型,并确定自回归模型的阶数p和移动平均模型的阶数q,选择AIC值最小的模型作为最佳模型,实验结果表明,通过比较当q=2、p=2时,AIC值最小,即选用ARMA(2,2)模型进行拟合。

在一种较优的实施例中,使用ARMA模型对未来的时间序列进行预测,通过给定历史观测值,使用ARMA模型的数学公式计算未来时刻的预测值,步骤S6中预测估计的区间为近一年的每月数据,步骤S6之后还包括步骤S7,基于测试数据对时间序列模型进行检验,综合分析可得,自2022年起模型拟合效果较为明显,对拟合的图形进行数值分析,模型的预测精度较高。

综上,本申请提供了一种基于时间序列分析的城市迁移指数分析预测方法,深入了解人口迁移的原因和影响,为城市规划、经济发展、社会政策制定等提供依据和参考,本发明利用实有人口基础信息、快递、铁路、航运、旅店、上海市统计局相关数据,辅以统计学方法选取样本,再基于时间序列分析预测人口迁移指数,实时预测判定迁移指数,建立日常城市数据移入移出机制,动态管理相关迁入迁出信息,探索人口迁移指数指标的主要影响因素,有助于人口资源的存量盘整、精准投入,促使社会决策支持力提质增量,模型采用的变量易于量化收集,便于城市间推广使用及横向对比,可为大型人口城市的社会决策制定及人口预测提供一定的参考。

以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

相关技术
  • 一种城市健康指数预测系统、预测分析方法及其存储介质
  • 一种基于大数据时间序列分析的磁盘容量预测系统及方法
技术分类

06120116218546