掌桥专利:专业的专利平台
掌桥专利
首页

一种水果价格预测方法

文献发布时间:2023-06-19 11:29:13


一种水果价格预测方法

技术领域

本发明涉及人工智能技术领域,具体地说是一种水果价格预测方法。

背景技术

经过近几十年的发展,我国已成为世界第一苹果生产大国,苹果已成为我国的第一大水果,苹果产业也成为主产区农民增收致富的支柱产业。随着产业规模的逐步扩大,苹果产业供给侧出现了许多新情况新问题,主要表现在:总量供过于求与结构性供给不足并存,投入要素结构不合理、生产成本持续增加,市场价格波动也较大、滞销难卖时有发生,时常造成增产不增收,各类风险集聚交织、持续健康发展压力不断加大等问题。其销售价格关乎果农、消费者以及各苹果链条内人员的切身利益。

发明内容

本发明的技术任务是针对以上不足之处,提供一种水果价格预测方法,结合人工智能,实现对苹果/水果未来价格的预测,从而帮助政府更好的进行信息的精准推送,为决策者、消费者和果品加工企业提供参考,为果农提供渠道。

本发明解决其技术问题所采用的技术方案是:

一种水果价格预测方法,该方法利用LSTM模型,结合影响某一种或多种水果价格因素的各个因子,对数据进行采集、清洗和处理;建立该水果的价格预测模型,通过对该种水果相关数据的挖掘与分析,进行模型训练和参数调优,实现价格预测;

该方法的实现包括数据采集、数据处理、模型构建、模型训练、误差评价以及价格预测,其中模型构建基于LSTM构建模型。

该方法能够实现优化生产投入要素、产销精准对接和价格预警等,以此推动水果产业供给侧结构性改革,提升水果产业质量效益和竞争力,促进农业农村数字经济发展。

优选的,所述数据的采集除该水果本身的相关数据,还同步采集其竞品价格数据的周、月、年价格相关数据。

相关数据包括该水果的历史价格、产量、消费量、GDP总量和增长率、主要竞品产量和价格、中国人口结构变化情况、该水果冷库储藏价格和数量、国内物流运输成本以及与苹果相关的自然灾害数据、居民消费价格指数CPI等因素,通过爬取国家、行业相关网站公开信息,查找科技文献、统计年鉴等渠道,采集到这些数据。

优选的,采集的所述竞品种类为5类;

所述水果为苹果,所述竞品种类包括香梨、香蕉、西瓜、葡萄和哈密瓜。

进一步的,对采集的数据进行数据规范化处理后,进一步进行降维处理;对相关因素进行典型相关分析,得出各维数据与待预测水果价格的相关度。

数据规范化处理包括格式统一、字典替换、空值处理等,同时还要对各类数据通过分析以及趋势图展示等手段发现异常数据值,对个别异常数据值采取平均替换或者去除等方式进行人工干预处理。

在此基础上,主要考虑常见的苹果竞品有香梨、香蕉、西瓜、葡萄、哈密瓜等五类水果,并对这五类数据过的价格进行整理和简单计算,得到其周、月、年价格。

由于维度过高并不能保证准确率的同步提高,但数据降维可加速模型训练与计算,舍弃掉相关性并不强或负相关的因素,可以进一步提高预测准确性,故对数据规范化处理后的数据进行进一步的降维处理。

优选的,所述模型构建,将已处理完成的规范化数据集分为训练集和测试集,然后搭建LSTM神经网络结构,并根据相关误差进行参数调整;

将数据集划分为监督学习的多变量输入,确定对应的网络结构;采用的模型结构为多输入、单输出,以便更好的实现多维多步预测,利用多维多步预测的方法实现水果价格的预测。

主要模型搭建具体是两层LSTM与一层Dense输出,输出维度设置为 train_y.shape,搭建完成后,开始模型的训练和调优。

优选的,数据集的划分尽可能的确保它们来自相同的分布,训练集与测试集的比例划分按照7:3的比例进行,然后在训练集中再进行验证集的划分,验证集的划分采用交叉验证的方式;

一旦确定了数据集的划分,就能够专注于提高算法的性能;如果能够保证三者来自相同的分布,对于后续的问题定位也会有着极大的意义;

数据集划分后,使用默认的超参数设置,通过观察loss的变化,初步定下各个超参数的范围,再进行调参。对于每个超参数,在每次的调整时,不断去调整一个参数,根据loss图像与预测结果值去逐个调整。

优选的,采用均方误差作为基本标准进行误差评价,使用默认的参数设置,通过观察趋势图的变化,初步定下各个参数的范围,然后不断运行,并不断进行参数调整,直到预测值和实际值落到允许的误差范围内。

模型构建完成后,在训练过程中,需要不断对参数进行调整,在参数调整前,需要先确定评估算法准确性的指标,这样我们才能有依据进行参数调整和确定调整目标,在这里采用均方误差(RMSE)作为基本标准。

进一步的,各参数经过优化调整确定后,我们取到的最优LSTM模型均为多维单步预测,因此对于苹果价格预测选择多维单步的LSTM模型预测。模型构建和训练完成后,依据输入的数据集,得出未来一天、一周、一月和一年的待预测水果的销售价格。

本发明还要求保护一种水果价格预测装置,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行上述的方法。

本发明还要求保护一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述的方法。

本发明的一种水果价格预测方法与现有技术相比,具有以下有益效果:

本方法可为政府决策者、果农、消费者以及待预测水果全产业链条上的各环节人员提供参考依据;

本方法在数据智能分析领域具有通用和创新性,各项目可根据自身数据整合情况和选取参数,即可以按照上述方法实现模型建立。

附图说明

图1是本发明实施例提供的苹果价格预测方法实现流程图;

图2是本发明实施例提供的灾害相关因素的相关性分析示例图;

图3是本发明实施例提供的苹果日价格预测结果和实际价格对比示例图;

图4是本发明实施例提供的苹果周价格预测结果和实际价格对比示例图;

图5是本发明实施例提供的苹果月价格预测结果和实际价格对比示例图;

图6是本发明实施例提供的苹果年价格预测结果和实际价格对比示例图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。

近年我国积累了大量的苹果信息资源,苹果产业信息化在深度融合发展,产业信息化水平日趋完善,再加上人工智能技术的飞速发展,为苹果价格的预测提供了数据和技术支撑。

以云计算、大数据和人工智能等为代表的新一代信息技术与苹果全产业链条数据的深度融合,对结构化和非结构化数据的深度挖掘,提供模型算法,对苹果的价格进行科学预测成为可能。

实际影响苹果未来价格的因素有很多,比如苹果历史价格、苹果产量、苹果需求量、GDP、竞品价格和产量、人口变化数据、苹果冷库储藏价格和数量、国内物流运输价格数据、与苹果相关自然灾害数据、居民消费价格指数CPI等,因此需要对这些数据进行充分采集和预处理,根据收集到的苹果批发价格历史数据整体来看,除去2019年春夏价格过高,其余时间均维持在6-8元之间,可以认为19年价格有偶然因素,而苹果价格数据在2019年夏天有一个明显突变,序列不平稳,无法使用ARIMA模型进行预测,实验论证后选用LSTM模型预测苹果价格,该模型能够很好的实现对苹果未来价格的预测。

LSTM是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题,相比普通的RNN,LSTM能够在更长的序列中有更好的表现。

本发明实施例提供一种水果价格预测方法,该方法利用LSTM模型,结合影响某一种或多种水果价格因素的各个因子,对数据进行采集、清洗和处理;建立该水果的价格预测模型,通过对该种水果相关数据的挖掘与分析,进行模型训练和参数调优,实现价格预测。

本实施例以苹果为例,通过苹果相关数据的挖掘与分析,实现优化生产投入要素、产销精准对接和价格预警等,以此推动苹果产业供给侧结构性改革,提升苹果产业质量效益和竞争力,促进农业农村数字经济发展。

该方法的实现包括数据采集、数据处理、模型构建、模型训练、误差评价以及价格预测。

数据采集:

考虑到可能会影响到苹果价格的相关因素,本次主要考虑苹果历史价格、苹果产量、苹果消费量、GDP总量和增长率、主要竞品产量和价格、中国人口结构变化情况、苹果冷库储藏价格和数量、国内物流运输成本以及与苹果相关的自然灾害数据、居民消费价格指数CPI等因素,通过爬取国家、行业相关网站公开信息,查找科技文献、统计年鉴等渠道,采集到这些数据;在完成苹果本身相关的数据之外,还要同步采集5类竞品价格数据的周、月、年价格相关数据,5类竞品包括香梨、香蕉、西瓜、葡萄、哈密瓜。

数据处理:

对于通过各种途径和采集方式获取到的数据首先需要对其进行清洗和规范化整理,主要包括格式统一、字典替换、空值处理等,同时还要对各类数据通过分析以及趋势图展示等手段发现异常数据值,对个别异常数据值采取平均替换或者去除等方式进行人工干预处理。在此基础上,主要考虑常见的苹果竞品有香梨、香蕉、西瓜、葡萄、哈密瓜等五类水果,并对这五类数据过的价格进行整理和简单计算,得到其周、月、年价格。

数据规范化处理之后,需要对这些数据进行进一步的降维处理,因为维度过高并不能保证准确率的同步提高,但数据降维可加速模型训练与计算,舍弃掉相关性并不强或负相关的因素,可以进一步提高预测准确性。

如图1所示,首先对受灾相关因素进行典型相关分析,根据处理结果可发现,所有的受灾数据均为负相关,即收集的这几维受灾数据对苹果价格影响很低,故舍弃;将总受灾面积依旧加入其中进行分析,但依然得负相关,可以完全舍弃受灾数据。从图中相关性我们可以得出苹果价格相关度从高到低的排列。

模型构建:

根据LSTM原理,模型构建主要分为三个步骤,首先将已处理完成的规范化数据集分为训练集和测试集,然后搭建LSTM神经网络结构,最后根据相关误差进行参数调整;

将数据集划分为监督学习的多变量输入,确定对应的网络结构,当前采用的模型都是多输入,单输出,以便更好的实现多维多步预测,主要模型搭建具体是两层LSTM与一层Dense输出,输出维度设置为train_y.shape,搭建完成后,开始模型的训练和调优。

模型训练:数据集的划分尽可能的确保它们来自相同的分布,并且训练集与测试集的划分按照7:3的比例进行,然后在训练集中再进行验证集的划分,验证集的划分采用交叉验证的方式;一旦确定了数据集的划分,就能够专注于提高算法的性能。如果能够保证三者来自相同的分布,对于后续的问题定位也会有着极大的意义;

数据集划分后,考虑到数据的输入输出LSTM模型所需数据集划分完成和模型搭建好之后,使用默认的超参数设置,通过观察loss的变化,初步定下各个超参数的范围,再进行调参。对于每个超参数,在每次的调整时,不断去调整一个参数,根据loss图像与预测结果值去逐个调整,对于loss的变化情况,主要有以下几种可能性:上升、下降、不变,对应的数据集有train与val (validation),那么进行组合有如下的可能:

train loss不断下降,val loss不断下降——网络仍在学习;

train loss不断下降,val loss不断上升——网络过拟合;

train loss不断下降,val loss趋于不变——网络欠拟合;

train loss趋于不变,val loss趋于不变——网络陷入瓶颈;

train loss不断上升,val loss不断上升——网络结构问题;

train loss不断上升,val loss不断下降——数据集有问题。

其余的情况,可归咎于网络结构不合理与数据集有误。另外,在调整参数时还通过调整输入时间步、神经元网络数、重复次数等参数,不断调整修改这些参数值,使模型达到最优。

误差评价:

模型构建完成后,在训练过程中,需要不断对参数进行调整,在参数调整前,需要先确定评估算法准确性的指标,这样我们才能有依据进行参数调整和确定调整目标,在这里采用均方误差(RMSE)作为基本标准,而后使用默认的参数设置,通过观察趋势图的变化,初步定下各个参数的范围,然后不断运行,不断进行参数调整,直到预测值和实际值落到我们允许的误差范围内。

价格预测:

各参数经过优化调整确定后,我们取到的最优LSTM模型均为多维单步预测,因此对于苹果价格预测选择多维单步的LSTM模型预测,模型构建和训练完成后,依据输入的数据集,得出未来一天、一周、一月和一年的苹果销售价格。其中:

日价格预测:

输入数据:苹果价格、香梨价格、香蕉价格、巨峰葡萄价格、苹果消费量(万吨)、梨产量(万吨)、苹果园面积(千公顷);

输出数据:苹果日价格预测值。

周价格预测:

输入数据:苹果价格、香梨价格、香蕉价格、巨峰葡萄价格、苹果消费量(万吨)、苹果产量(万吨)、经济因素;

输出数据:苹果周价格预测值。

月价格预测:

输入数据:苹果价格、香梨价格、香蕉价格、巨峰葡萄价格、苹果消费量(万吨)、苹果产量(万吨)、经济因素;

输出数据:苹果月价格预测值。

年价格预测:

输入数据:苹果价格、香梨价格、香蕉价格、巨峰葡萄价格、苹果消费量(万吨)、苹果产量(万吨)、经济因素;

输出数据:苹果年价格预测值。

本方法在现有苹果全产业链数据资源体系的基础上,结合人工智能技术,实现对苹果未来价格的预测,从而帮助政府更好进行信息的精准推送,让更多的果农不仅能种出优质的苹果,也能通过各种渠道让苹果卖个好价钱,实现丰产丰收,同时也为决策者、消费者和果品加工企业提供参考。

本发明实施例还提供了水果价格预测方法装置,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行本发明上述实施例中所述的水果价格预测方法。

本发明实施例还提供了一种计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明上述实施例中所述的水果价格预测方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如 CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。

此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。

此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。

上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

相关技术
  • 一种水果价格预测方法
  • 一种气源埋藏深度预测方法与煤成气成熟度预测方法
技术分类

06120112939980