导航：首页> 生物化学；啤酒；烈性酒；果汁酒；醋；微生物学；酶学；突变或遗传工程>位置预测方法、装置、设备及存储介质

位置预测方法、装置、设备及存储介质

文献发布时间：2024-04-18 20:01:23

技术领域

本申请涉及预测技术领域，尤其涉及一种位置预测方法、装置、设备及存储介质。

背景技术

在烟草零售行业，部分商贩为获取更多的利润会贩卖仿制的烟草制品，即假烟。目前对于贩卖假烟的打击主要依赖于电话举报，即消费者购买到假烟后再电话举报，但这种依赖于举报的方法较为被动，获取假烟信息效率较低。

发明内容

本申请的主要目的在于提供一种位置预测方法、装置、设备及存储介质，旨在解决目前获取假烟信息效率较低的技术问题。

为实现上述目的，本申请提供一种位置预测方法，所述位置预测方法包括以下步骤：

对于仿制烟草制品调查数据集中的任意一份调查数据，从所述调查数据中提取仿制烟草制品的目标特征，其中，所述目标特征包括仿制烟草制品出现位置的位置特征、所述仿制烟草制品出现时间的时间特征以及所述仿制烟草制品的种类特征；

基于所述目标特征对各所述调查数据进行聚类处理，得到聚类结果；

基于所述聚类结果中各聚类族群的地理位置生成各目标位置。

可选地，所述从所述调查数据中提取仿制烟草制品的目标特征的步骤包括：

从所述调查数据中仿制烟草制品的出现位置的第一文本描述，提取所述位置特征；

从所述调查数据中仿制烟草制品的出现时间的第二文本描述，提取所述时间特征；

从所述调查数据中仿制烟草制品的品牌的第三文本描述，提取所述种类特征。

可选地，所述从所述调查数据中仿制烟草制品的出现位置的第一文本描述，提取所述位置特征的步骤包括：

若所述第一文本描述不为空，则从所述第一文本描述中提取所述位置特征；

若所述第一文本描述为空，则将所述调查数据生成时的位置信息作为所述位置特征，或者，将所述调查数据填写人员的住址信息作为所述位置特征。

可选地，所述基于所述目标特征对各所述调查数据进行聚类处理，得到聚类结果的步骤包括：

通过误差平方和确定所述聚类结果中族群的数量；

通过K均值聚类算法对各所述调查数据进行聚类，得到所述数量的聚类族群。

可选地，所述基于所述聚类结果中各聚类族群的地理位置生成各目标位置的步骤包括：

对于所述聚类结果中的任意一个聚类族群，提取所述聚类族群中各调查数据的位置特征得到族群位置特征集；

基于位置特征对所述族群位置特征集进行二次聚类，得到二次聚类族群；

将所述二次聚类族群的族群中心作为所述目标位置。

可选地，在所述基于所述聚类结果中各聚类族群的地理位置生成各目标位置的步骤之后，所述方法包括：

对于任意一个目标位置，获取所述目标位置周边预设范围内的烟草制品经营点；

将各烟草制品经营点的经营信息输入至预设风险估计模型，得到各所述烟草制品经营点的风险概率，其中，所述经营信息包括经营人员个人信息以及所述烟草制品流水信息；

将各所述烟草制品经营点和对应风险概率关联输出。

可选地，在所述将各烟草制品经营点的经营信息输入至预设风险估计模型的步骤之前，所述方法包括：

获取历史仿制烟草制品的第一贩卖记录集合和历史正常烟草制品的第二贩卖记录集合，其中，所述第一贩卖记录集合中第一贩卖记录的数量与所述第二贩卖记录集合中第二贩卖记录的数量相同；

基于所述第一贩卖记录集合和第二贩卖记录集合生成训练样本集，其中，所述训练样本集中任意一条训练样本由所述第一贩卖记录或所述第一贩卖记录所记载的经营信息构成，且所述训练样本的标签为正常或仿制；

通过所述训练样本集对所述预设风险估计模型进行训练更新。

此外，为实现上述目的，本申请还提供一种位置预测装置，所述位置预测装置包括：

提取模块，用于对于仿制烟草制品调查数据集中的任意一份调查数据，从所述调查数据中提取仿制烟草制品的目标特征，其中，所述目标特征包括仿制烟草制品出现位置的位置特征、所述仿制烟草制品出现时间的时间特征以及所述仿制烟草制品的种类特征；

聚类模块，用于基于所述目标特征对各所述调查数据进行聚类处理，得到聚类结果；

生成模块，用于基于所述聚类结果中各聚类族群的地理位置生成各目标位置。

此外，为实现上述目的，本申请还提供一种位置预测设备，所述位置预测设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的位置预测程序，所述位置预测程序被所述处理器执行时实现上述的位置预测方法的步骤。

此外，为实现上述目的，本申请还提供一种存储介质，所述可读存储介质为计算机可读存储介质，所述可储介质上存储有位置预测程序，所述位置预测程序被处理器执行时实现如上述的位置预测方法的步骤。

本申请实施例提出的一种位置预测方法、装置、设备及存储介质。在本实施例中，对于仿制烟草制品调查数据集中的任意一份调查数据，从所述调查数据中提取仿制烟草制品的目标特征，其中，所述目标特征包括仿制烟草制品出现位置的位置特征、所述仿制烟草制品出现时间的时间特征以及所述仿制烟草制品的种类特征；基于所述目标特征对各所述调查数据进行聚类处理，得到聚类结果；基于所述聚类结果中各聚类族群的地理位置生成各目标位置。也即，本申请实施例，将从仿制烟草制品调查数据集中的各调查数据提取仿制烟草制品的目标特征，其中，目标特征包括位置特征、时间特征以及种类特征，通过这些目标特征可对调查数据进行聚类处理，得到聚类结果。其中，聚类结果中同一聚类族群的各调查数据所具有的目标特征较为相似，故可认为同一聚类族群的各调查数据所表征的仿制烟草制品信息来源于同一个源头，即同一个商铺。故根据各聚类族群的地理位置生成各目标位置后，目标位置可作为打击贩卖仿制烟草制品的参考信息。相比于传统的电话举报渠道，本申请综合调查数据生成可疑的目标位置作为参考，一方面可提高信息获取的主动性，另一方面，每批次的调查数据可得到多个目标位置，故也可提高信息的获取效率。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图；

图2为本申请位置预测方法的第一实施例的流程示意图；

图3为本申请位置预测方法中的第二实施例的流程示意图；

图4为本申请位置预测方法中的第三实施例的流程示意图；

图5为本申请位置预测装置的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请实施例的设备可以是服务器，也可以是智能手机、PC、平板电脑、便携计算机等电子终端设备。

如图1所示，该设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，设备还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。本领域技术人员可以理解，图1中示出的设备结构并不构成对设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本领域技术人员可以理解，图1中示出的设备结构并不构成对设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

此外，如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及位置预测程序。

在图1所示的设备中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接用户终端(用户端)，与用户终端进行数据通信；而处理器1001可以用于调用存储器1005中存储的位置预测程序，并执行以下操作：

基于所述目标特征对各所述调查数据进行聚类处理，得到聚类结果；

基于所述聚类结果中各聚类族群的地理位置生成各目标位置。