掌桥专利:专业的专利平台
掌桥专利
首页

基于虚拟齿轮的复杂关联数据生成方法

文献发布时间:2023-06-19 10:46:31


基于虚拟齿轮的复杂关联数据生成方法

技术领域

本发明涉及复杂关联数据生成方法,尤其涉及一种基于虚拟齿轮的复杂关联数据生成方法。

背景技术

随着电商产业的不断发展,电商数据源呈现出内容丰富化、结构复杂化的特点,在多种数据来源中,互联网是大数据时代下电商数据的主要来源,大数据时代下的电商数据在收集、存储和分析等方面与传统电商数据相比具有较大的差异。大数据通常具有各种各样的复杂形式,可能存在大量无关特征或冗余特征,以及复杂的、模糊的内在关联性,从复杂系统理论及方法的角度出发研究复杂的大数据分析,是获取大数据的整体特征、规律、机理的有效方法。

齿轮是现代制造业各种装备中的关键基础零部件,具有恒功率、高效率、传动比稳定等特点。齿轮传动在现代机械中有着不可替代的地位与作用,其广泛应用于现代制造业领域。

现有的对于具有复杂关联特性的互联网电商商品数据处理方法大多存在处理效率低的缺陷。

发明内容

发明目的:本发明的目的是提供一种将互联网电商商品的复杂关联数据映射到虚拟齿轮控件上的基于虚拟齿轮的复杂关联数据生成方法。

技术方案:本发明的复杂关联数据生成方法,根据对消费者数据和商品数据的汇总,通过对商品数据进行网络建模,然后映射到虚拟齿轮控件中,并通过设定虚拟齿轮控件的参数和属性,建立大量商品数据间的复杂关联属性,步骤如下:

(1)将消费者数据和商品数据传入数据提取任务中,进行汇总;

(2)对消费者数据通过特征提取、特征补充方法,进行数据规整,并按着不同的数据类型将消费者数据进行分组,形成多个消费者数据集;

(3)对商品数据进行相似性分析,将商品数据进行分类、汇总形成新的商品数据集,并构建商品数据相似性网络;

(4)对步骤(2)中的消费者数据进行相关性分析,确定多组数据的最小支持度,进行复杂关联商品数据网络模型的构建;

(5)将各种商品数据间的关联性比拟为各个机构间的连接齿轮,开发虚拟齿轮控件,通过对所述虚拟齿轮控件进行参数和属性设置,实现各类商品数据间的关联;

(6)根据步骤(4)中所构建的复杂关联商品数据网络模型,将商品数据本身以及商品数据之间的关联性映射到虚拟齿轮控件;

(7)对虚拟齿轮控件进行参数和属性设定,对齿轮的参数进行差异化处理,根据齿轮的正确啮合条件,得出连接边数大于等于阈值的节点。

进一步,步骤(3)中对所述商品数据进行相似性分析处理步骤如下:

(31) 分析商品数据特征,确定度量方法:根据商品中含有多个商品因素,采用标准欧式距离的度量方法,度量不同商品之间的关系;

(32)对商品数据进行相似性计算;将步骤(31)中计算得到的距离转换为相似性度量;

(33)通过设定阈值,去除不符合阈值要求的相似性关系;

(34)将商品数据建模为节点,将符合阈值标准的相似关系建模为边,将商品向量间相似程度表示为权,构建商品数据相似性网络。

进一步,步骤(4)中所述的复杂关联商品数据网络模型构建的步骤如下:

(41)进行各类数据间的相关性分析:对步骤(2)中收集、整理后的消费者数据信息进行相关性分析,通过求解相关系数研究数据间的依存关系,得到典型相关系数;

(42)确定多组数据同时出现会产生关联关系的最小支持度,过滤掉小于最小支持度的项目;

(43)基于各变量间的相关系数,建立变量关联网络;

(44)进行复杂关联商品数据中的关键节点探索。

进一步,所述复杂关联商品数据中的关键节点探索的具体处理步骤如下:

(a)删除相关系数比较小的关联,所述相关系数比较小的具体判断标准根据运行数据进行学习修正;

(b)将连接边数大于等于阈值的节点用不同的颜色突出标识。

进一步,步骤(5)中,采用虚拟齿轮控件实现各类商品数据间的关联,通过对控件进行参数和属性设置,选用构造虚拟渐开线标准直齿圆柱齿轮构件,对复杂关联商品数据进行分析。

进一步,步骤(6)中,将步骤(4)中得到的复杂关联商品数据网络模型中各节点映射为齿轮本身;各节点之间的相关线条,则映射为一对齿轮同时处于啮合的齿轮对数;相关线条越粗的线条,相关系数越强,其同时处于啮合的齿轮对数也越多;反之,则相关线条越细的线条,相关系数越弱,其同时处于啮合的齿轮对数也越少。

进一步,步骤(7)中,在进行完步骤(6)中的映射后,对齿轮的参数进行设定,根据 不同数据间的复杂性存在差异,对齿轮本身的参数进行差异化处理;根据一对渐开线标准 直齿圆柱齿轮的正确啮合条件以及

本发明与现有技术相比,其显著效果如下:1、将各种商品数据间的关联性比拟为各个机构间的连接齿轮,利用开发出的虚拟齿轮控件实现各类商品数据间的关联;2、通过对控件进行参数和属性设置,能方便地建立大量商品数据间的复杂关联属性,从而简化复杂关联数据的生成。

附图说明

图1为本发明的流程图。

具体实施方式

下面结合说明书附图和具体实施方式对本发明做进一步详细描述。

如图1所示为本发明的总流程图,详细步骤如下:

步骤1,创建数据提取任务。

根据历史数据,将一天的时间按照时间段划分,从0点开始每隔两小时将期间所售出的商品、消费者的年龄、性别、职业等数据进行汇总。

步骤2,消费者数据预处理。

根据步骤1中的数据提取任务所提取到的数据,采用数据挖掘中的特征提取、特征补充等方法,将时间段、年龄、性别、职业等消费者数据进行规整,并按照不同的数据类型将消费者数据进行分组,形成多个消费者数据集,并将特征提取后的数据,利用文字编码、语义编码、电子编码等编码方式拟定相应的编码,将编码数据进行相应的加密和译码的有效处理,用以抵御存在的外部风险。

步骤3,商品数据相似性分析。

相似性是度量数据间关系的一般性方法,对于给定复杂系统产生的商品数据集,不同商品间的关系可以通过计算这些商品对应的向量间的相似性进行建模。为了降低商品数据集复杂度,便于后续关联数据的研究,本发明从研究商品数据相似性入手,将商品数据量进行压缩,具体实现过程如下:

31)分析商品数据特征,确定度量方法。由于商品数量繁多,若利用全部的商品数据集去处理数据与数据之间的关系,数据处理的效率便会降低,于是本发明通过将商品进行相似性分析,将其分类,汇总成新的商品数据集,有效地提升精准程度。由于商品中含有多个商品因素,为了度量不同商品之间的关系,并以此为基础评价商品类型,本发明采用标准欧式距离的度量方法。

32)相似性计算。采用相似性的度量方法,计算所有商品数据向量间的距离,并将 计算得到的距离转换为相似性度量。假设商品中含有n个商品因素,为了消除商品因素量纲 的影响,采用标准化欧氏距离对商品向量的相似性进行分析。设商品A和商品B在同一段时 间T时的商品向量为

公式(1)中,n为商品向量长度,

33)设定阈值。通过设定阈值,去除不符合阈值要求的相似性关系,本发明将相似性阈值设置为商品相似度的最大值。

34)网络构建。将商品数据建模为节点,将符合阈值标准的相似关系建模为边,将商品向量间相似程度表示为权,构建商品相似性网络。

步骤4,进行复杂关联商品数据网络模型构建任务。

其具体步骤如下:

41)消费者数据间相关性分析。对步骤2中收集、整理后的消费者数据信息进行相关性分析,相关分析通过求解相关系数研究数据间的依存关系,一般的简单相关系数只是孤立考虑单个X变量组与单个Y变量组间的相关,没有考虑X、Y变量组内部各变量之间的相关。典型相关是简单相关、多重相关的推广。它是研究两组变量之间相关性的一种统计分析方法,也是一种降维技术。

达到最大。

公式(2)中,

求解得到的第一组关于

42)确定多组数据同时出现会产生关联关系的次数,即最小支持度,至少为3次,通过Apriori算法扫描频繁项集,过滤掉小于最小支持度的项目。

43)基于各变量间的相关系数,建立变量关联网络。其中网络节点为每个频繁项集,相关系数衡量节点间的紧密程度,相关系数越强,则相关线条越粗;反之,相关线条越细。

44)进行复杂关联商品数据中的关键节点探索,其具体处理如下:

(a)删除相关系数比较小的关联,所述相关系数的具体判断标准根据运行数据进行学习修正。

(b)将连接边数大于等于一定阈值(阈值的具体标准可根据更多的运行数据进行学习修正)的节点用不同的颜色突出标识。

依据关联规则构建的相关性复杂数据网络,描述为

步骤5,开发虚拟齿轮控件。

由于商品数据之间存在复杂的关联性,单纯地去实现复杂关联商品数据的生成便显得比较困难,本发明将各种商品数据间的关联性比拟为各个机构间的连接齿轮,利用基于ActiveX技术开发出的虚拟齿轮控件实现各类商品数据间的关联,通过对控件进行参数和属性设置,即可方便地建立大量商品数据间的复杂关联属性,从而简化复杂关联商品数据的生成。通过比对多种形式的齿轮构件,由于渐开线标准直齿圆柱齿轮属性与数据属性的契合度较高,故本发明通过构造虚拟渐开线标准直齿圆柱齿轮构件,对复杂关联商品数据进行分析。

步骤6,将步骤4中构建的复杂关联商品数据网络模型映射到虚拟齿轮控件中。

根据步骤4中所构建的复杂关联商品数据网络模型,将商品数据本身以及商品数据之间的关联性映射到步骤5中所开发的虚拟齿轮控件。

对抽象商品数据和虚拟齿轮进行特征提取,选取抽象商品数据特征集合定义为A, 虚拟齿轮特征定义为集合B,对于每一

其中复杂关联商品数据网络模型中的各节点映射为齿轮本身,至于商品数据之间的关联性,也即各节点之间的相关线条,则映射为一对齿轮同时处于啮合的齿轮对数,对于相关线条越粗的线条(相关系数越强),其同时处于啮合的齿轮对数也越多,反之,则相关线条越细的线条(相关系数越弱),其同时处于啮合的齿轮对数也越少,该映射的原因在于,齿轮的传动度与齿数有关,重合度越大,同时处于啮合的齿轮对数越多,传动越平稳,越能表现出齿轮与齿轮之间的关联紧凑度。

步骤7,对虚拟齿轮进行参数和属性的设定。

在进行完步骤6中的映射后,需要对齿轮的参数进行设定,由于不同商品数据间的 复杂性存在差异,故需要对齿轮本身的参数进行差异化处理,渐开线标准直齿圆柱齿轮的 参数包括齿数、模数、分度圆和压力角等,根据一对渐开线标准直齿圆柱齿轮的正确啮合条 件(两轮的模数相等,两轮的压力角相等)以及

在进行虚拟齿轮控件的安装时,无论采用标准安装还是非标准安装,虽然其中心距产生了变化,但由于基圆半径已是确定的,故齿轮的传动比是不变的,也即商品数据运行的稳定性得到了保障。

综上所述,本发明的基于虚拟齿轮的复杂关联数据处理方法,能够将复杂关联商品数据之间的关系简化为较为简单的齿轮传动之间的关系,使得商品数据的处理效率得到提升。

相关技术
  • 基于虚拟齿轮的复杂关联数据生成方法
  • 基于虚拟齿轮的复杂关联数据生成方法
技术分类

06120112669092