掌桥专利:专业的专利平台
掌桥专利
首页

改进KNN方法的电子元器件数据分类方法

文献发布时间:2023-06-19 16:03:19



技术领域

本发明涉及数据识别或者处理领域,且更确切地涉及一种改进KNN方法的电子元器件数据分类方法。

背景技术

电子元器件是电子元件和小型的机器、仪器的组成部分,其本身常由若干零件构成,可以在同类产品中通用;常指电器、无线电、仪表等工业的某些零件,是电容、晶体管、游丝、发条等电子器件的总称。常见的有二极管等。在具体示例性实施例中,电子元器件包括:电阻、电容、电感、电位器、电子管、散热器、机电元件、连接器、半导体分立器件、电声器件、激光器件、电子显示器件、光电器件、传感器、电源、开关、微特电机、电子变压器、继电器、印制电路板、集成电路、各类电路、压电、晶体、石英、陶瓷磁性材料、印刷电路用基材基板、电子功能工艺专用材料、电子胶(带)制品、电子化学材料及部品等。

电子元器件在应用过程中,通常需要对电子元器件数据类型进行分类,以将电子元器件通过不同的属性进行数据信息分类。比如按元件进行分类或者按器件进行分类以及每种大类中不同数据信息或者故障数据分析等,常规技术通常采用人工统计学的方法,这种方法不仅技术落后,还容易出错。还有采用统计学分析的方法,这种方法也会导致电子元器件数据分类困难,难以实现电子元器件数据分类,导致数据分析困难。

发明内容

针对上述技术的不足,本发明公开一种改进KNN方法的电子元器件数据分类方法,通过改进型KNN方法,能够大大提高电子元器件数据分类能力。

为了实现上述技术效果,本发明采用以下技术方案:

一种改进KNN方法的电子元器件数据分类方法,其中包括以下步骤:

步骤一:从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;

步骤二:通过评估模块对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;

步骤三:根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;对每个元器件数据信息距离进行排序,然后选择距离最小的K个点;

步骤四:对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。

作为本发明进一步的技术方案,电子元器件数据信息通过在CNN算法模型中加入降维数据模型实现数据信息降维处理;降维函数为:

公式(1)中,w

作为本发明进一步的技术方案,CNN算法模型包括图像分割模块,通过欧式距离公 式

公式(2)中,

作为本发明进一步的技术方案,kd树包括k维点的二叉树和数据信息搜索模块,其中所述数据信息搜索模块为最邻近搜索方法,用于找出在树中与输入点最接近点。

作为本发明进一步的技术方案,最邻近搜索方法搜索数据信息的过程为包括以下步骤:

步骤(一)、从kd树根节点开始,依次递归往下移动,当移动到叶节点时,将该节点当作当前最佳点;

步骤(二)、当前所在点比当前最佳点更靠近输入点,则将其变为当前最佳点;检查另一边子树有没有更近的点,如果有,则从该节点往下找,如果没有,则将该节点当作当前最佳点;

步骤(三)、当根节点搜索完毕后完成最邻近搜索。

作为本发明进一步的技术方案,数据更新模块包括数据更新主控模块以及与所述更新主控模块连接的数据输入模块、数据存储模块和数据输出模块。

作为本发明进一步的技术方案,数据更新主控模块为XC7Z035FFGH676-2的Cortex-A9处理器和FPGA控制器。

作为本发明进一步的技术方案,数据更新模块实现数据更新的方法为:

通过数据输入模块接收电子元器件数据信息,通过数据存储模块实现电子元器件数据信息的存储,通过数据输出模块实现电子元器件数据信息的输出,更新数据时,通过四分位法实现不同类型电子元器件数据信息的更新分类,通过多路选择器实现数据更新选择。

作为本发明进一步的技术方案,四分位数的计算按以下方式进行:

步骤1、对于电子元器件数据信息,更新数据信息记作为

公式(3)中,n表述电子元器件数据信息;

步骤2、同时算出第一四分位数

如果电子元器件数据量n为偶数的时候,将升序排列后的样本

如果电子元器件数据量

如果电子元器件数据量

通过上述过程计算出

依据四分位间距

公式(7)中,F1代表序列的下限值,F2代表序列的上限值,处于下限到上限范围以外的数据就是最近的更新数据。

本发明有益的积极效果在于:

区别于常规技术,本发明的目的提供一种改进KNN方法的电子元器件数据分类方法,通过步骤一能够从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;通过步骤二对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;通过步骤三能够根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;通过步骤四,能够对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图,其中:

图1为本发明总体架构示意图;

图2为本发明中CNN算法模型降维方式示意图;

图3为本发明中四分位原理示意图;

图4为本发明中四分位流程示意图;

图5为本发明中多路选择器原理示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。

如图1所示,一种改进KNN方法的电子元器件数据分类方法,包括以下步骤:

步骤一:如图1所示,从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;

步骤二:通过评估模块对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;

步骤三:根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;对每个元器件数据信息距离进行排序,然后选择距离最小的K个点;

步骤四:对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。

在具体实施例中,通过找到k个最近的邻居来做预测,那么只需要计算预测样本和所有训练集中的样本的距离,然后计算出最小的k个距离即可,接着多数表决,很容易做出预测。这个方法的确简单直接,在样本量少,样本特征少的时候有效。在KNN算法模型中,如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。

在上述步骤中,如图2所示,在步骤一中,电子元器件数据信息通过在CNN算法模型中加入降维数据模型实现数据信息降维处理;

原始数据信息包括图片、视频、WORD等多种不同形式的电子元器件数据信息,通过将获取的不同数据库信息进行初值化处理,并对数据信息进行加速收敛并减少拟合,实现数据信息的降维。降维函数为:

公式(1)中,w

在具体实施例中,通过降维数据模型实现数据信息降维处理,以提高电子元器件数据信息处理能力。

在步骤一中,CNN算法模型包括图像分割模块,通过欧式距离公式

公式(2)中,

在上述步骤二中,kd树包括k维点的二叉树和数据信息搜索模块,其中所述数据信息搜索模块为最邻近搜索方法,用于找出在树中与输入点最接近点。

最邻近搜索方法搜索数据信息的过程为包括以下步骤:

步骤(一)、从kd树根节点开始,依次递归往下移动,当移动到叶节点时,将该节点当作当前最佳点;

步骤(二)、当前所在点比当前最佳点更靠近输入点,则将其变为当前最佳点;检查另一边子树有没有更近的点,如果有,则从该节点往下找,如果没有,则将该节点当作当前最佳点;

步骤(三)、当根节点搜索完毕后完成最邻近搜索。

在上述实施例中,数据更新模块包括数据更新主控模块以及与所述更新主控模块连接的数据输入模块、数据存储模块和数据输出模块。

在上述实施例中,数据更新主控模块为XC7Z035FFGH676-2的Cortex-A9处理器和FPGA控制器。

在具体实施例中,作为数据输入控制的核心,实现了实时数据处理和FLASH存储;还设计了半结构化实时数据的远程采集,采用REMOTE进程,实现了高速的进行数据采集。以FPGA处理系统为数据采集控制的核心,具有时钟频率高、内部延时小、开发频率小、计算高速、编程灵活、集成度高、低功耗、内部资源丰富等优点。核心模块采用的是i.MX6Q核心平台,并集成了Cortex-A9四核处理器,工作频率可达1GHz,搭载了2GB的DDR3内存以及8GB的eMMCFlash;同时支持以太网、CAN总线、UART等接口驱动;支持Linux操作系统。

在上述实施例中,最邻近搜索方法是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。KD树是二进制空间分割树的特殊的情况。

在上述实施例中,数据更新模块实现数据更新的方法为:

通过数据输入模块接收电子元器件数据信息,通过数据存储模块实现电子元器件数据信息的存储,通过数据输出模块实现电子元器件数据信息的输出,更新数据时,通过四分位法实现不同类型电子元器件数据信息的更新分类,通过多路选择器实现数据更新选择。

在具体实施例中,多路选择模块内部预设有数字选择引脚、外部信号接入引脚和内部信号输出引脚,该研究所采用的是74HC4051芯片,该芯片S0-S2是3个数字选择引脚连接三路LED信号导线,A0-A7是8个外部信号接入引脚,A是内部信号输出引脚,三路LED信号线经内部处理器处理后,把74HC4051微处理器的内部数据信号输注至引脚A,引脚A与电容检测模块的输入端相连。

四分位法是指将任意一个电子元器件数据组合按照其大小进行排序,将它们平均分成四个等份,当其中的某个电子元器件数据处于排序后电子元器件数据组的分界处时,称之为四分位数,这些位于分界点的电子元器件数据分别称为第一四分位数、中位数(第二四分位数)、第三四分位数。从下限到上限,电子元器件数据的大小越来越大,这些四分位数的间距就代表了它们数据大小的差值。

对于一个区间内的风速,对应着n个电子元器件数据,对这些电子元器件数据进行逐渐增涨的升序进行排列;

四分位数的计算按以下方式进行:

步骤1、对于电子元器件数据信息,更新数据信息记作为

计算电子元器件数据信息中第二四分位中位数的值

公式(3)中,n表述电子元器件数据信息;

步骤2、同时算出第一四分位数

② 如果电子元器件数据量n为偶数的时候,将升序排列后的样本

③如果电子元器件数据量

④如果电子元器件数据量

通过上述过程计算出

依据四分位间距

公式(7)中,F1代表序列的下限值,F2代表序列的上限值,处于下限到上限范围以外的数据就是最近的更新数据。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。

相关技术
  • 改进KNN方法的电子元器件数据分类方法
  • 一种基于改进KNN算法的数据标签分类方法及装置
技术分类

06120114688329