掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据智能评级和评估优化的方法

文献发布时间:2024-04-18 20:01:30


一种基于大数据智能评级和评估优化的方法

技术领域

本发明属于大数据智能风控技术领域,尤其涉及一种基于大数据智能评级和评估优化的方法。

背景技术

制造企业物料种类繁多,通常拥有数量众多的供应商,制造企业对供应商的管理难度较大,企业拥有的资源是有限的,必须对供应商进行科学评级,实施供应商分类管理,从而提高原材料供应质量,提高企业资源利用率。供应商评级的问题本质上属于分类问题需要提取供应商评价特征,并选取适合的评价方法。聚类分析是研究“物以类聚,人以群分”问题的分析方法,可以对目标群体进行多特征的群体划分,常被用于市场细分、用户细分、类型划分等。企业可以利用聚类分析将供应商数据按其不同特征进行分类,对供应商进行评级。故供应商智能评级系统的设计思路是在全面梳理供应商评价特征的基础上结合制造企业供应商特点,科学、高效地选取供应商评价特征。通过对供应商智能评级,然后实行有针对性的等级管理和奖惩措施,从而提升企业供应商管理的效率和效果是目前急需解决的问题。针对现有技术评级结合智能不准确的问题。

发明内容

鉴于以上现有技术的不足,发明的目的在于提供一种基于大数据智能评级和评估优化的方法,创新性的构建基于K-means聚类算法的供应商智能评级流程,在供应商智能评级流程中,更加精确的完成划分供应商等级。从而提升企业供应商管理的效率和效果。

本发明的第一方面,提出了一种基于大数据智能评级和评估优化的方法,包括如下步骤:

S1.设置数据最终划分的类别数量,将评价等级设置为A级、B级、C级三个等级,通过K-means聚类算法对供应商进行评级;

S2.从供应商样本数据中随机抽取3个数据作为初始类中心,然后计算剩余供应商样本数据到类中心的距离,并将它们分配到距离最近的供应商类中,最后重新计算各个供应商类的类中心,直至将每家供应商按其特征划分到三类中;

S3.根据供应商评价特征体系的供应商等级情况,对被分为同一类的供应商数据标记相同的等级标签,将标签采用矩阵分解法对同一类的供应商数据进行相似度合并;

S4.将所有的供应商数据进行划分,使对应数据分为A级、B级、C级。

进一步地,所述S2中,计算剩余供应商样本数据到类中心的距离采用欧氏距离公式,计算公式如下:

其中,x

进一步地,所述S3中,对被分为同一类的供应商数据标记相同的等级标签,采用基于矩阵分解模型的方法进行相似度合并。

进一步地,所述矩阵分解模型通过优化方法进行优化,且优化方法包括梯度下降法、ALS法。

进一步地,所述S1中,K-means聚类算法对供应商进行评级的流程为:

S11:提取供应数据、供应商基本信息,计算供应商评价特征,产生训练样本数据集;

S12:指定聚类数量K,依据欧氏距离把每个样本数据划分到距离最近的聚类中,用于将训练样本数据进行无监督聚类;

S13:得到训练样板数据的聚类结果,并对比分析聚类结果,划分评价等级;

S14:对实际的供应商进行评价。

进一步地,根据权利要求5所述的一种基于大数据智能评级和评估优化的方法,所述供应数据和供应商基本信息包括供应商信息表、采购订单、采购人库单、检验单等和企业内部的原材料市场参考价格表、供应商售前服务打分表、供应商售后服务反馈表、供应商管理水平打分表。

进一步地,所述的指定聚类数量K,依据欧氏距离把每个样本数据划分到距离最近的聚类中,用于将训练样本数据进行无监督聚类步骤具体包括:

S121:定义样本数据集X,将经过清洗转换后的供应商评价数据集定义为样本X

S122:设置聚类参数K,设置聚类参数为:K=3;

S123:指定类中心,聚类数量为3,需指定3个类中心,选择类中心的方法包括随机法和最远距离法两种,其中最远距离法是在样本数据集中随机指定一个样本作为第一个类中心,然后计算剩余样本到该样本的距离,选择最远距离样本作为第二个类中心,由此类推,直到选出四个类中心,将类中心设为C,即:

C={C

S124:更新类中心数据的均值;

S125:停止迭代,通过K-means聚类算法将数据经过多次送代,并且通过指定迭代次数和设定类中心变动范围两种方式判断是否停止迭代,指定迭代次数时,当次数达到指定值后即停止;设定类中心变动范围ε时,当新类中心与旧类中心的距离小于8时即停止运行。

进一步地,所述类中心数据的均值计算公式为:

其中,n表示特征数,X为样本数据集。

进一步地,所述供应商评价特征体系包括产品实力、供应能力、服务水平和经营能力。

进一步地,所述产品实力包括质量认证、产品合格率和价格比率,所述供应能力包括订单满足率和供货时效,所述服务水平包括售前服务和售后服务,所述经营能力包括财务水平、管理水平和信用水平。

本发明有益效果如下:

本发明构建基于K-means聚类算法的供应商智能评级流程,在供应商智能评级流程中,首先,设置数据最终划分的类别数量,将评价等级设置为A级、B级、C级等三个等级,即K=3,利用K-means聚类算法实现供应商智能评级,并且在完成K-means聚类并输出分类结果之后,根据供应商评价特征体系的供应商等级情况,对被分为同一类的供应商数据标记相同的等级标签,根据标签采用矩阵分解法对同一类的供应商数据进行相似度合并,最终将所有的供应商数据划分为A级、B级、C级,从而更加精确的完成划分供应商等级,提升企业供应商管理的效率和效果,弥补现有技术评级结合智能不准确和划分供应商等级的问题。

附图说明

附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1为本发明实施例的流程图;

图2为本发明实施例的基于K-means聚类算法的供应商智能评级流程图;

图3为本发明实施例的供应商评价特征体系图。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。应该理解,这些描述只是示例性的,并非用于限定本发明的范围。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明公开的概念。

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法和系统的例子。

本发明提出了一种基于大数据智能评级和评估优化的方法,解决有技术评级结合智能不准确和划分供应商等级的问题。

方法实施例

针对现有技术评级不准确的问题,在本发明中需要构建基于K-means聚类算法的供应商智能评级流程。在供应商智能评级流程中;

首先,设置数据最终划分的类别数量,将评价等级设置为A级、B级、C级等三个等级,即K=3。利用K-means聚类算法实现供应商智能评级。

具体描述:从供应商样本数据中随机抽取3个数据作为初始类中心,然后计算剩余供应商样本数据到类中心的距离,并将它们分配到距离最近的供应商类中,最后重新计算各个供应商类的类中心,直至将每家供应商按其特征划分到三类中。基于K-means聚类算法的步骤,结合企业采购业务及其供应商的特点,构建了供应商智能评级流程,如图1-图3所示。

具体流程如下:

参考所示,本发明提供的一种基于大数据智能评级和评估优化的方法,包括如下步骤:

S1.设置数据最终划分的类别数量,将评价等级设置为A级、B级、C级三个等级,通过K-means聚类算法对供应商进行评级;

S2.从供应商样本数据中随机抽取3个数据作为初始类中心,然后计算剩余供应商样本数据到类中心的距离,采用欧氏距离公式,并将它们分配到距离最近的供应商类中,最后重新计算各个供应商类的类中心,直至将每家供应商按其特征划分到三类中,欧氏距离公式如下:

其中,x

S3.根据供应商评价特征体系的供应商等级情况,对被分为同一类的供应商数据标记相同的等级标签,采用基于矩阵分解模型的方法进行相似度合并,矩阵分解模型通过优化方法进行优化,且优化方法包括梯度下降法、ALS法,将标签采用矩阵分解法对同一类的供应商数据进行相似度合并;

S4.将所有的供应商数据进行划分,使对应数据分为A级、B级、C级。

另外,在本发明中,关于上述的K-means聚类算法,K-means聚类算法对供应商进行评级的流程为:

S11:提取供应数据、供应商基本信息,计算供应商评价特征,产生训练样本数据集;

S12:指定聚类数量K,依据欧氏距离把每个样本数据划分到距离最近的聚类中,用于将训练样本数据进行无监督聚类;

S13:得到训练样板数据的聚类结果,并对比分析聚类结果,划分评价等级;

S14:对实际的供应商进行评价。

并且,在本发明中,供应数据和供应商基本信息包括供应商信息表、采购订单、采购人库单、检验单等和企业内部的原材料市场参考价格表、供应商售前服务打分表、供应商售后服务反馈表、供应商管理水平打分表。

另外,在本发明中,关于S12,具体如下:

S121:定义样本数据集X,将经过清洗转换后的供应商评价数据集定义为样本X

S122:设置聚类参数K,设置聚类参数为:K=3;

S123:指定类中心,聚类数量为3,需指定3个类中心,选择类中心的方法包括随机法和最远距离法两种,其中最远距离法是在样本数据集中随机指定一个样本作为第一个类中心,然后计算剩余样本到该样本的距离,选择最远距离样本作为第二个类中心,由此类推,直到选出四个类中心,将类中心设为C,即:

C={C

S124:更新类中心数据的均值;

S125:停止迭代,通过K-means聚类算法将数据经过多次送代,并且通过指定迭代次数和设定类中心变动范围两种方式判断是否停止迭代,指定迭代次数时,当次数达到指定值后即停止;设定类中心变动范围ε时,当新类中心与旧类中心的距离小于8时即停止运行。

另外,类中心数据的均值计算公式为:

其中,n表示特征数,X为样本数据集。

关于上述供应商评价特征体系,在本发明中,供应商评价特征体系包括产品实力、供应能力、服务水平和经营能力。

另外,产品实力包括质量认证、产品合格率和价格比率,供应能力包括订单满足率和供货时效,服务水平包括售前服务和售后服务,经营能力包括财务水平、管理水平和信用水平。

另外,基于K-means聚类算法的供应商智能评级流程如下:

S1.特征提取

从企业的管理信息系统和内部资料中获取相应的供应商特征数据并根据供应商评价特征体系生成表进行分析。

数据来源包含采购管理系统中的供应商信息表、采购订单、采购人库单、检验单等和企业内部的原材料市场参考价格表、供应商售前服务打分表、供应商售后服务反馈表、供应商管理水平打分表等。从相应数据表中提取关键数据,并通过计算供应商特征,得到各个特征数值并存储到定义好的数据表中,最终产生样本集,供应商特征。

以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

该系统设计了三个层次的供应商评价特征体系,第一层是目标层,第二层是准则层,由产品实力、供应能力、服务水平和经营能力四个部分构成,与其相关的细分因素建立在第三层特征层,供应商特征数据表如下所示:

S2.创建分类模型

(1)定义样本数据集X,将经过清洗转换后的供应商评价数据集定义为样本X

(2)设置聚类参数K

K-means聚类算法实现聚类的第一步是设置聚类参数,由于本专利对供应商绩效评价的划分为A、B、C三个等级,因此设置聚类参数为:K=3。

(3)指定类中心

聚类数量为3,因此需指定3个类中心,选择类中心的方法有随机法和最远距离法两种,其中最远距离法是在样本数据集中随机指定一个样本作为第一个类中心,然后计算剩余样本到该样本的距离,选择最远距离样本作为第二个类中心,由此类推,直到选出四个类中心,将类中心设为C,即:

C={C

应用欧氏距离(Euclidean distance)公式依次计算每个样本数据到3个类中心的距离并分配到最近的聚类中,计算公式如下:

将所有的样本数据分配完毕后,需要重新计算3类数据的类中心,计算每个类中样本;

(4)更新类中心数据的均值,计算公式为:

(5)停止迭代,为了保证分类质量,K-means聚类算法下数据需要经过多次送代之后类中心才不会发生变化。企业可以通过指定迭代次数和设定类中心变动范围两种方式来判断是否停止迭代。指定迭代次数时,当次数达到指定值后即停止;设定类中心变动范围ε时,当新类中心与旧类中心的距离小于8时即停止运行。

另外,在本发明中,完成K-means聚类并输出分类结果之后,需要对比分析各类数的指标聚类值。根据供应商评价特征体系的供应商等级情况,对被分为同一类的供应商数据标记相同的等级标签,根据标签采用矩阵分解法对同一类的供应商数据进行相似度合并。最终将所有的供应商数据划分为A级、B级、C级。从而更加精确的完成划分供应商等级。从而提升企业供应商管理的效率和效果。弥补现有技术评级结合智能不准确和划分供应商等级的问题。

在本发明中,关于矩阵分解模型:

假设存在m个用户,n个项目,以及一个m xn的用户-项目交互矩阵R,R中的值代表具体的评分数值。矩阵分解的思想是R可以先分解为两个

低秩的矩阵U和V,再用二者的乘积去逼近R,公式化如下:

R≈U

其中,

其中,K是评分已知的(I,j)对,为防止过拟合因此添加了正则化项,λ为正则化因子,"。

并且,在本发明中,关于供应商评价:

供应商评价需要科学、客观地反映供应商一定时间段内供应活动的运作情况及企业经营情况,在选取供应商评价特征后,企业需要从数据仓库中采集相应数据,然后利用相应的评价方法进行供应商等级评价,最终实现供应商分类管理。企业可以采取聚类分析的方法将供应商数据按其不同特征进行分类,K-means聚类算法作为一种操作简单、快捷的聚类算法,具有优化选代功能,通过在现有聚类上再次迭代修正来确定样本的聚类,最终将所有的样本数据按照相似性进行分类,克服了少量样本聚类的不确定性。企业可以利用训经好的基于K-means聚类算法的据进行评级。

基于同一发明构思,本发明另一实施例提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现本发明的基于大数据智能评级和评估优化的方法。

上述终端提到的通信总线可以是外设部件互联标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述终端与其他设备之间的通信。存储器可以包括随机存取存储器(Random AccessMemory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储系统。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

此外,为实现上述目的,本发明的实施例还提出了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现本发明实施例的基于大数据智能评级和评估优化的方法。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、系统、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用车辆(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。“”和/或“”表示可以选择两者之中的任意一个,也可以两者都选择。而且,术语“”包括“”“”包含“”或者其任何其他变体意在涵盖非排他性地包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“”包括一个……“”限定的要素,并不排除在包括要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

最后应说明的是,以上实施例仅用以说明本发明实施例的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,任何熟悉本技术领域的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

技术分类

06120116556777