掌桥专利:专业的专利平台
掌桥专利
首页

供应商智能推荐方法及系统

文献发布时间:2024-04-18 19:52:40


供应商智能推荐方法及系统

技术领域

本发明涉及信息处理技术领域,具体地,涉及一种供应商智能推荐方法及系统。

背景技术

供应商推荐是采购业务中必不可少的一个环节,推荐供应商的好坏不管对采购方还是供应方都会产生巨大的利益价值。现阶段供应商推荐采取的方式多以业务专家根据其经验进行推荐,且推荐的供应商必是业务专家觉得好的甚至是有利益往来的。因此对于某一领域的商品物料而言,这个业务专家只可能推荐固定的几家,这样使得更优质的其他供应商没有了合作的机会;并且如果换了另外一个业务专家,又会是另外的结果,导致了千人千面。

专利文献CN112581189A(申请号:CN202011594892.4)公开了一种供应商智能推荐系统及方法,其包括以下步骤:S1、获取用户基础信息及用户对于供应商的条件需求;S2、获取供应商信息并存储在供应商数据库;S3、根据用户对于供应商的条件需求,通过与供应商数据库的供应商信息相匹配,计算不同供应商的匹配相似度,获取对应的相似度评分并进行排列;S4、根据用户基础信息,通过相似性比较得到近邻用户及其反馈信息,并进行协同过滤算法,筛选得到感兴趣供应商;S5、结合不同供应商的相似度评分及感兴趣供应商进行评分并排列,得到最终推荐供应商。但该发明没有解决人工推荐工程中千人千面、供应商与业务人员绑定、新供应商得不到推荐机会的问题。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种供应商智能推荐方法及系统。

根据本发明提供的一种供应商智能推荐方法,包括:

步骤S1:获取数据,对数据进行数据分析和清洗;

步骤S2:建立供应商特征工程、询单特征工程及询单行物料特征工程;

步骤S3:根据供应商特征工程、询单行物料特征工程以及获取的供应商画像进行供应商召回;

步骤S4:对召回的供应商进行排序,根据排序后的供应商筛选作为推荐的结果。

优选地,在所述步骤S1中:

获取数据包括:实际业务产生的询单、订单、合同、物料及供应商或采购方自身的画像数据以及利用爬虫技术手段从外部进行获取的数据;

步骤S1.1:对获取到的数据进行数据分析,包括对供应商的画像数据的缺失度分析、供应商地域分布的分析;

步骤S1.2:对指标的缺失数据进行填充;对缺失度高的维度进行剔除;对离群点的剔除;对文本数据进行去停用词、分词;

步骤S1.3:对分词后的文本数据采用RoBERTa-wwm-ext算法生成Embedding向量。

优选地,在所述步骤S2中:

步骤S2.1:针对供应商特征工程,通过数据分析,并结合供应商画像,选定维度作为评价供应商的特征维度,选定的维度包括供应商报价响应率、中标率、不良事项次数、订单额度和订单个数;

步骤S2.2:针对询单行物料特征工程,根据生成的Embedding向量,考虑物料的周期属性、关联供应商和对应叶类的采购热度进行建立特征维度;

步骤S2.3:针对询单特征工程,考虑采购方条件,包括询单的收货地址和询单的紧急程度。

优选地,在所述步骤S3中:

步骤S3.1:对于询单行物料,基于供应商特征工程生成的特征维度,进行第一步召回:历史上购买过该物料的供应商;

步骤S3.2:对于与该物料相似程度符合预设标准的物料和其所属的业类,进行供应商的第二部分召回。

优选地,在所述步骤S4中:

步骤S4.1:基于召回的供应商及其对应的特征工程,计算供应商的综合评价指数,计算方法采用基于熵权的TOPSIS模型:

基于具体的企业基本信息,对于影响企业综合评价的指标进行分数的量化;

输入企业的各指标得分矩阵X;对X按列进行指标正向化处理与归一化操作;

运用公式计算各指标的信息熵,进而计算各供应商指标的权重E

其中,1≤i≤M,1≤j≤N,M为供应商的个数,N为特征维度的个数,p

单独求出供应商各指标的最优解与最劣解,并通过信息熵计算的权重计算各供应商的单项指标与最优解之间的距离、计算各供应商的单项指标与最劣解之间的距离;

对于第j个特征维度,记最优解R

R

R

其中,r

其中,w

输出供应商与理想状况下最优供应商之间的接近程度即为该供应商的综合得分:

利用

步骤S4.2:通过预先处理好的各地域之间的距离向量,得到采购商的收货地域与供应商发货地域之间的距离度量;

步骤S4.3:通过计算供应商可供物料与采购方发起的询单行物料之间的相似度,得到与目标物料相似的其他物料,相似度计算方法采用余弦相似度:

其中,similarity(A,B)表示余弦相似度;A表示目标用户的行为向量;B表示除目标用户的行为向量;A·B表示向量A和向量B的内积;||A||表示向量A的模;||B||表示向量B的模;n表示向量的分量数;i表示向量的第i个分量;Ai表示向量A的第i个分量;Bi表示向量B的第i个分量;

步骤S4.4:得到经过排序后的供应商集合,选取前预设个作为结果。

根据本发明提供的一种供应商智能推荐系统,包括:

模块M1:获取数据,对数据进行数据分析和清洗;

模块M2:建立供应商特征工程、询单特征工程及询单行物料特征工程;

模块M3:根据供应商特征工程、询单行物料特征工程以及获取的供应商画像进行供应商召回;

模块M4:对召回的供应商进行排序,根据排序后的供应商筛选作为推荐的结果。

优选地,在所述模块M1中:

获取数据包括:实际业务产生的询单、订单、合同、物料及供应商或采购方自身的画像数据以及利用爬虫技术手段从外部进行获取的数据;

模块M1.1:对获取到的数据进行数据分析,包括对供应商的画像数据的缺失度分析、供应商地域分布的分析;

模块M1.2:对指标的缺失数据进行填充;对缺失度高的维度进行剔除;对离群点的剔除;对文本数据进行去停用词、分词;

模块M1.3:对分词后的文本数据采用RoBERTa-wwm-ext算法生成Embedding向量。

优选地,在所述模块M2中:

模块M2.1:针对供应商特征工程,通过数据分析,并结合供应商画像,选定维度作为评价供应商的特征维度,选定的维度包括供应商报价响应率、中标率、不良事项次数、订单额度和订单个数;

模块M2.2:针对询单行物料特征工程,根据生成的Embedding向量,考虑物料的周期属性、关联供应商和对应叶类的采购热度进行建立特征维度;

模块M2.3:针对询单特征工程,考虑采购方条件,包括询单的收货地址和询单的紧急程度。

优选地,在所述模块M3中:

模块M3.1:对于询单行物料,基于供应商特征工程生成的特征维度,进行第一步召回:历史上购买过该物料的供应商;

模块M3.2:对于与该物料相似程度符合预设标准的物料和其所属的业类,进行供应商的第二部分召回。

优选地,在所述模块M4中:

模块M4.1:基于召回的供应商及其对应的特征工程,计算供应商的综合评价指数,计算方法采用基于熵权的TOPSIS模型:

基于具体的企业基本信息,对于影响企业综合评价的指标进行分数的量化;

输入企业的各指标得分矩阵X;对X按列进行指标正向化处理与归一化操作;

运用公式计算各指标的信息熵,进而计算各供应商指标的权重E

其中,1≤i≤M,1≤j≤N,M为供应商的个数,N为特征维度的个数,p

单独求出供应商各指标的最优解与最劣解,并通过信息熵计算的权重计算各供应商的单项指标与最优解之间的距离、计算各供应商的单项指标与最劣解之间的距离;

对于第j个特征维度,记最优解R

R

R

其中,r

其中,w

输出供应商与理想状况下最优供应商之间的接近程度即为该供应商的综合得分:

利用

模块M4.2:通过预先处理好的各地域之间的距离向量,得到采购商的收货地域与供应商发货地域之间的距离度量;

模块M4.3:通过计算供应商可供物料与采购方发起的询单行物料之间的相似度,得到与目标物料相似的其他物料,相似度计算方法采用余弦相似度:

其中,similarity(A,B)表示余弦相似度;A表示目标用户的行为向量;B表示除目标用户的行为向量;A·B表示向量A和向量B的内积;||A||表示向量A的模;||B||表示向量B的模;n表示向量的分量数;i表示向量的第i个分量;Ai表示向量A的第i个分量;Bi表示向量B的第i个分量;

模块M4.4:得到经过排序后的供应商集合,选取前预设个作为结果。

与现有技术相比,本发明具有如下的有益效果:

1、本发明基于真实历史数据而来,解决了人工推荐工程中千人千面、供应商与业务人员绑定、新供应商得不到推荐机会的问题;

2、本发明帮助业务人员找到更多的、优质的供应商;

3、本发明为业务人员选择供应商提供更多的参考,从而给公司带来更多的营收。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为本发明流程示意图;

图2为采购商的收货地域与供应商发货地域之间的距离度量示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例1:

本发明基于历史订单、合同、询单数据以及物料和供应商画像数据,采用RoBERTa-wwm-ext词向量编码模型,分别建立物料的特征工程和供应商的特征工程,并结合知识图谱中物料和供应商的关系数据,进行了供应商推荐的第一步召回;其次将召回后的供应商特征工程结合TOPSIS模型与余弦相似度计算方法,对召回后的供应商进行精排,最终得到推荐的供应商。

根据本发明提供的一种供应商智能推荐方法,如图1-图2所示,包括:

步骤S1:获取数据,对数据进行数据分析和清洗;

具体地,在所述步骤S1中:

获取数据包括:实际业务产生的询单、订单、合同、物料及供应商或采购方自身的画像数据以及利用爬虫技术手段从外部进行获取的数据;

步骤S1.1:对获取到的数据进行数据分析,包括对供应商的画像数据的缺失度分析、供应商地域分布的分析;

步骤S1.2:对指标的缺失数据进行填充;对缺失度高的维度进行剔除;对离群点的剔除;对文本数据进行去停用词、分词;

步骤S1.3:对分词后的文本数据采用RoBERTa-wwm-ext算法生成Embedding向量。

步骤S2:建立供应商特征工程、询单特征工程及询单行物料特征工程;

具体地,在所述步骤S2中:

步骤S2.1:针对供应商特征工程,通过数据分析,并结合供应商画像,选定维度作为评价供应商的特征维度,选定的维度包括供应商报价响应率、中标率、不良事项次数、订单额度和订单个数;

步骤S2.2:针对询单行物料特征工程,根据生成的Embedding向量,考虑物料的周期属性、关联供应商和对应叶类的采购热度进行建立特征维度;

步骤S2.3:针对询单特征工程,考虑采购方条件,包括询单的收货地址和询单的紧急程度。

步骤S3:根据供应商特征工程、询单行物料特征工程以及获取的供应商画像进行供应商召回;

具体地,在所述步骤S3中:

步骤S3.1:对于询单行物料,基于供应商特征工程生成的特征维度,进行第一步召回:历史上购买过该物料的供应商;

步骤S3.2:对于与该物料相似程度符合预设标准的物料和其所属的业类,进行供应商的第二部分召回。

步骤S4:对召回的供应商进行排序,根据排序后的供应商筛选作为推荐的结果。

具体地,在所述步骤S4中:

步骤S4.1:基于召回的供应商及其对应的特征工程,计算供应商的综合评价指数,计算方法采用基于熵权的TOPSIS模型:

基于具体的企业基本信息,对于影响企业综合评价的指标进行分数的量化;

输入企业的各指标得分矩阵X;对X按列进行指标正向化处理与归一化操作;

运用公式计算各指标的信息熵,进而计算各供应商指标的权重E

其中,1≤i≤M,1≤j≤N,M为供应商的个数,N为特征维度的个数,p

单独求出供应商各指标的最优解与最劣解,并通过信息熵计算的权重计算各供应商的单项指标与最优解之间的距离、计算各供应商的单项指标与最劣解之间的距离;

对于第j个特征维度,记最优解R

R

R

其中,r

其中,w

/>

输出供应商与理想状况下最优供应商之间的接近程度即为该供应商的综合得分:

利用

步骤S4.2:通过预先处理好的各地域之间的距离向量,得到采购商的收货地域与供应商发货地域之间的距离度量;

步骤S4.3:通过计算供应商可供物料与采购方发起的询单行物料之间的相似度,得到与目标物料相似的其他物料,相似度计算方法采用余弦相似度:

其中,similarity(A,B)表示余弦相似度;A表示目标用户的行为向量;B表示除目标用户的行为向量;A·B表示向量A和向量B的内积;||A||表示向量A的模;||B||表示向量B的模;n表示向量的分量数;i表示向量的第i个分量;Ai表示向量A的第i个分量;Bi表示向量B的第i个分量;

步骤S4.4:得到经过排序后的供应商集合,选取前预设个作为结果。

实施例2:

实施例2为实施例1的优选例,以更为具体地对本发明进行说明。

本发明还提供一种供应商智能推荐系统,所述供应商智能推荐系统可以通过执行所述供应商智能推荐方法的流程步骤予以实现,即本领域技术人员可以将所述供应商智能推荐方法理解为所述供应商智能推荐系统的优选实施方式。

根据本发明提供的一种供应商智能推荐系统,包括:

模块M1:获取数据,对数据进行数据分析和清洗;

具体地,在所述模块M1中:

获取数据包括:实际业务产生的询单、订单、合同、物料及供应商或采购方自身的画像数据以及利用爬虫技术手段从外部进行获取的数据;

模块M1.1:对获取到的数据进行数据分析,包括对供应商的画像数据的缺失度分析、供应商地域分布的分析;

模块M1.2:对指标的缺失数据进行填充;对缺失度高的维度进行剔除;对离群点的剔除;对文本数据进行去停用词、分词;

模块M1.3:对分词后的文本数据采用RoBERTa-wwm-ext算法生成Embedding向量。

模块M2:建立供应商特征工程、询单特征工程及询单行物料特征工程;

具体地,在所述模块M2中:

模块M2.1:针对供应商特征工程,通过数据分析,并结合供应商画像,选定维度作为评价供应商的特征维度,选定的维度包括供应商报价响应率、中标率、不良事项次数、订单额度和订单个数;

模块M2.2:针对询单行物料特征工程,根据生成的Embedding向量,考虑物料的周期属性、关联供应商和对应叶类的采购热度进行建立特征维度;

模块M2.3:针对询单特征工程,考虑采购方条件,包括询单的收货地址和询单的紧急程度。

模块M3:根据供应商特征工程、询单行物料特征工程以及获取的供应商画像进行供应商召回;

具体地,在所述模块M3中:

模块M3.1:对于询单行物料,基于供应商特征工程生成的特征维度,进行第一步召回:历史上购买过该物料的供应商;

模块M3.2:对于与该物料相似程度符合预设标准的物料和其所属的业类,进行供应商的第二部分召回。

模块M4:对召回的供应商进行排序,根据排序后的供应商筛选作为推荐的结果。

具体地,在所述模块M4中:

模块M4.1:基于召回的供应商及其对应的特征工程,计算供应商的综合评价指数,计算方法采用基于熵权的TOPSIS模型:

基于具体的企业基本信息,对于影响企业综合评价的指标进行分数的量化;

输入企业的各指标得分矩阵X;对X按列进行指标正向化处理与归一化操作;

运用公式计算各指标的信息熵,进而计算各供应商指标的权重E

其中,1≤i≤M,1≤j≤N,M为供应商的个数,N为特征维度的个数,p

单独求出供应商各指标的最优解与最劣解,并通过信息熵计算的权重计算各供应商的单项指标与最优解之间的距离、计算各供应商的单项指标与最劣解之间的距离;

对于第j个特征维度,记最优解R

R

R

其中,r

其中,w

输出供应商与理想状况下最优供应商之间的接近程度即为该供应商的综合得分:

利用

模块M4.2:通过预先处理好的各地域之间的距离向量,得到采购商的收货地域与供应商发货地域之间的距离度量;

模块M4.3:通过计算供应商可供物料与采购方发起的询单行物料之间的相似度,得到与目标物料相似的其他物料,相似度计算方法采用余弦相似度:

其中,similarity(A,B)表示余弦相似度;A表示目标用户的行为向量;B表示除目标用户的行为向量;A·B表示向量A和向量B的内积;||A||表示向量A的模;||B||表示向量B的模;n表示向量的分量数;i表示向量的第i个分量;Ai表示向量A的第i个分量;Bi表示向量B的第i个分量;

模块M4.4:得到经过排序后的供应商集合,选取前预设个作为结果。

实施例3:

实施例3为实施例1的优选例,以更为具体地对本发明进行说明。

本发明设计并开发了一套工业品领域的供应商推荐算法系统。本算法系统基于供应商-物料-采购商的询单、订单、合同等实际业务数据,采用特征匹配、知识图谱、推荐算法和RoBERTa-wwm-ext算法,设计并实现了供应商智能推荐算法系统,旨在帮助业务人员找到更多的、优质的供应商,并为业务人员选择供应商提供更多的参考,从而给公司带来更多的营收。

供应商智能推荐,涉及到三方对象,分别为上游的采购方,中间的物料及下游的供应商,推荐的原理及过程主要从以下几个步骤进行,具体流程如下。

步骤1:数据获取。本算法系统基于的底层数据一方面源自于实际业务产生的询单、订单、合同、物料及供应商或采购方自身的画像数据;另一方面则是利用爬虫等技术手段从外部进行获取。

步骤2:数据预处理。该步针对于步骤一获取到的数据,进行数据分析、数据清洗。

步骤3:建立供应商维度的特征工程、询单维度的特征工程及询单行物料维度的特征工程。

步骤4:根据供应商特征工程、供应商画像、以及询单行物料维度特征工程进行供应商召回。

步骤5:对召回的供应商集进行排序。

步骤6:对排序后的供应商筛选TOP10作为推荐的结果。

所属步骤2包括:

2.1:数据分析。对步骤1获取到的数据进行数据分析,包括对供应商的画像数据的缺失度分析、供应商地域分布的分析等;

2.2:数据处理。数据处理步骤包括对某些指标的缺失数据进行填充;对缺失度高的维度进行剔除;对离群点的剔除;对物料名称、型号规格、长描述等文本数据进行去停用词、分词;

2.3:文本数据Embedding。对分词后的文本数据采用RoBERTa-wwm-ext算法进行Embedding。RoBERTa-wwm-ext算法是对传统的Bert算法的基础上进行改进,使得RoBERTa-wwm-ext在对文本的Embedding效果更好。具体的改进点在以下几点:(1)相较于传统Bert采用静态的Mask操作,而RoBERTa-wwm-ext采用动态Mask操作;(2)相较于传统Bert采用NSP任务(Next SentencePrediction),RoBERTa-wwm-ext取消了NSP任务,并通过实验数据可以得出取消了NSP任务后,Bert模型会得到更好的提升;(3)RoBERTa-wwm-ext采用了更大的batch_size,从原始的256增加到了8k,使得下游任务的准确率得到了很大的提升;(4)使用更多的数据集训练模型。相较于原始Bert,RoBERTa-wwm-ext的训练增加了160G的训练文本,并且加入了工业品行业的数据集,是该模型在工业品领域上的模型表现结果更好;(5)优化器对Adam参数进行了调整;(6)采用了更大的Byte level的BPE词表,是为了减少在工业品行业中碰到的更多的未登录词的问题。

所属步骤3包括:

3.1:针对于供应商的特征工程。通过步骤2的数据分析,并结合供应商自身的画像,最终选定了供应商报价响应率、中标率、不良事项次数、订单额度、订单个数、历史供应物料等30个维度作为评价供应商的特征维度;

3.2:针对于物料的特征工程。对于物料的特征工程,一方面来自于2.3生成的Embedding向量,另一方面则是考虑了(1)物料的周期属性,比如某一季度物料的采购频率、采购额度等;(2)物料的关联供应商;(3)物料对应叶类的采购热度。最终生成了768+15的特征维度;(注:特征维度指每一个生成的指标,比如物料名称是一个特征维度,物料价格是另外一个特征维度;开发的特征维度统称为特征工程,是一个全集的概念,维度则是全集里的每一条。)

3.3:针对于询单维度的特征工程。因为询单是由采购方发起的,因此对于询单的特征工程,我们考虑了采购方要求的一些特殊条件,比如(1)询单的收货地址,为此可以根据收货地址优先推荐离收货地址进的供应商;(2)询单的紧急程度,为此可以优先推荐发货速度快、报价响应率高、交付率高的供应商等;

所属步骤4包括:

4.1:第一个方面的召回:对于询单行物料,基于步骤3.1生成的特征维度,进行第一步召回:历史上购买过该物料的供应商;

4.2:第二个方面的召回:对于与该物料相似的物料和其所属的业类,进行供应商的第二部分召回;

所属步骤5包括:

5.1:基于步骤4召回的供应商及其对应的特征工程,计算供应商的综合评价指数,计算方法采用基于熵权的TOPSIS模型。TOPSIS模型的具体计算步骤如下:(1)基于具体的企业基本信息,对于影响企业综合评价的指标进行分数的量化;(2)输入:企业的各指标得分矩阵X;(3)对X按列进行指标正向化处理与归一化操作;(4)运用如下公式计算各指标的信息熵,进而计算各供应商指标的权重。

对于5.1中的(5)具体计算方法如下:对于供应商进行评估,对于第j个特征维度(同下指标),记最优解为每个指标的最大值,最劣解为每个指标的最小值,即

R

5.2:采购商与召回供应商之间的距离度量。通过步骤2预先处理好了各地域之间的距离向量,如图2所示,可得到采购商的收货地域与供应商发货地域之间的距离度量;

5.3:供应商提供物料与目标物料之间的相似度。通过计算供应商可供物料与采购方发起的询单行物料之间的相似度,可得到与目标物料相似的其他物料。相似度计算方法采用余弦相似度,公式如下,其中,similarity(A,B)表示余弦相似度;A表示目标用户的行为向量;B表示除目标用户的行为向量;A·B表示向量A和向量B的内积;||A||表示向量A的模;||B||表示向量B的模;n表示向量的分量数;i表示向量的第i个分量;Ai表示向量A的第i个分量;Bi表示向量B的第i个分量。

5.4:经过上述三步,可得到经过排序后的供应商集合,选取TOP10作为最终的结果。部分推荐示例如下:

初筛推荐供应商:

推荐供应商

array([9600,41896,10681,13094,525,4472,13705,31265,26532,4472,13705,31265,30634,22022,9600,38955,35674,10448,28232,525,34176,32462,35766,26532,2949,26309,4777,43181,5262,30351,20466,29408,44710,21674,6478,7118,24900,28973,12454,17208,34252,6791,23000,3681,17216,17208])

最终推荐结果:

atray([[26309,43181,28973,35674,4777,20466,9600,30351,38955,41896]])

其中,array里面的数字为供应商对应的索引号。

本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

相关技术
  • 基于人工智能和大数据进行智能产品推荐的方法及系统
  • 智能供应商管理系统及智能供应商管理方法
  • 一种基于大数据的供应商推荐方法及系统
技术分类

06120116332917