一种基于行业数字化转型的算法管理方法

文献发布时间：2024-01-17 01:21:27

技术领域

本发明涉及算法引擎下的算法管理技术领域，具体指有一种基于行业数字化转型的算法管理方法。

背景技术

传统行业进行数字化转型的过程中，中小型企业往往因为缺乏资金、技术等条件进行快速数字化转型，行业内前沿的企业进行数字化转型也需要非常庞大的资金、时间和人力，最终仍有可能转型不够彻底。因此，希望利用前沿企业的经验帮助中小型企业进行快速数字化转型，并利用中小型企业的经验为前沿企业完善数字化转型。由此能给提供数字化转型算法的公司带来新的收益，也能帮助需要进行数字化转型的企业更高效地数据化，从而促进整个行业的“产业数字化”。然而，现有技术中较少利用企业数字化经验形成算法来促进快速“产业数字化”的方法及系统。

发明内容

针对上述现有技术存在的问题，本发明在于提供一种基于行业数字化转型的算法管理方法，能够利用前沿企业的经验转化为算法模型，利用构建完成的算法模型辅助中小型企业进行快速数字化转型，并利用中小型企业的经验数据为前沿企业完善数字化转型，促进“产业数字化”。

本发明的技术方案是：

根据本发明的一个方面，提出一种基于行业数字化转型的算法管理方法，所述方法包括：

将带若干第一标签的数据转型经验依据第一标签分别训练成若干预训练模型，并对每个预训练模型进行有限次迭代优化生成若干版本的优化模型；

对每个优化模型分别进行打标，并进行同态加密、存储；

带第二标签的用户利用第二标签与第一标签进行相似度匹配，根据匹配结果推荐预训练模型，和/或，优化模型；和/或，预训练模型，和/或，优化模型，利用第二标签对预训练模型，和/或，优化模型进行有限次迭代优化。

在上述技术方案中，利用前沿企业的经验转化为算法模型，利用构建完成的算法模型辅助中小型企业进行快速数字化转型，并利用中小型企业的经验数据为前沿企业完善数字化转型，促进“产业数字化”。如服务行业H内的公司A进行数据化转型，并将数据转型经验训练为算法模型；将算法模型关联公司A存储到算法管理系统中进行管理，以及通过算法迭代进行模型进化来为客户服务，并为该模型打上解决的问题标签；通过对公司A的模型不断优化为客户服务后，可以让公司A选择是否授权提供旧版本或者最新版本的算法模型为其他同行业公司服务。

在一些实施例中，所述第一标签和所述第二标签包括用户类型、用户策略。

在上述技术方案中，这样设置的目的在于可以根据客户情况，如行业相似度和需求解决标签(即第一标签盒第二标签)相似度等进行匹配，将相应的已授权过且匹配度高的经验算法模型介绍和应用案例展示给客户。

在一些实施例中，所述打标的标签包括：授权期限以及授权代价；所述授权代价包括授权费用。

在上述技术方案中，根据客户情况，如行业相似度和需求解决标签相似度等进行匹配，将相应的已授权过且匹配度高的经验算法模型介绍和应用案例展示给客户。客户可以根据算法模型和应用案例来确定授权期限以及授权代价是否能够承受。

在一些实施例中，所述同态加密包括：数据加密和模型加密。

在上述技术方案中，由于涉及到算法之间的共享，且公司的内部数据以及利用公司内部数据训练得到的模型具备一定的隐秘性。因此有必要针对数据以及模型进行一定的加密，避免给其他公司使用时产生数据泄密，如根据梯度信息还原训练数据的方法等。一旦数据泄露，用户、组织或者公司将会遭受重大损失。虽然相关法律法规明确禁止收集和利用未授权的敏感数据，但仍旧无法杜绝，尤其是本发明采用的是模型分享的策略，对于模型和数据的隐私泄露情况更甚。

在一些实施例中，所述模型加密包括：

生成加密用的公钥和私钥对；

加密每个模型的模型参数并计算得到i个(1≤i≤n)模型的密文B

基于公钥和私钥对以及模型的密文B

在上述技术方案中，采用在模型拥有者和模型使用者之间引入同态加密技术，解决了不同版本之间的模型参数泄露的问题。由于本案一个模型中存在诸多个版本，利用该同态加密技术可以保护各个版本之间的模型参数如batchsize、iterations、epoch、learningrate，如此一来，不需要模型拥有者提供版本的详细的模型参数即可完成版本的授权。这是因为同态加密是数据加密方式的一种，特点是允许数据在加密情况下实现数学或逻辑运算，也就是说其他人可以对加密后的数据进行处理，而在这个过程中不会泄露任何原始的内容。

在一些实施例中，所述数据加密，具体包括：

生成加密用的公钥和私钥对；

加密每个数据转型经验的明文转换成ASCII码并进行明文分组加密，得到j个(1≤j≤n)数据转型经验的密文D

基于公钥和私钥对以及数据转型经验的密文D

在上述技术方案中，这些数据转型经验会被不断地收集并存储至云端服务器。然而数据转型经验有很多种类型，具有数据复杂、不规范、价值密度高等性质，如此一来导致数据转型经验在云端存储的安全性有较大的挑战。有鉴于此，针对数据保密方面，对数据转型经验采用明文同态加密方案。数据转型经验存在数据、文字、图像等诸多参数，利用ASCII码将上述数据转化为进制编码，利用进制编码进行分组在明文加密，可以很好的对数据进行加密。

在一些实施例中，所述模型包括预训练模型、优化模型。

根据本发明的另一个方面，提供一种基于行业数字化转型的算法管理装置，包括：

依次电相连的训练模块、打标加密模块以及匹配优化模块；

所述训练模块用于将带若干第一标签的数据转型经验依据第一标签分别训练成若干预训练模型，并对每个预训练模型进行有限次迭代优化生成若干版本的优化模型；

所述打标加密模块用于对每个优化模型分别进行打标，并进行同态加密、存储；

所述匹配优化模块用于带第二标签的用户利用第二标签与第一标签进行相似度匹配，根据匹配结果推荐预训练模型，和/或，优化模型；和/或，预训练模型，和/或，优化模型，利用第二标签对预训练模型，和/或，优化模型进行有限次迭代优化。

根据本发明的又一个方面，提供一种基于行业数字化转型的算法管理设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述的一种基于行业数字化转型的算法管理方法。

根据本发明的再一个方面，提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的一种基于行业数字化转型的算法管理方法。

具体实施方式

下面结合实施例，对本发明作进一步的详细描述。特别指出的是，以下实施例仅用于说明本发明，但不对本发明的范围进行限定。同样的，以下实施例仅为本发明的部分实施例而非全部实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

一种基于行业数字化转型的算法管理方法，具体如下：

S1，将带若干第一标签的数据转型经验依据第一标签分别训练成若干预训练模型，并对每个预训练模型进行有限次迭代优化生成若干版本的优化模型；

在本实施例中，假设对服务行业H内的公司A进行数据化转型，并将带若干第一标签的数据转型经验数据转型经验训练为算法模型；将算法模型关联公司A存储到算法管理系统中进行管理，以及通过算法迭代进行模型进化得到若干版本的优化模型来为客户服务。

在本实施例中，所述第一标签包括用户类型、用户策略，如行业、领域等，其目的在于为细分领域。

S2、对每个优化模型分别进行打标，并进行同态加密、存储；

通过算法迭代进行模型进化得到若干版本的优化模型来为客户服务并为该模型打上解决的问题标签，即若干第一标签。

在本实施例中，所述同态加密包括：数据加密和模型加密。

所述模型加密包括：

生成加密用的公钥和私钥对；

加密每个模型的模型参数并计算得到i个(1≤i≤n)模型的密文B

基于公钥和私钥对以及模型的密文B

在本实施例中，采用在模型拥有者和模型使用者之间引入同态加密技术，解决了不同版本之间的模型参数泄露的问题。由于本案一个模型中存在诸多个版本，利用该同态加密技术可以保护各个版本之间的模型参数如batchsize、iterations、epoch、learningrate，如此一来，不需要模型拥有者提供版本的模型参数即可完成版本的授权。这是因为同态加密是数据加密方式的一种，特点是允许数据在加密情况下实现数学或逻辑运算，也就是说其他人可以对加密后的数据进行处理，而在这个过程中不会泄露任何原始的内容。详细的步骤可参阅现有技术的加密方案本发明不再进一步限定。

所述数据加密，具体包括：

生成加密用的公钥和私钥对；

加密每个数据转型经验的明文转换成ASCII码并进行明文分组加密，得到j个(1≤j≤n)数据转型经验的密文D

基于公钥和私钥对以及数据转型经验的密文D

在本实施例中，在上述技术方案中，这些数据转型经验会被不断地收集并存储至云端服务器。然而数据转型经验有很多种类型，具有数据复杂、不规范、价值密度高等性质，如此一来导致数据转型经验在云端存储的安全性有较大的挑战。有鉴于此，针对数据保密方面，对数据转型经验采用明文同态加密方案。数据转型经验存在数据、文字、图像等诸多参数，利用ASCII码将上述数据转化为进制编码，利用进制编码进行分组在明文加密，可以很好的对数据进行加密。详细的步骤可参阅现有技术的加密方案本发明不再进一步限定。

S3、带第二标签的用户利用第二标签与第一标签进行相似度匹配，根据匹配结果推荐预训练模型，和/或，优化模型；和/或，预训练模型，和/

或，优化模型，利用第二标签对预训练模型，和/或，优化模型进行有限次迭代优化。

在本实施例中，通过对公司A的模型不断优化为客户服务后，可以让公司A选择是否授权提供旧版本或者最新版本的优化模型为其他同行业公司服务；公司A选择授权则进入提供数字化经验的算法模型，约定授权期限及相关权益。然后在公司A授权范围内的预训练模型和/或优化模型，通过公司A的行业信息，利用算法对已有信息的客户进行匹配，比如根据客户类型为原厂还是代理商，还可以根据客户位置、策略方向等即第二标签，筛选出行业相似度较高的预训练模型和/或优化模型进行推荐。再针对第二标签对预训练模型和/或优化模型进行优化迭代。

示例1：公司A是电子元器件行业的龙头代理商公司，其销售元器件包含常规电阻电容电感和特殊品，合作企业非常多，拥有大量的行业数据。公司A需要我们帮助实现自动补货功能。服务公司A时，我们将行业通用数据进行监督训练成多元回归模型。由此可以得到具备电子器件物料关系和物料需求情况的预训练模型，大部分元器件的各个地区销售量比，以及各个规格元器件的市场需求情况等。然后再通过公司A的物料近几个月的实际销售数据、待交数据、在途数量、可用数量、主打品牌、同规格可替代产品等数据，以及以往实际备货数量，来对数据进行再训练。通过梯度下降来降低损失函数，最后对模型进行拟合得到新的模型。得到新的模型之后，构建模型应用，应用通过数据库获取销售数据和备货周期等相关数据输入模型，模型根据销售趋势和其他规格数据等自动计算推荐的补货数量。并根据客户的使用情况，对参数权重值进行调整，最后得到相对智能的自动补货模型。

示例2：公司B是属于电子元器件行业的小型公司，现状是采购和销售都比较麻烦，因为起步较晚，大量的物料信息仍依赖于规格书等电子文档。使用了公司A提供的预训练模型，由于模型数据里只有销售比，没有具体数量，所以不会泄露公司A的具体销售情况。公司B使用公司A提供的模型后，能快速根据客户需求的信息，直接找到对应的物料和市场需求占比，相似度较高的物料也可以快速筛选出来跟客户进行确认，减少大量查看规格书，和跟客户对照物料的时间，大幅提升效率。公司B根据自己的实际销售数据，对预训练模型进行训练，降低公司B不经营电子元器件的数据权重，并提高公司B常用元器件的权重，最后实现公司B定制化的快速查找元器件的需求，减少了大量翻阅规格书的时间。

示例3：公司C是电子元器件的数字化前沿公司，采购营业销售整体数字化程度较高，但由于仓库面积相对较小，很多物料放入时已经是只能哪里相对比较空就放哪里，导致后续发货每次都要查询存放记录，同一物料还因为存放位置不一导致出货较慢，发货效率较低。于是公司C使用了公司D的仓库模型，公司D提供的仓库模型是用以对仓库的布局进行慢协调，将元器件物料存放从无序往有序转化。公司C使用利用该模型构建模型应用，利用入库单数据得到各货架位置和相应物料数量。后续物料入库时，模型自动根据物料位置集中度、出入库频次、入库数量、同货架物料类型等数据自动推荐入库货架及对应货架存放数量；出库时根据出库时间要求、入库时间长度、货架规划、同货架其他物料数据等情况自动给出物料出货货架和数量。经过一个多月协调后，物料集中有序，高频出入口物料存放于更便捷的位置。

具体包括如下三个部分：

一、算法管理系统：

S1，服务行业H内的公司A进行数据化转型，并将数据转型经验训练为算法模型；

S2，将算法模型关联公司A存储到算法管理系统中进行管理，以及通过算法迭代进行模型进化来为客户服务，并为该模型打上解决的问题标签；

S3，通过对公司A的模型不断优化为客户服务后，可以让公司A选择是否授权提供旧版本或者最新版本的算法模型为其他同行业公司服务；

S31，公司A选择授权则进入S311，选择不授权则进入S321；

S311，公司A选择授权提供数字化经验的算法模型，约定授权期限及相关权益。然后将公司A授权范围内的预训练模型；

S312，通过公司A的行业信息，利用算法对已有信息的客户进行匹配，比如根据客户类型为原厂还是代理商，还可以根据客户位置、策略方向等，筛选出行业相似度较高的客户进行算法推荐；

S313，为需要使用到公司A算法模型的客户使用S6得到的预训练模型针对客户的需求进行S7定制化训练；并为提供行业经验算法的公司A满足相应权益。

S321，公司A选择不授权提供数字化经验的算法，我们将不会使用公司A的数字化经验算法进行其他操作，仅用于该客户的优化服务等。

二、客户信息管理系统：

S4，客户B主动提出数据化需求，比如需要电子器件自动补货推荐，当前客户B的物料数据大都还是要通过excel和规格书等获取，平台根据客户B提供的信息，根据客户情况,如行业相似度和S2中需求解决标签相似度等进行匹配，将相应的已授权过且匹配度高的经验算法模型介绍和应用案例展示给客户B；

S5，假如客户B认为推荐的算法模型不足以解决需求，可以回到S4完善信息重新匹配，比如返回修改为只针对特殊品进行备货。还可以选择相应的经验算法模型或者需要定制服务来进行需求沟通；

S51，客户B选择已有经验算法模型则进入S511，选择定制服务则进入S521；

S511，客户B选择已有经验算法模型，向客户B明确该算法模型覆盖内容及算法模型的提供公司；

S512，客户B确认使用该经验算法后，通过客户B公司业务情况，使用客户B选择的经验算法预训练模型，针对客户B业务进行再次训练，得到符合客户B需求的算法模型用以提供客户B使用；

S513，客户B成交后，将模型应用部署给客户B使用，并将相关权益反馈给提供经验算法模型的公司，由于客户B的使用的经验算法源于其他客户，将不会基于该模型进行升级。

S521，客户B选择定制化服务，则客户B进入S1流程。

三、模型训练步骤：

S6,在为公司A服务的过程中，对行业较为固定的数据进行预训练，得到行业通用的预训练模型；比如电子元器件行业的品牌、规格、原厂型号、规格数量占比等数据作为行业通用进行预训练，根据多次训练调整得到准确度最高的模型作为后续迭代的预训练模型；大公司涉及产品线比较全面，一般可以作为行业较合适的预训练模型；

S7，根据客户(不一定只是公司A)实际的销售策略、合作方向、主推业务、销售数据等情况，对参数权重进行调整后再训练，得到较为符合客户使用的数据模型。比如客户B也是跟公司A一样属于电子元器件行业，但是客户B主要销售产品不包括普通阻容，只有特殊品，那么在针对客户B提供的数据对客户A提供的预训练模型训练时，就可以提高训练时特殊品数据的权重。

S8，将训练好的模型提供给客户部署使用，根据客户使用反馈来选择是否要进行模型迭代，不需要迭代进入S81，需要迭代则进入S9；

S81，客户不需要迭代，投入使用。

S9，根据客户反馈需要进行迭代则判断需要进行哪种迭代，如果是符合当前策略仅需要进行优化时，则进入S91；如果是数据或策略变化需要迭代则进入S10；

S91，优化性迭代时，根据客户优化需求基于当前模型进行迭代；

S10，模型迭代为数据迭代，判断客户是数据的策略性迭代还是全数据迭代，策略性迭代则回到S7，使用预训练模型进行迭代；全数据迭代则回到S6；在客户B使用公司A提供的预训练模型进行数据化时，行业内也可能在出现更新的行业通用数据，客户B对模型需要进行迭代时，依旧只能使用公司A首次提供的预训练模型进行迭代，无法获取公司A的最新预训练模型，用以保护公司A的权益。

根据本实施例的另一个方面，提供一种基于行业数字化转型的算法管理装置，包括依次电相连的训练模块、打标加密模块以及匹配优化模块；

所述打标加密模块用于对每个优化模型分别进行打标，并进行同态加密、存储；

该系统的原理与方法和上述的种基于行业数字化转型的算法管理方法一一对应，此处不再赘述。

根据本发明的又一个方面，提供一种基于行业数字化转型的算法管理设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

该设备的原理与方法和上述的种基于行业数字化转型的算法管理方法一一对应，此处不再赘述。

根据本实施例的再一个方面，提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的一种基于行业数字化转型的算法管理方法。

该介质处理的原理与方法和上述的种基于行业数字化转型的算法管理方法一一对应，此处不再赘述。

以上所述仅为本发明的部分实施例，并非因此限制本发明的保护范围，凡是利用本发明说明书内容所作的等效装置或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：林晓伟;林艺辉;黄智阳;
专利申请人：厦门二维进化网络技术有限公司;

上一篇：一种肥料造粒机
下一篇：一种跨容器的柜面系统信创迁移方法及设备