掌桥专利:专业的专利平台
掌桥专利
首页

多维度数据价值探查的方法、装置及系统

文献发布时间:2024-04-18 20:00:50


多维度数据价值探查的方法、装置及系统

技术领域

本申请涉及数据流通技术领域,具体而言,涉及一种多维度数据价值探查的方法、装置及系统。

背景技术

随着数字经济的快速发展,数据作为新的生产要素和战略性资源得到全球充分认可。明确把安全贯穿数据供给、流通、使用全过程,建立数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范的数据可信流通体系。鼓励探索数据流通安全保障技术、标准、方案。因此数据要素流通共享必须平衡好安全和流通两大矛盾。然而数据安全和流通平衡问题在数据供方的数据需要变现、数据需方需要为某数据付费时尤为突出。当数据需方寻找到了一些可能有用的数据源,但不知道数据质量好不好、和其使用场景是否匹配,希望得到量化的数据。而为了评估数据是否有价值,在现有方法中,要么数据供方把原始数据直接提供给数据需方才能判断数据价值,这样数据隐私安全存在泄漏的风险;要么数据供方将数据加密脱敏后再提供给数据需方,这样数据需方难以判断数据价值或可能将数据判断为低价值,因此数据交易难以达成。

综上,现有的方法中存在的数据价值判断安全风险大、难度大、准确性差的问题是亟需解决的。

发明内容

本申请的主要目的在于提供一种多维度数据价值探查的方法、装置及系统,解决现有的方法中存在的数据价值判断安全风险大、难度大、准确性差的问题。

为了实现上述目的,根据本申请的第一方面,提供了一种多维度数据价值探查的方法。

根据本申请的多维度数据价值探查的方法包括:数据枢纽方接收数据需方发送的多维度数据价值探查请求,所述多维度数据价值探查请求为初步意向数据源所对应的探查请求,所述初步意向数据源为根据数据供方发布在所述数据枢纽方的数据资源目录选择的至少一个数据源;所述数据枢纽方返回价值探查维度的第一选择页面,以便所述数据需方进行第一次选择,所述第一选择页面包括探查方式评价维度;所述数据枢纽方接收所述数据需方的第一次选择结果并根据所述第一次选择结果返回价值探查维度的第二选择页面,以便所述数据需方进行第二次选择,所述第二选择页面包括探查方式维度;所述数据枢纽方接收所述数据需方的第二次选择结果,并根据所述第二次选择结果中包含的探查方式对所述数据源进行数据探查得到数据探查结果,所述数据探查结果包括探查方式、探查方式评价结果、数据价值结果;所述数据枢纽方将所述数据探查结果返回给所述数据需方,以便所述数据需求根据所述数据探查结果判断是否发起数据安全交易。

可选的,在数据枢纽方接收数据需方发送的多维度数据价值探查请求之前,所述方法还包括:所述数据枢纽方接收数据供方发布的数据资源目录,所述数据资源目录包括所述数据供方的本地数据资源的名称以及所述本地数据资源对应的概览信息;所述数据枢纽方根据数据需方发送的数据需求生成数据资源检索式;所述数据枢纽方根据所述数据资源检索式、所述数据资源目录生成数据源检索结果;所述数据枢纽方向所述数据需方推送与所述数据源检索结果对应的数据源,以使所述数据需方选择初步意向数据源。

可选的,所述探查方式评价维度包括参与测试的信息丰富度、潜在安全风险的数据范围、数据价值判断准确度、数据供方的参与度、技术实现难度中的至少一种;所述数据探查方式维度包括样品预览室、场景样板间、隔空测一测、云沙盒测一测中的至少一种。

可选的,所述根据所述第一次选择结果返回价值探查维度的第二选择页面,包括:根据所述第一次选择结果中每一种探查方式评价维度的程度等级匹配与其对应的探查方式,所述程度等级与探查方式为一对多;按照匹配次数由多到少的顺序,选出预设数量的探查方式;根据所述预设数量的探查方式生成所述第二选择页面。

可选的,在所述数据枢纽方将所述数据探查结果返回给所述数据需方之后,所述方法还包括:所述数据枢纽方接收所述数据需方发起用于数据安全交易的交易请求;所述数据枢纽方根据所述交易请求对应的数据供方的网络链接返回给所述数据需方,以便所述数据需方与所述数据供方进行端到端的数据可信交付。

可选的,所述数据枢纽方根据所述选择结果中包含的探查方式对所述数据源进行数据探查包括:若所述探查方式为样品预览室,返回所述数据源的基本信息以便所述数据需方查看,所述基本信息至少包括数据统计分析结果、元数据介绍信息、适用场景介绍信息中的一种;和/或,若所述探查方式为场景样板间,返回所述数据源的场景应用信息以便所述数据需方查看,所述场景应用信息至少包括场景应用案例、场景应用效果、场景应用评价中的一种;和/或,若所述探查方式为隔空测一测,根据所述数据源对应的测试样本并结合所述数据需方的本地数据样本进行隐私计算、安全统计分析以及特征工程计算,所述测试样本是由所述数据源对应的数据供方提供的;和/或,若所述探查方式为云沙盒测一测,向所述数据源对应的数据供方申请数据价值云端测试,以使所述数据需方与数据供方联合,利用数据供方的本地数据样本和数据需方的本地数据样本在云沙盒中进行隐私计算、联邦学习联合建模以及联邦学习联合预测。

为了实现上述目的,根据本申请的第二方面,提供了另一种多维度数据价值探查的方法。

根据本申请的多维度数据价值探查的方法包括:数据需方向数据枢纽方发送多维度数据价值探查请求,所述多维度数据价值探查请求为初步意向数据源所对应的探查请求,所述初步意向数据源为根据数据供方发布在所述数据枢纽方的数据资源目录选择的至少一个数据源;所述数据需方接收所述数据枢纽方返回的价值探查维度的第一选择页面,所述第一选择页面包括探查方式评价维度;所述数据需方获取第一选择页面对应的第一次选择结果,并将所述第一次选择结果返回给所述数据枢纽方;所述数据需方接收所述数据枢纽方返回的第二选择页面,所述第二选择页面是根据所述第一次选择结果生成的;所述数据需方获取所述第二选择页面对应的第二次选择结果,并将所述第二次选择结果返回给所述数据枢纽方,以使数据枢纽方根据所述第二次选择结果中包含的探查方式对所述数据源进行数据探查得到数据探查结果,所述数据探查结果包括探查方式、探查方式评价结果、数据价值结果;所述数据需方接收所述数据探查结果,并根据所述数据探查结果判断是否发起数据安全交易。

可选的,在数据需方向数据枢纽方发送多维度数据价值探查请求之前,所述方法还包括:所述数据需方向数据枢纽方发送数据需求,以使所述数据枢纽方根据所述数据需求生成数据资源检索式,并根据所述数据资源检索式、所述数据资源目录生成数据源检索结果,以及向所述数据需方推送与所述数据源检索结果对应的数据源;所述数据需方从所述检索结果对应的数据源中选出所述初步意向数据源。

可选的,所述方法还包括:所述数据需方向所述数据枢纽方发起用于数据安全交易的交易请求;所述数据需方接收所述数据枢纽方返回的所述交易请求对应的数据供方的网络链接;所述数据需方与所述数据供方进行端到端的数据可信交付。

为了实现上述目的,根据本申请的第三方面,提供了一种多维度数据价值探查的装置。

根据本申请的多维度数据价值探查的装置包括:第一接收单元,用于数据枢纽方接收数据需方发送的多维度数据价值探查请求,所述多维度数据价值探查请求为初步意向数据源所对应的探查请求,所述初步意向数据源为根据数据供方发布在所述数据枢纽方的数据资源目录选择的至少一个数据源;第一返回单元,用于所述数据枢纽方返回价值探查维度的第一选择页面,以便所述数据需方进行第一次选择,所述第一选择页面包括探查方式评价维度;第二返回单元,用于所述数据枢纽方接收所述数据需方的第一次选择结果并根据所述第一次选择结果返回价值探查维度的第二选择页面,以便所述数据需方进行第二次选择,所述第二选择页面包括探查方式维度;探查单元,用于所述数据枢纽方接收所述数据需方的第二次选择结果,并根据所述第二次选择结果中包含的探查方式对所述数据源进行数据探查得到数据探查结果,所述数据探查结果包括探查方式、探查方式评价结果、数据价值结果;第三返回单元,用于所述数据枢纽方将所述数据探查结果返回给所述数据需方,以便所述数据需求根据所述数据探查结果判断是否发起数据安全交易。

可选的,所述装置还包括:第二接收单元,用于在数据枢纽方接收数据需方发送的多维度数据价值探查请求之前,所述数据枢纽方接收数据供方发布的数据资源目录,所述数据资源目录包括所述数据供方的本地数据资源的名称以及所述本地数据资源对应的概览信息;第一生成单元,用于所述数据枢纽方根据数据需方发送的数据需求生成数据资源检索式;第二生成单元,用于所述数据枢纽方根据所述数据资源检索式、所述数据资源目录生成数据源检索结果;推送单元,用于所述数据枢纽方向所述数据需方推送与所述数据源检索结果对应的数据源,以使所述数据需方选择初步意向数据源。

可选的,所述探查方式评价维度包括参与测试的信息丰富度、潜在安全风险的数据范围、数据价值判断准确度、数据供方的参与度、技术实现难度中的至少一种;所述数据探查方式维度包括样品预览室、场景样板间、隔空测一测、云沙盒测一测中的至少一种。

可选的,所述第二返回单元,还包括:匹配模块,用于根据所述第一次选择结果中每一种探查方式评价维度的程度等级匹配与其对应的探查方式,所述程度等级与探查方式为一对多;选择模块,用于按照匹配次数由多到少的顺序,选出预设数量的探查方式;生成模块,用于根据所述预设数量的探查方式生成所述第二选择页面。

可选的,所述装置还包括:第三接收单元,用于在所述数据枢纽方将所述数据探查结果返回给所述数据需方之后,所述数据枢纽方接收所述数据需方发起用于数据安全交易的交易请求;第三返回单元,用于所述数据枢纽方根据所述交易请求对应的数据供方的网络链接返回给所述数据需方,以便所述数据需方与所述数据供方进行端到端的数据可信交付。

可选的,所述探查单元包括:第一查看模块,用于若所述探查方式为样品预览室,返回所述数据源的基本信息以便所述数据需方查看,所述基本信息至少包括数据统计分析结果、元数据介绍信息、适用场景介绍信息中的一种;第二查看模块,用于若所述探查方式为场景样板间,返回所述数据源的场景应用信息以便所述数据需方查看,所述场景应用信息至少包括场景应用案例、场景应用效果、场景应用评价中的一种;第一测试模块,用于若所述探查方式为隔空测一测,根据所述数据源对应的测试样本并结合所述数据需方的本地数据样本进行隐私计算、安全统计分析以及特征工程计算,所述测试样本是由所述数据源对应的数据供方提供的;第二测试模块,用于若所述探查方式为云沙盒测一测,向所述数据源对应的数据供方申请数据价值云端测试,以使所述数据需方与数据供方联合,利用数据供方的本地数据样本和数据需方的本地数据样本在云沙盒中进行隐私计算、联邦学习联合建模以及联邦学习联合预测。

为了实现上述目的,根据本申请的第四方面,提供了一种多维度数据价值探查的装置。

根据本申请的多维度数据价值探查的装置包括:第一发送单元,用于数据需方向数据枢纽方发送多维度数据价值探查请求,所述多维度数据价值探查请求为针对数据资源目录中的至少一个数据源的探查请求,所述数据资源目录为数据供方发布在所述数据枢纽方的目录;第一接收单元,用于所述数据需方接收所述数据枢纽方返回的价值探查维度的第一选择页面,所述第一选择页面包括探查方式评价维度;第一获取单元,用于所述数据需方获取第一选择页面对应的第一次选择结果,并将所述第一次选择结果返回给所述数据枢纽方;第二接收单元,用于所述数据需方接收所述数据枢纽方返回的第二选择页面,所述第二选择页面是根据所述第一次选择结果生成的;第二获取单元,用于所述数据需方获取所述第二选择页面对应的第二次选择结果,并将所述第二次选择结果返回给所述数据枢纽方,以使数据枢纽方根据所述第二次选择结果中包含的探查方式对所述数据源进行数据探查得到数据探查结果,所述数据探查结果包括探查方式、探查方式评价结果、数据价值结果;第三接收单元,用于所述数据需方接收所述数据探查结果,并根据所述数据探查结果判断是否发起数据安全交易。

可选的,所述装置还包括:第二发送单元,用于在数据需方向数据枢纽方发送多维度数据价值探查请求之前,所述数据需方向数据枢纽方发送数据需求,以使所述数据枢纽方根据所述数据需求生成数据资源检索式,并根据所述数据资源检索式、所述数据资源目录生成数据源检索结果,以及向所述数据需方推送与所述数据源检索结果对应的数据源;选择单元,用于所述数据需方从所述检索结果对应的数据源中选出所述初步意向数据源。

可选的,所述装置还包括:发起单元,用于所述数据需方向所述数据枢纽方发起用于数据安全交易的交易请求;第四接收单元,用于所述数据需方接收所述数据枢纽方返回的所述交易请求对应的数据供方的网络链接;交付单元,用于所述数据需方与所述数据供方进行端到端的数据可信交付。

为了实现上述目的,根据本申请的第五方面,提供了一种多维度数据价值探查的系统,所述系统包括:数据供方、数据需方、数据枢纽方,其中,所述数据供方,用于向所述数据枢纽方发布数据资源目录,所述数据资源目录包括所述数据供方的本地数据资源的名称以及所述本地数据资源对应的概览信息;所述数据枢纽方,用于执行上述第一方面中任一项所述的多维度数据价值探查的方法;所述数据需方,用于执行上述第二方面中任一项所述的多维度数据价值探查的方法。

在本申请实施例的多维度数据价值探查的方法、装置及系统中,数据枢纽方为数据需方提供选择不同的探查方式评价维度以及探查方式维度对数据供方提供的数据源进行多维度的价值探查,在很大程度上保证了数据价值判断的准确性。另外,数据供方和数据需方可以基于数据枢纽方非常方便的进行数据的交易。并且在进行数据价值探查时还利用了“数据可用不可见”的隐私计算技术,可以确保在数据价值探查过程中难以被泄漏和拷贝复制。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例提供的一种多维度数据价值探查的方法流程图;

图2是根据本申请实施例提供的另一种多维度数据价值探查的方法流程图;

图3是根据本申请实施例提供的一种多维度数据价值探查的装置的组成框图;

图4是根据本申请实施例提供的另一种多维度数据价值探查的装置的组成框图;

图5是根据本申请实施例提供的一种多维度数据价值探查的系统的组成框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

首先需要说明的是,下述本申请实施例的多维度数据价值探查的方法中都涉及三方,数据枢纽方、数据需方、数据供方,其中数据需方为有数据需求的用户或者机构对应的计算机系统,数据需方包括业务系统和本地部署的端侧平台,数据供方为能够提供数据源的用户或机构对应的计算机系统,数据供方也包括业务系统和本地部署的端侧平台,数据枢纽方为为有数据需求的用户或者机构和能够提供数据源的用户或者机构提供数据流通服务的计算机系统,数据枢纽方包括部署的枢纽平台。上述中的端侧平台、枢纽平台都是软件系统。本申请实施例中的多维度数据价值探查的方法主要是通过数据枢纽方、数据需方、数据供方中对应的枢纽平台和端侧平台实现。数据需方的业务系统在本申请实施例中的作用为将业务对应的数据需求发送给本地的端侧平台。数据供方的业务系统在本申请实施例中的作用为将本地数据源加载到本地的端侧平台。下面对本申请的多维度数据价值探查方式进行详细的说明。

根据本申请实施例,提供了一种多维度数据价值探查的方法,该方法应用于数据枢纽方,比如可以为数据枢纽中心,如图1所示,该方法包括如下的步骤S101-S105:S101.数据枢纽方接收数据需方发送的多维度数据价值探查请求,多维度数据价值探查请求为初步意向数据源所对应的探查请求,初步意向数据源为根据数据供方发布在数据枢纽方的数据资源目录选择的至少一个数据源;S102.数据枢纽方返回价值探查维度的第一选择页面,以便数据需方进行第一次选择,第一选择页面包括探查方式评价维度;S103.数据枢纽方接收数据需方的第一次选择结果并根据第一次选择结果返回价值探查维度的第二选择页面,以便数据需方进行第二次选择,第二选择页面包括探查方式维度;S104.数据枢纽方接收数据需方的第二次选择结果,并根据第二次选择结果中包含的探查方式对数据源进行数据探查得到数据探查结果,数据探查结果包括探查方式、探查方式评价结果、数据价值结果;S105.数据枢纽方将数据探查结果返回给数据需方,以便数据需求根据数据探查结果判断是否发起数据安全交易。

步骤S101中,多维度数据价值探查请求是根据数据需方对应的用户或者机构通过端侧平台发起的。初步意向数据源是数据枢纽方的数据资源目录中的一个或多个数据源。具体的,数据供方会在提前将可以进行交易的数据源的目录公布到数据枢纽方生成数据资源目录,数据枢纽方在接收到数据需方发送的数据需求后,会根据数据需求推送一些数据源,然后从推送的数据源中选出初步意向数据源。当然,在实际应用中,初步意向数据源也可以从数据资源目录直接选择得到。数据需求中能够包括领域信息、类别信息、数据量信息、数据形式信息等。

步骤S102中,探查方式评价维度为能够衡量数据价值探查方式好坏程度的维度。在实际应用中探查方式评价维度中包含的维度的数量由能够提供的探查方式的种类决定。比如,数据探查方式维度可以为样品预览室、场景样板间、隔空测一测、云沙盒测一测中的一种或多种。探查方式评价维度可以为参与测试的信息丰富度、潜在安全风险的数据范围、数据价值判断准确度、数据供方的参与度、技术实现难度中的一种或多种。第一选择页面中包含每种探查方式评价维度以及其包含的程度等级,程度等级可以为分为可以为高、低两级,低、中、高三级,也可以划分为更多等级。针对第一选择页面对应的第一次选择的结果包括探查方式评价维度以及其对应的程度等级。比如,第一选择的结果可以为:潜在安全风险的数据范围—低、数据价值判断准确度—高。

步骤S103中,“探查方式维度”表示不同种类的探查方式,一种维度可以表示一个探查方式或者一类探查方式。“根据第一次选择结果返回价值探查维度的第二选择页面”为获取第一次选择结果中包含的探查方式,然后生成包含这些探查方式和对应的探查方式评价维度的第二选择页面。以便数据需方进行选择,若第二选择页面中包括多种探查方式,则可以选择一种进行探查,或者选择多种进行探查。第二选择页面对应的第二次选择结果包含具体的探查方式。

步骤S104中,数据枢纽方根据第二选择结果中包含的探查方式调取对应的探查流程进行数据探查得到数据探查结果。在数据探查过程中基于“数据可用不可见”隐私计算技术,因此能够保证在数据价值探查过程中数据难以被泄漏和拷贝复制。

步骤S105中,数据探查结果中的探查方式、探查方式评价结果、数据价值结果对应的返回给数据需方。探查方式评价结果为步骤S102中的程度等级,数据价值结果的形式有多种,不同的探查方式对应的形式不同。数据价值结果返回到数据需方后,能够使数据需方对应的用户或机构根据数据价值结果进行进一步的判断以确定是否需针对初步意向数据源中发起数据安全交易。

从以上的描述中,可以看出,本申请实施例的多维度数据价值探查的方法中,数据枢纽方为数据需方提供选择不同的探查方式评价维度以及探查方式维度对数据供方提供的数据源进行多维度的价值探查,在很大程度上保证了数据价值判断的准确性。另外,数据供方和数据需方可以基于数据枢纽方非常方便的进行数据的交易。

进一步的,在数据枢纽方接收数据需方发送的多维度数据价值探查请求之前,还包括:数据枢纽方接收数据供方发布的数据资源目录,数据资源目录包括数据供方的本地数据资源的名称以及本地数据资源对应的概览信息;在数据需方发送数据需求给数据枢纽方之后,数据枢纽方根据数据需方发送的数据需求生成数据资源检索式;数据枢纽方根据数据资源检索式、数据资源目录生成数据源检索结果;数据枢纽方向数据需方推送与数据源检索结果对应的数据源,以使数据需方选择初步意向数据源。

示例性的,数据资源检索式的一种生成方式为将数据需求中的包含的领域信息、类别信息、数据量信息、数据形式信息等信息转换为对应的检索关键词,然后将这些检索关键词按照布尔逻辑检索的方式构造数据资源检索式。本申请实施例中对于生成数据资源检索式的方式不做限制。

“根据数据资源检索式、数据资源目录生成数据源检索结果”为根据数据资源检索式对数据资源目录进行检索,得到与数据资源检索式匹配的数据源检索结果。示例性,在检索时可以将数据资源检索式与数据资源目录中代表每个数据源的信息(名称、概览信息)按照语义进行相似度匹配,将相似程度超过预设阈值的作为数据源检索结果。本申请实施例中对于检索的方式不做限制。

数据枢纽方在向数据需方推送与数据源检索结果对应的数据源时,可以将数据源检索结果中包含的所有的数据源或部分数据源的信息推送给需方,以供数据需方选择。

进一步的,“根据第一次选择结果返回价值探查维度的第二选择页面”的具体实现可以为:根据第一次选择结果中每一种探查方式评价维度的程度等级匹配与其对应的探查方式,程度等级与探查方式为一对多;按照匹配次数由多到少的顺序,选出预设数量的探查方式;根据预设数量的探查方式生成第二选择页面。给出具体的示例进行说明,假设第一次选择结果为“A—中,B—高,C—高”,A、B、C分别为不同的探查方式评价维度,将“A—中,B—高,C—高”分别与探查方式进行匹配后,得到的结果分别为“c、d、e”“d、f”、“d、e”,c、d、e、f分别为不同的探查方式,则按照匹配次数由多到少的顺序依次为“d、e、c、f”或“d、e、f、c”,若预设数量为2,则最终选出的探查方式为“d、e”。

进一步的,第二选择页面中包括的多种探查方式可以为样品预览室、场景样板间、隔空测一测、云沙盒测一测等。本申请实施例对探查方式的种类和数量不作限制。每种探查方式对于不同的探查方式评价维度都有对应的程度等级。比如,对于样品预览室,它的参与测试的信息丰富度、潜在安全风险的数据范围、数据价值判断准确度、数据供方的参与度、技术实现难度的程度等级可以都为低。再比如,对于隔空测一测,它的参与测试的信息丰富度、潜在安全风险的数据范围、数据价值判断准确度、数据供方的参与度、技术实现难度的程度等级可以分别为中、中、中、低。下面以这四种探查方式为例,对具体的探查原理进行说明。

若探查方式为样品预览室,返回数据源的基本信息以便数据需方查看,基本信息至少包括数据统计分析结果、元数据介绍信息、适用场景介绍信息中的一种。这种情况下,数据源的基本信息为数据价值结果。

若探查方式为场景样板间,返回数据源的场景应用信息以便数据需方查看,场景应用信息至少包括场景应用案例、场景应用效果、场景应用评价中的一种。这种情况下,数据源的场景应用信息为数据价值结果。

若探查方式为隔空测一测,根据数据源对应的测试样本并结合数据需方的本地数据样本进行隐私计算、安全统计分析以及特征工程计算,测试样本是由数据源对应的数据供方提供的。示例性的,可以利用数据供方的测试样本和需方的本地数据样本(本地部分数据样本)进行安全求交,可以获得求交结果,求交结果多的表示与需求重叠度高,即为高价值数据,所以可以将重叠度作为数据价值结果;还可以进行联合方差、中位数、平均数、偏度等多方安全统计分析,若符合离散程度、集中趋势、数据分布等要求的数据即为高价值数据,因此可以将是否符合离散程度、和/或是否符合集中趋势、和/或是否符合数据分布要求的结果作为数据价值结果;还可以进行联邦IV(Information Value-信息价值)、WOE(Weight of Evidence-证据权重)、VIF(variance inflation factor-方差膨胀系数)等特征工程计算,IV、WOE、VIF是一些如果IV、WOE、VIF特征表现好,那即为高价值数据,因此可以将IV、WOE、VIF特征的计算结果作为数据价值结果。

若探查方式为云沙盒测一测,向数据源对应的数据供方申请数据价值云端测试,以使数据需方与数据供方联合,利用数据供方的本地数据样本和数据需方的本地数据样本在云沙盒中进行隐私计算、联邦学习联合建模以及联邦学习联合预测。示例性的,在数据供方通过申请后,利用数据供方的本地数据样本和数据需方的本地数据样本,双方协同进行联邦学习联合建模,获得模型评价指标如KS(Kolmogorov-Smirnov)、ROC曲线(ReceiverOperating Characteristic-受试者工作特征曲线)、AUC(area under the ROC curve-ROC曲线下的面积)指标等,指标表现较好的即为高价值数据,因此可以将模型评价指标结果作为数据价值结果;还可以双方协同进行联邦学习联合预测,若预测准确性较优的即为高价值数据,因此可以预测结果的准确性作为数据价值结果。

另外,还需要说明的是,隔空测一测中所有的全部数据价值测试在云沙盒测一测中均可开展,且云沙盒测一测中可用的数据样本更多更丰富。差别在于:隔空测一测无需数据供方参与,数据供方全程无感知,但过程中使用的样本为数据供方开放出来供外部测试的样本,数据价值判断的准确性相对低;云沙盒测一测需要获得数据供方的授权且全程需要数据供方协作,过程中使用的样本范围和数量可由供需双方进一步协商确定,数据价值判断的准确性相对高。

本申请实施例中的数据探查方式使数据需方发现一批数据源后安全合规、数据不出各自本地域地进行数据价值探查。探查方式中应用到的“数据可用不可见”的隐私计算技术,确保在数据价值探查过程中数据难以被泄漏和拷贝复制。

进一步的,在数据枢纽方将数据探查结果返回给数据需方之后,若数据需方对应的用户或结构愿意进行数据源交易,则会通过数据需方向数据枢纽方发送数据安全交易请求。因此,数据枢纽方能够接收数据需方发起用于数据安全交易的交易请求,然后根据交易请求对应的数据供方的网络链接返回给数据需方,以便数据需方与数据供方进行端到端的数据可信交付。具体的,可以签订数据合约,然后按照数据合约进行端到端的可信支付。数据合约和交付的凭证会进行留存,以供后续监管审计和计费/计量需要。

本申请实施例中的多维度数据价值探查的方法是基于数据枢纽方的,数据供方和数据需方开展跨域数据流通交易的通用流程和方法。本申请实施例将多种数据价值探查方式融合于一体,数据供方和数据需方仅需部署一套平台就可高效、便捷的发布数据、探查数据价值、发起数据交易。节约了安装部署成本,提高了数据合作效率。数据需方可以准确、量化的得出数据价值的判断,使数据交易不再像开盲盒。

根据本申请实施例,提供了另一种多维度数据价值探查的方法,该方法应用于数据需方,如图2所示,该方法包括如下的步骤S201-S206:S201.数据需方向数据枢纽方发送多维度数据价值探查请求,多维度数据价值探查请求为初步意向数据源所对应的探查请求,初步意向数据源为根据数据供方发布在数据枢纽方的数据资源目录选择的至少一个数据源;S202.数据需方接收数据枢纽方返回的价值探查维度的第一选择页面,第一选择页面包括探查方式评价维度;S203.数据需方获取第一选择页面对应的第一次选择结果,并将第一次选择结果返回给数据枢纽方;S204.数据需方接收数据枢纽方返回的第二选择页面,第二选择页面是根据第一次选择结果生成的;S205.数据需方获取第二选择页面对应的第二次选择结果,并将第二次选择结果返回给数据枢纽方,以使数据枢纽方根据第二次选择结果中包含的探查方式对数据源进行数据探查得到数据探查结果,数据探查结果包括探查方式、探查方式评价结果、数据价值结果;S206.数据需方接收数据探查结果,并根据数据探查结果判断是否发起数据安全交易。

首先需要说明的是,本申请实施例中的多维度数据价值探查的方法中也涉及三方,数据枢纽方、数据需方、数据供方,与前述实施例中的三方的定义是一致的,此处不赘述。

步骤S201中,多维度数据价值探查请求、初步意向数据源的相关说明与图1实施例中的是一样的,此处不再赘述。发送多维度数据价值探查请求是为了对数据源进行价值探查。

步骤S202中,在步骤S201之后,数据枢纽方会根据接收到的多维度数据价值探查请求生成第一选择页面,因此数据需方会接收到第一选择页面。其中,第一选择页面的相关说明与图1实施例中的是一样的,此处不再赘述。

步骤S203中,第一选择页面对应的第一次选择结果是由数据需方对应的用户或机构在第一选择页面上进行选择操作后获取到的。第一次选择结果中包括探查方式评价维度以及其对应的程度等级。

步骤S204中,在步骤S204之前,数据枢纽方会根据接收到的第一次选择结果生成第二选择页面,第二选择页面的相关说明与图1实施例中的是一样的,此处不再赘述。因此数据需方可以接收到第二选择页面。

步骤S205中,第二选择页面对应的第二次选择结果是由数据需方对应的用户或机构在第二选择页面上进行选择操作后获取到的。第二次选择结果中包括具体的探查方式。将第二次选择结果返回给数据枢纽方后,数据枢纽方会根据第二次选择结果中包含的探查方式对数据源进行数据探查得到数据探查结果。“对数据源进行数据探查得到数据探查结果”的具体实现可以参见图1实施例中对应的说明,此处不再赘述。

步骤S206中,数据需方接收数据探查结果后将数据探查结果进行显示,以供对应的用户或机构进行判断是否要发起数据安全交易,如果要发起数据安全交易,则会进行发起数据安全交易的操作,从而使数据需方得到发起数据安全交易的判断结果,然后向数据枢纽方发起数据安全交易的交易请求。

进一步的,在数据需方向数据枢纽方发送多维度数据价值探查请求之前,数据需方向数据枢纽方发送数据需求,以使数据枢纽方根据数据需求生成数据资源检索式,并根据数据资源检索式、数据资源目录生成数据源检索结果,以及向数据需方推送与数据源检索结果对应的数据源;数据需方从检索结果对应的数据源中选出初步意向数据源。数据需求中能够包括领域信息、类别信息、数据量信息、数据形式信息等。“数据枢纽方根据数据需求生成数据资源检索式,并根据数据资源检索式、数据资源目录生成数据源检索结果,以及向数据需方推送与数据源检索结果对应的数据源”的具体实现可以参考图1实施例中相关的说明,此处不再赘述。

进一步的,在数据需方向数据枢纽方发起数据安全交易的交易请求后,数据枢纽方会将交易请求发送给数据供方,如果数据供方同意交易,则数据枢纽方会交易请求对应的数据供方的网络链接返回给数据需方,数据需方接收数据枢纽方返回的交易请求对应的数据供方的网络链接;数据需方与数据供方进行端到端的数据可信交付。具体的,可以签订数据合约,然后按照数据合约进行端到端的可信支付。数据合约和交付的凭证会进行留存,以供后续监管审计和计费/计量需要。

从以上的描述中,可以看出,本申请实施例的多维度数据价值探查的方法中,数据需方可以根据实际的需求选择不同的探查方式评价维度以及探查方式维度对数据供方提供的数据源进行多维度的价值探查,在很大程度上保证了数据价值判断的准确性。并且,数据供方和数据需方可以基于数据枢纽方非常方便的进行数据的交易。另外,在进行数据价值探查时还利用了“数据可用不可见”的隐私计算技术,可以确保在数据价值探查过程中难以被泄漏和拷贝复制。

需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

根据本申请实施例,还提供了一种用于实施上述图1方法的多维度数据价值探查的装置300,如图3所示,该装置包括:第一接收单元301,用于数据枢纽方接收数据需方发送的多维度数据价值探查请求,所述多维度数据价值探查请求为初步意向数据源所对应的探查请求,所述初步意向数据源为根据数据供方发布在所述数据枢纽方的数据资源目录选择的至少一个数据源;第一返回单元302,用于所述数据枢纽方返回价值探查维度的第一选择页面,以便所述数据需方进行第一次选择,所述第一选择页面包括探查方式评价维度;第二返回单元303,用于所述数据枢纽方接收所述数据需方的第一次选择结果并根据所述第一次选择结果返回价值探查维度的第二选择页面,以便所述数据需方进行第二次选择,所述第二选择页面包括探查方式维度;探查单元304,用于所述数据枢纽方接收所述数据需方的第二次选择结果,并根据所述第二次选择结果中包含的探查方式对所述数据源进行数据探查得到数据探查结果,所述数据探查结果包括探查方式、探查方式评价结果、数据价值结果;第三返回单元305,用于所述数据枢纽方将所述数据探查结果返回给所述数据需方,以便所述数据需求根据所述数据探查结果判断是否发起数据安全交易。

具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。

从以上的描述中,可以看出,本申请实施例的多维度数据价值探查的装置中,数据枢纽方为数据需方提供选择不同的探查方式评价维度以及探查方式维度对数据供方提供的数据源进行多维度的价值探查,在很大程度上保证了数据价值判断的准确性。另外,数据供方和数据需方可以基于数据枢纽方非常方便的进行数据的交易。

进一步的,所述装置还包括:第二接收单元306,用于在数据枢纽方接收数据需方发送的多维度数据价值探查请求之前,所述数据枢纽方接收数据供方发布的数据资源目录,所述数据资源目录包括所述数据供方的本地数据资源的名称以及所述本地数据资源对应的概览信息;第一生成单元307,用于所述数据枢纽方根据数据需方发送的数据需求生成数据资源检索式;第二生成单元308,用于所述数据枢纽方根据所述数据资源检索式、所述数据资源目录生成数据源检索结果;推送单元309,用于所述数据枢纽方向所述数据需方推送与所述数据源检索结果对应的数据源,以使所述数据需方选择初步意向数据源。

进一步的,所述探查方式评价维度包括参与测试的信息丰富度、潜在安全风险的数据范围、数据价值判断准确度、数据供方的参与度、技术实现难度中的至少一种;所述数据探查方式维度包括样品预览室、场景样板间、隔空测一测、云沙盒测一测中的至少一种。

进一步的,所述第二返回单元303,还包括:匹配模块3031,用于根据所述第一次选择结果中每一种探查方式评价维度的程度等级匹配与其对应的探查方式,所述程度等级与探查方式为一对多;选择模块3032,用于按照匹配次数由多到少的顺序,选出预设数量的探查方式;生成模块3033,用于根据所述预设数量的探查方式生成所述第二选择页面。

进一步的,所述装置还包括:第三接收单元310,用于在所述数据枢纽方将所述数据探查结果返回给所述数据需方之后,所述数据枢纽方接收所述数据需方发起用于数据安全交易的交易请求;第三返回单元311,用于所述数据枢纽方根据所述交易请求对应的数据供方的网络链接返回给所述数据需方,以便所述数据需方与所述数据供方进行端到端的数据可信交付。

进一步的,所述探查单元304包括:第一查看模块3041,用于若所述探查方式为样品预览室,返回所述数据源的基本信息以便所述数据需方查看,所述基本信息至少包括数据统计分析结果、元数据介绍信息、适用场景介绍信息中的一种;第二查看模块3042,用于若所述探查方式为场景样板间,返回所述数据源的场景应用信息以便所述数据需方查看,所述场景应用信息至少包括场景应用案例、场景应用效果、场景应用评价中的一种;第一测试模块3043,用于若所述探查方式为隔空测一测,根据所述数据源对应的测试样本并结合所述数据需方的本地数据样本进行隐私计算、安全统计分析以及特征工程计算,所述测试样本是由所述数据源对应的数据供方提供的;第二测试模块3044,用于若所述探查方式为云沙盒测一测,向所述数据源对应的数据供方申请数据价值云端测试,以使所述数据需方与数据供方联合,利用数据供方的本地数据样本和数据需方的本地数据样本在云沙盒中进行隐私计算、联邦学习联合建模以及联邦学习联合预测。

具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。

根据本申请实施例,还提供了另一种用于实施上述图2方法的多维度数据价值探查的装置400,如图4所示,该装置包括:第一发送单元401,用于数据需方向数据枢纽方发送多维度数据价值探查请求,所述多维度数据价值探查请求为针对数据资源目录中的至少一个数据源的探查请求,所述数据资源目录为数据供方发布在所述数据枢纽方的目录;第一接收单元402,用于所述数据需方接收所述数据枢纽方返回的价值探查维度的第一选择页面,所述第一选择页面包括探查方式评价维度;第一获取单元403,用于所述数据需方获取第一选择页面对应的第一次选择结果,并将所述第一次选择结果返回给所述数据枢纽方;第二接收单元404,用于所述数据需方接收所述数据枢纽方返回的第二选择页面,所述第二选择页面是根据所述第一次选择结果生成的;第二获取单元405,用于所述数据需方获取所述第二选择页面对应的第二次选择结果,并将所述第二次选择结果返回给所述数据枢纽方,以使数据枢纽方根据所述第二次选择结果中包含的探查方式对所述数据源进行数据探查得到数据探查结果,所述数据探查结果包括探查方式、探查方式评价结果、数据价值结果;第三接收单元406,用于所述数据需方接收所述数据探查结果,并根据所述数据探查结果判断是否发起数据安全交易。

具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。

进一步的,所述装置还包括:第二发送单元407,用于在数据需方向数据枢纽方发送多维度数据价值探查请求之前,所述数据需方向数据枢纽方发送数据需求,以使所述数据枢纽方根据所述数据需求生成数据资源检索式,并根据所述数据资源检索式、所述数据资源目录生成数据源检索结果,以及向所述数据需方推送与所述数据源检索结果对应的数据源;选择单元408,用于所述数据需方从所述检索结果对应的数据源中选出所述初步意向数据源。

进一步的,所述装置还包括:发起单元409,用于所述数据需方向所述数据枢纽方发起用于数据安全交易的交易请求;第四接收单元,用于所述数据需方接收所述数据枢纽方返回的所述交易请求对应的数据供方的网络链接;交付单元410,用于所述数据需方与所述数据供方进行端到端的数据可信交付。

具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。

从以上的描述中,可以看出,本申请实施例的多维度数据价值探查的装置中,数据需方可以根据实际的需求选择不同的探查方式评价维度以及探查方式维度对数据供方提供的数据源进行多维度的价值探查,在很大程度上保证了数据价值判断的准确性。并且,数据供方和数据需方可以基于数据枢纽方非常方便的进行数据的交易。另外,在进行数据价值探查时还利用了“数据可用不可见”的隐私计算技术,可以确保在数据价值探查过程中难以被泄漏和拷贝复制。

根据本申请实施例,还提供了一种多维度数据价值探查的系统,如图5所示,所述系统包括:数据供方51、数据需方52、数据枢纽方53,与前述中的相关描述一致,数据枢纽方包括端侧平台和业务系统、数据需方也包括端侧平台和业务系统、数据供方包括枢纽平台。数据供方51和数据需方52基于数据枢纽方53进行数据的发布、价值探查、交易。

其中,所述数据供方51,用于向所述数据枢纽方发布数据资源目录,所述数据资源目录包括所述数据供方的本地数据资源的名称以及所述本地数据资源对应的概览信息。数据供方在发布数据资源目录之前,可以先将业务系统中的本地数据源加载到数据供方中的端侧平台,然后通过端侧平台发布数据资源目录到数据枢纽方。

所述数据枢纽方52,用于执行上述图1实施例中所述的多维度数据价值探查的方法。图5中的智能撮合对应数据枢纽方根据数据需方的数据需求为数据需方推送数据源,供数据需方选择,实现数据需方和数据供方的供需匹配。图5中的数据资源目录检索/价值测试对应根据数据供方发布在数据枢纽方的数据资源目录选择出初步意向数据源以及对初步意向数据源进行数据探查的过程。

所述数据需方53,用于执行执行上述图2实施例中所述的多维度数据价值探查的方法。

具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。

从以上的描述中,可以看出,本申请实施例的多维度数据价值探查的系统中,基于数据枢纽方,数据供方和数据需方开展跨域数据流通交易。数据枢纽方将多种数据价值探查方式融合于一体,数据需方能够根据实际需求选择不同的探查方式评价维度以及探查方式维度对数据供方提供的数据源进行多维度的价值探查,在很大程度上保证了数据价值判断的准确性。另外,探查方式中应用到的“数据可用不可见”的隐私计算技术,确保在数据价值探查过程中数据难以被泄漏和拷贝复制。在实际应用时,数据供方和数据需方仅需部署一套平台就可高效、便捷的发布数据、探查数据价值、发起数据交易。节约了安装部署成本,提高了数据合作效率。

根据本申请实施例,还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述方法实施例中的多维度数据价值探查的方法。

根据本申请实施例,还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行上述方法实施例中的多维度数据价值探查的方法。

显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 一种带有连接结构的轻质装配式预制墙板及其安装方法
  • 一种被动式建筑预制混凝土结构保温墙板拉结件安装方法
  • 一种双面叠合夹心保温墙板防水节点构造及其安装方法
  • 一种蒙古包墙板及其安装方法
  • 一种磁驱式墙板挂接装置及该装置的定位安装方法
  • 一种凹凸造型墙板结构及其安装方法
  • 一种凹凸造型墙板结构
技术分类

06120116537380