掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法、装置、设备和程序产品

文献发布时间:2024-04-18 19:58:21


数据处理方法、装置、设备和程序产品

技术领域

本申请涉及通信技术领域,具体涉及一种数据处理方法、装置、设备和程序产品。

背景技术

目前,由于运营商基站的大规模建设和大量的无线组网调整,导致运营商通信机房内综合资产信息变更频繁,导致规划、优化、维护各工作线效率受影响。

现有技术中,通过人工校验方式进行运营商综合资产信息的校正和更新,例如从设计文件中提取信息,并与现有工参、综合资管系统数据进行比对,提取有效数据形成新的数据表项入库后完成数据校验和更新,效率较低。

发明内容

本申请实施例提供一种数据处理方法、装置、设备和程序产品,用以解决数据处理的技术问题。

第一方面,本申请实施例提供一种数据处理方法,包括:

对通信资产的多个源数据进行预处理,获取所述通信资产的多个类型的目标源数据;

根据各个类型的目标源数据的可信度因子,对所述各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示所述目标源数据的准确性;

根据所述各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

在一个实施例中,所述源数据包括以下至少一项:通信资产的实际图像和通信资产的设计图,所述对通信资产的多个源数据进行预处理,获取所述通信资产的多个类型的目标源数据,包括:

利用提取模型,从所述多个源数据中提取出各个类型的目标源数据;其中,所述提取模型是利用训练数据训练得到的;所述训练数据包括:多个通信资产的源数据以及源数据中各个类型通信资产的标签。

在一个实施例中,所述源数据包括以下至少一项:告警数据、通信资产性能数据、深度报文检测DPI数据、传输资源数据和动环资源数据,所述对通信资产的多个源数据进行预处理,获取所述通信资产的多个类型的目标源数据,包括:

对通信资产的多个源数据进行数据清洗,生成所述通信资产的多个类型的目标源数据。

在一个实施例中,根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果,包括:

将通信资产的各个目标源数据转化为通信资产的各个文本向量;

根据通信资产的各个文本向量和可信度因子,获取通信资产各个目标源数据的比对结果。

在一个实施例中,根据通信资产的各个文本向量和可信度因子,获取通信资产各个目标源数据的比对结果,包括:

将通信资产的各个文本向量与可信度因子相乘,得到通信资产的各个修正文本向量;

根据通信资产的各个修正文本向量,得到通信资产的各个修正文本向量的余弦值;

将通信资产的各个修正文本向量的余弦值进行比对,获取通信资产各个目标源数据的比对结果。

在一个实施例中,根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果,包括:

将通信资产的各个目标源数据进行属性划分和赋值,得到各个目标源数据的属性值;

根据各个目标源数据的属性值和可信度因子,获取各个类型的目标源数据的比对结果。

在一个实施例中,根据各个目标源数据的属性值和可信度因子,获取各个类型的目标源数据的比对结果,包括:

将各个目标源数据的属性值与可信度因子相乘,得到各个目标源数据的属性加权结果;

将各个目标源数据的属性加权结果进行比对,获取通信资产各个目标源数据的比对结果。

在一个实施例中,根据比对结果,得到处理后的通信资产信息,包括:

若存在第一比对结果小于第一阈值,则将第一比对结果中可信度因子高于预设值的目标源数据作为处理后的通信资产信息;第一比对结果为各个类型的目标源数据的比对结果中的任一个;

若存在第二比对结果大于或等于第一阈值,则基于第二比对结果对应的目标源数据,与其他目标源数据的第三比对结果,获取处理后的通信资产信息,第二比对结果为各个类型的目标源数据的比对结果中的任一个。

在一个实施例中,第二比对结果对应的目标源数据包括:第一目标源数据和第二目标源数据,第三比对结果为第一目标源数据与其他目标源数据的比对结果,基于第二比对结果对应的目标源数据,与其他目标源数据的第三比对结果,获取处理后的通信资产信息,包括:

若存在大于预设数量的第三比对结果小于第一阈值,且第一目标源数据的可信度因子高于预设值,则将第一目标源数据作为处理后的通信资产信息。

第二方面,本申请实施例提供一种数据处理装置,包括:

预处理模块,用于:对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据;

比对模块,用于:根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示目标源数据的准确性;

获取模块,用于:根据各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的数据处理方法的步骤。

第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的数据处理方法的步骤。

本申请实施例提供的数据处理方法、装置、设备和程序产品,通过对通信资产的多个源数据进行预处理,使得通信资产的数据格式满足后续数据处理的要求,提升了后续数据处理的效率;进而基于各个类型数据的可信度因子,对各个类型的通信资产的可信度进行赋值,并将已进行可信度赋值的各个类型的目标源数据进行比对,根据比对结果,就可以从多个类型的数据中,确定出可信度较高的通信资产数据,也就实现了通信资产数据的校正和高可信通信数据的识别,提高了通信资产数据的处理效率。

附图说明

为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的数据处理方法的流程示意图之一;

图2是本申请实施例提供的数据预处理的流程示意图;

图3是本申请实施例提供的数据处理方法的流程示意图之二;

图4是本申请实施例提供的数据处理方法的流程示意图之三;

图5是本申请实施例提供的数据处理方法的流程示意图之四;

图6是本申请实施例提供的通信资产数据处理的系统结构图;

图7是本申请实施例提供的数据处理装置的结构示意图;

图8是本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

目前,由于运营商基站的大规模建设和大量的无线组网调整,导致运营商通信机房内综合资产信息变更频繁,导致规划、优化、维护各工作线效率受影响。

现有技术中,通过人工校验方式进行运营商综合资产信息的校正和更新,例如从设计文件中提取信息,并与现有工参、综合资管系统数据进行比对,提取有效数据形成新的数据表项入库后完成数据校验和更新,效率较低。

本申请实施例提供的数据处理方法、装置、设备和程序产品,通过对通信资产的多个源数据进行预处理,使得通信资产的数据格式满足后续数据处理的要求,提升了后续数据处理的效率;进而基于各个类型数据的可信度因子,对各个类型的通信资产的可信度进行赋值,并将已进行可信度赋值的各个类型的目标源数据进行比对,根据比对结果,就可以从多个类型的数据中,确定出可信度较高的通信资产数据,也就实现了通信资产数据的校正和高可信通信数据的识别,提高了通信资产数据的处理效率。

图1为数据处理方法的流程示意图。参照图1,本申请实施例提供一种数据处理方法,可以包括:

步骤101、对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据;

具体地,通信资产的源数据包括三类数据,1、现场类数据,如机房照片、PDF设计图纸;2、采集类数据,如综资系统信息、告警数据和深度报文检测DPI数据;3、其他专业接口数据,如传输网管数据和机房动环数据等。通过对上述的通信资产的数据进行预处理,可选地,通过对通信资产的数据进行清洗,过滤掉不符合要求的数据,或者准确识别出现场类的通信资产的数据,提高后续数据处理的效率。

步骤102、根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示目标源数据的准确性;

具体地,通信资产的各个类型的源数据,其准确性可能也会存在差异,因此可以对各个类型的目标源数据赋予可信度因子,来表示目标源数据的准确性,它描述了各个类型数据在全部通信资产数据中的可信度。可选地,可以采用手工对可信度因子赋值,也可以系统自动定义相同可信度因子。数据处理过程中,可以基于获取到通信资产的数据进行数学建模,每个类型的数据对应一个可信度因子θ,然后对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果,进而根据比对结果也就可以确定最终高可信数据。

例如,现场类数据需要经过人工处理,人工处理过程中可能存在漏报或错报,导致部分数据错误,其可信度因子赋值低可信度;告警类数据和深度报文检测数据为设备上报的数据,相较于人工处理的数据,准确性较高,其可信度因子赋值高可信。可选地,基于隐狄利克雷分配模型(Latent Dirichlet Allocation,LDA)进行数学建模,每个类型的数据对应一个可信度因子θ,它描述了各个类型数据在全部仲裁文件中的可信度,概率p(θ|d)为比对参数,通过比对各类型数据后根据可信结果进行自动分配,服从狄利克雷分布。当处理各个类型数据时,首先确定该类型数据的可信度因子θ,确定各个类型数据和关键数据的相关概率,并生成构造该关键数据的各比对项,生成比对项的过程服从可信度因子θ的概率分布。这样,由各个类型数据生成高可信度概率通信资产数据的结果,是由不同可信度因子θ的数据匹配各关键数据项比对参数后,最终通过各关键数据数值,得到由关键数据集合表示的最终高可信数据源文件。

步骤103、根据各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

具体地,基于各个类型数据的可信度因子,将已进行可信度赋值的各个类型的目标源数据进行比对,根据比对结果,就可以从多个类型的数据中确定最终高可信数据,也就实现了通信资产数据的校正和高可信通信数据的识别,提高了通信资产数据的完整率及准确率。

上述实施例的方法,通过对通信资产的多个源数据进行预处理,使得通信资产的数据格式满足后续数据处理的要求,提升了后续数据处理的效率;进而基于各个类型数据的可信度因子,对各个类型的通信资产的可信度进行赋值,并将已进行可信度赋值的各个类型的目标源数据进行比对,根据比对结果,就可以从多个类型的数据中,确定出可信度较高的通信资产数据,也就实现了通信资产数据的校正和高可信通信数据的识别,提高了通信资产数据的处理效率。

在一实施例中,源数据包括以下至少一项:通信资产的实际图像和通信资产的设计图,对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据,包括:

利用提取模型,从多个源数据中提取出各个类型的目标源数据;其中,提取模型是利用训练数据训练得到的;训练数据包括:多个通信资产的源数据以及源数据中各个类型通信资产的标签。

具体地,可以使用机器学习模型进行通信资产数据的预处理,即从通信资产中的现场类数据,如从机房照片和设计文件中提取出通信资产信息,提高了效率。其中,提取模型是利用训练数据训练得到的,训练数据包括多个通信资产的源数据以及源数据中各个类型通信资产的标签,根据训练出的提取模型,也就可以准确地识别和提取出通信资产的信息。

上述实施例的方法,提取模型是通过训练数据训练得到的,其中,训练数据包括多个通信资产的源数据以及源数据中各个类型通信资产的标签,也就使得根据训练出的提取模型,就可以从通信资产的实际图像和通信资产的设计图中,准确地识别和提取出通信资产的信息,提高了效率。

在一实施例中,源数据包括以下至少一项:告警数据、通信资产性能数据、深度报文检测DPI数据、传输资源数据和动环资源数据,对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据,包括:

对通信资产的多个源数据进行数据清洗,生成通信资产的多个类型的目标源数据。

具体地,通信资产数据包括各种类型的数据,为了提高后续处理的效率,需要对各类型的数据进行预处理,可选地,可以对各类型数据进行清洗,即可以对通信资产中的告警数据、通信资产性能数据、深度报文检测DPI数据、传输资源数据和动环资源数据进行数据清洗,过滤掉不符合要求的数据,提高后续处理的效率。示例性的,如图2,对现场类数据机房照片和设计图纸通过提取模型,识别并获取通信资产的目标源数据,对采集类数据的告警数据、性能数据、深度报文检测DPI数据和跨专业的传输资源数据、动环资源数据进行清洗,获取通信资产的多个类型的目标源数据;即可以通过机器识别对从设计方案文件和机房内照片中提取的字段,进行数据拆分、拼接、逻辑判断等处理动作,关联网管采集数据、综资数据,参数库数据,按参数库模板生成站点数据,入库形成准确数据源。

上述实施例的方法,通过对通信资产的各类型数据进行清洗,即对通信资产中的告警数据、通信资产性能数据、深度报文检测DPI数据、传输资源数据和动环资源数据进行数据清洗,过滤掉不符合要求的数据,提高了后续处理的效率,降低了后续数据处理过程中的时间消耗。

在一实施例中,根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果,包括:

将通信资产的各个目标源数据转化为通信资产的各个文本向量;

根据通信资产的各个文本向量和可信度因子,获取通信资产各个目标源数据的比对结果。

具体地,可以用数字化形式表达出通信资产的各个类型的数据,即将通信资产的各个类型的数据转化为各个文本向量,便于进行各个类型通信资产数据的比对;进一步地,基于通信资产的各个文本向量和可信度因子,对各个文本向量进行比对,就可以获取各个类型通信资产数据地比对结果。

可选地,根据通信资产的各个文本向量和可信度因子,获取通信资产各个目标源数据的比对结果,包括:

将通信资产的各个文本向量与可信度因子相乘,得到通信资产的各个修正文本向量;

根据通信资产的各个修正文本向量,得到通信资产的各个修正文本向量的余弦值;

将通信资产的各个修正文本向量的余弦值进行比对,获取通信资产各个目标源数据的比对结果。

例如,如图3所示,通过产生词向量的模型word2vec对通信资产的各个类型的数据进行文本词向量建模,将各个类型的通信资产的数据的可信度因子对词向量进行乘积,然后用余弦相似度来计算两个文本向量夹角的余弦值来度量相似度,高匹配性文本向量则定义为最终文本匹配结果,不符合的进行抛弃处理,即高匹配性文本向量对应的通信资产的数据也就是最终识别出的高可信的数据。

上述实施例的方法,通过将通信资产的各个目标源数据转化为通信资产的各个文本向量,便于进行各个类型通信资产数据的比对;进一步地,将通信资产的各个文本向量与可信度因子相乘,得到通信资产的各个修正文本向量;根据通信资产的各个修正文本向量,得到通信资产的各个修正文本向量的余弦值;将通信资产的各个修正文本向量的余弦值进行比对,就可以确定出高匹配性文本向量,也就实现了从多个类型的数据中识别出高可信通信资产数据的目的,提高了通信资产数据的准确性。

在一实施例中,根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果,包括:

将通信资产的各个目标源数据进行属性划分和赋值,得到各个目标源数据的属性值;

根据各个目标源数据的属性值和可信度因子,获取各个类型的目标源数据的比对结果。

具体地,可以将各个类型的通信资产的数据进行属性划分和赋值,即可以基于通信资产的数据中的具体的数据值和可信度因子,生成比对项,进一步将各个比对项进行比对,就以获取各个类型通信资产数据的比对结果。

可选地,根据各个目标源数据的属性值和可信度因子,获取各个类型的目标源数据的比对结果,包括:

将各个目标源数据的属性值与可信度因子相乘,得到各个目标源数据的属性加权结果;

将各个目标源数据的属性加权结果进行比对,获取通信资产各个目标源数据的比对结果。

例如,如图4所示,通过比对两个类型的通信资产的数据间相同属性值的相似性,即通过将各个类型的通信资产的数据属性按类型进行划分及赋值,将可信度因子对属性数据进行乘积,将乘积处理后的属性数据进行比对,其差值符合事先设定阈值的作为最终数据匹配结果,不符合的进行抛弃处理,也就实现了高可信数据的识别。

上述实施例的方法,通过比对各个类型的通信资产的数据属性,及通过将各个类型的通信资产的数据属性与可信度因子相乘,得到各个目标源数据的属性加权结果;将各个目标源数据的属性加权结果进行比对,就可以实现通信资产高可信数据的识别,即实现了从多个类型的数据中识别出高可信通信资产数据的目的,提高了通信资产数据的准确性。

可选地,根据比对结果,得到处理后的通信资产信息,包括:

若存在第一比对结果小于第一阈值,则将第一比对结果中可信度因子高于预设值的目标源数据作为处理后的通信资产信息;第一比对结果为各个类型的目标源数据的比对结果中的任一个;

若存在第二比对结果大于或等于第一阈值,则基于第二比对结果对应的目标源数据,与其他目标源数据的第三比对结果,获取处理后的通信资产信息,第二比对结果为各个类型的目标源数据的比对结果中的任一个。

具体地,若各个类型的通信资产的数据的比对结果小于预设的第一阈值,则认为比对的数据可信度较高,需要进行仲裁确定可信度较高的通信资产的数据;可选地,可以将可信度因子高于预设值的对应类型的数据作为处理后的通信资产信息,即各个类型的通信资产的数据的比对结果小于预设的第一阈值时,可以将可信度因子较高的类型的数据作为处理后的通信资产信息,使得最终得到的通信资产的数据更加的准确,可信度也较高。

若存在第二比对结果大于或等于第一阈值,则需要根据第三比对结果进行仲裁,即需要根据更多的比对结果,以决定将哪个类型的通信资产作为最终的高可信度的数据。

例如,现场类型的通信资产数据A与采集类型的通信资产数据a进行比对后,比对结果小于阈值,且采集类型的通信资产数据a的可信度因子高于现场类型的通信资产数据A的可信度因子,则可以将可信度因子高于预设值的采集类型的通信资产数据a作为处理后的通信资产信息。若存在第二比对结果大于或等于第一阈值,则将第二比对结果暂时抛弃,通过第三比对结果对第二比对结果对应的各个类型的数据进行仲裁和勘误。例如,采集类型的通信资产数据a分别与工参和传输资源数据、动环监控数据的比对结果均小于第一阈值,则可以认为采集类型的通信资产数据a信任度较高,也就是仲裁采集类型的通信资产数据a为准确地通信资产的数据,而将现场类型的通信资产数据A进行抛弃和勘误。也就是通过自动识别的图纸数据与采集数据、其他专业数据、综资数据库进行匹配校验,对现网运营商综合资产信息进行仲裁校正。发现错误,校正错误,形成数据仲裁后的数据信息返回综资数据库,最终呈现给前端正确的综合资产仲裁后的校正信息。

上述实施例的方法,各个类型的通信资产的数据进行比对后,若第一比对结果小于第一阈值,则可以将第一比对结果中可信度因子高于预设值的目标源数据作为处理后的通信资产信息;进一步地,若存在第二比对结果大于或等于第一阈值,则可以基于第三比对结果,确定将第二比对结果中的哪个类型的通信资产作为最终的高可信度的数据,使得处理后的通信资产的数据更加地准确,可信度更高。

在一实施例中,可选地,第二比对结果对应的目标源数据包括:第一目标源数据和第二目标源数据,第三比对结果为第一目标源数据与其他目标源数据的比对结果,基于第二比对结果对应的目标源数据,与其他目标源数据的第三比对结果,获取处理后的通信资产信息,包括:

若存在大于预设数量的第三比对结果小于第一阈值,且第一目标源数据的可信度因子高于预设值,则将第一目标源数据作为处理后的通信资产信息。

例如,现场类型的通信资产数据A与采集类型的通信资产数据a进行比对后,比对结果大于阈值,则可以根据多个第三比对的结果确定是将现场类型的通信资产数据A,还是将采集类型的通信资产数据a作为最终高可信的数据。如存在的两个第三比对结果中,分别为现场类型的通信资产数据A与工参类型的通信资产数据a1进行比对,其阈值小于第一阈值;现场类型的通信资产数据A与传输资源类型的通信资产数据a2进行比对,其阈值也小于第一阈值,且工参类型的通信资产数据a1的可信度因子高于预设值,则可以将工参类型的通信资产数据a1作为高可信的通信资产的数据,即将工参类型的通信资产数据a1作为处理后的通信资产的数据,并对采集类型的通信资产数据a进行抛弃和勘误。即通过对和仲裁,向高可信数据进行信任倾斜并可以人工干预冲裁结果,仲裁结果入库形成最终数据。随着数据仲裁量和样本量的累计,系统会调整可信度因子的赋值,启发点就会偏移到准确率较高的数据源方向。采用这种算法最终得出正确概率较高的数据,形成有效综资数据。示例性的,如图5所示,对各个类型的通信资产的数据赋值可信度因子,根据可信度因子对各个类型的通信资产的数据进行比对,获取比对结果,并根据比对结果进行仲裁,得到最高可信度的通信资产的数据,作为处理后的通信资产的数据,即通过运用机器识别算法将现场的机房图片和设计图纸中的关键综合资产数据进行识别,结合规划、工程、网管采集和其他专业数据等生产过程中的数据启发式数据校正逻辑规则,通过数据库精确匹配算法,多源数据可信度标识、多源数据筛选等技术,对多个数据源的关键信息进行高可信度启发仲裁与校正,提高通信资产数据的完整率及准确率。

上述实施例的方法,若存在第二比对结果大于或等于第一阈值,则可以基于第三比对结果,也就是将第三比对结果作为仲裁举证的数据,确定将第二比对结果中的哪个类型的通信资产作为最终的高可信度的数据,使得处理后的通信资产的数据更加地准确,可信度更高。

可选地,如图6所示,通信资产数据处理的系统结构图,包括前后台用户服务交互层、数据仲裁层、图纸识别服务层、数据规则层、智能比对转换层;其中,图纸识别服务层基于AI引擎实现图纸切割、文字识别和处理,数据规则层用于加载规则、提取数据和结果输出,多维数据转换层用于对告警、性能数据、传输综资等数据进行智能比对转换,数据仲裁层用于对通信资产的多个类型的数据进行仲裁和处理,前后台用户服务交互层用于资源校准与更新。如图纸识别服务层、数据规则层、智能比对转换层分别将对通信资产的各类数据进行处理并输出至数据仲裁层,以确定出较高可信度的通信资产数据,进而将其入库,用户就可以实现对高可信度的通信资产数据的下载和查阅。

下面对本申请实施例提供的数据处理装置进行描述,下文描述的数据处理装置与上文描述的数据处理方法可相互对应参照。本实施例提供的数据处理的装置如图7所示,包括:

预处理模块710,用于:对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据;

比对模块720,用于:根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示目标源数据的准确性;

获取模块730,用于:根据各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

可选地,源数据包括以下至少一项:通信资产的实际图像和通信资产的设计图;

可选地,预处理模块710,具体用于利用提取模型,从多个源数据中提取出各个类型的目标源数据;其中,提取模型是利用训练数据训练得到的;训练数据包括:多个通信资产的源数据以及源数据中各个类型通信资产的标签。

可选地,源数据包括以下至少一项:告警数据、通信资产性能数据、深度报文检测DPI数据、传输资源数据和动环资源数据;

可选地,预处理模块710,具体用于对通信资产的多个源数据进行数据清洗,生成通信资产的多个类型的目标源数据。

可选地,比对模块720,具体用于将通信资产的各个目标源数据转化为通信资产的各个文本向量;

根据通信资产的各个文本向量和可信度因子,获取通信资产各个目标源数据的比对结果。

可选地,比对模块720,具体用于将通信资产的各个文本向量与可信度因子相乘,得到通信资产的各个修正文本向量;

根据通信资产的各个修正文本向量,得到通信资产的各个修正文本向量的余弦值;

将通信资产的各个修正文本向量的余弦值进行比对,获取通信资产各个目标源数据的比对结果。

可选地,比对模块720,具体用于将通信资产的各个目标源数据进行属性划分和赋值,得到各个目标源数据的属性值;

根据各个目标源数据的属性值和可信度因子,获取各个类型的目标源数据的比对结果。

可选地,比对模块720,具体用于将各个目标源数据的属性值与可信度因子相乘,得到各个目标源数据的属性加权结果;

将各个目标源数据的属性加权结果进行比对,获取通信资产各个目标源数据的比对结果。

可选地,获取模块730,具体用于若存在第一比对结果小于第一阈值,则将第一比对结果中可信度因子高于预设值的目标源数据作为处理后的通信资产信息;第一比对结果为各个类型的目标源数据的比对结果中的任一个;

若存在第二比对结果大于或等于第一阈值,则基于第二比对结果对应的目标源数据,与其他目标源数据的第三比对结果,获取处理后的通信资产信息,第二比对结果为各个类型的目标源数据的比对结果中的任一个。

可选地,第二比对结果对应的目标源数据包括:第一目标源数据和第二目标源数据,第三比对结果为第一目标源数据与其他目标源数据的比对结果。

可选地,获取模块730,具体用于若存在大于预设数量的第三比对结果小于第一阈值,且第一目标源数据的可信度因子高于预设值,则将第一目标源数据作为处理后的通信资产信息。

图8示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)810、通信接口(Communication Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的计算机程序,以执行数据处理方法的步骤,例如包括:对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据;根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示目标源数据的准确性;根据各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各实施例所提供的数据处理方法的步骤,例如包括:对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据;根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示目标源数据的准确性;根据各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

另一方面,本申请实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使处理器执行上述各实施例提供的方法的步骤,例如包括:对通信资产的多个源数据进行预处理,获取通信资产的多个类型的目标源数据;根据各个类型的目标源数据的可信度因子,对各个类型的目标源数据进行比对,获取各个类型的目标源数据的比对结果;可信度因子用于表示目标源数据的准确性;根据各个类型的目标源数据的比对结果,得到处理后的通信资产信息。

所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

相关技术
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • 图像处理方法和装置、电子设备、存储介质、程序产品
  • IP产品运营数据处理方法、装置、设备及可读存储介质
  • 一种数据处理方法、装置、网络侧设备及终端设备
  • 数据处理设备、数据处理方法、程序转换处理设备和程序转换处理方法、程序转换处理设备、数据处理设备、程序转换处理方法和数据处理方法、数据处理设备、数据处理方法、程序分析处理设备和程序分析处理方法、数据处理设备、历史保存设备、数据处理方法和程序、以及编译处理设备
  • 数据处理方法、数据传输方法、数据接收方法、设备、代码本、计算机程序产品以及计算机程序分发介质
技术分类

06120116480673