掌桥专利:专业的专利平台
掌桥专利
首页

一种适用于电子政务平台的政务数据处理方法

文献发布时间:2023-06-19 11:29:13


一种适用于电子政务平台的政务数据处理方法

技术领域

本发明涉及数据处理方法,具体涉及一种适用于电子政务平台的政务数据处理方法。

背景技术

政务指与政府相关的事务性工作,当某项政务商议完成,需要对该政务进行发布,使人民群众和政府办事人员获知。随着互联网技术的发展,政务的发布已由最初的纸质文件发布扩展到了网络发布。政府部门经过长期发展,记录了大量相关部门的政务数据,这些都是政府部门进行管理的重要依据。政务数据涉及的数据量大、数据类型多、来源广泛、数据格式复杂,随着大数据和互联网的发展,政府、社会对挖掘各部门领域的政务数据价值的需求越来越大。

近年来,随着技术的进步和政策方面的导向,数字政府的改革提出打破政府“数据孤岛”,优化营商环境需要各政府单位进行数据对接,日益严峻的安全问题要求各单位的数据能够有效共享,便民服务的优化升级需要各政府部门协作,这些都促使各级政府积极推动跨部门政务数据共享。而跨部门政务数据共享是一个及其复杂的工程,受到众多影响因素的制约,需要通过对影响因素进行深入、全面地分析,进而得到其中的核心影响因素。

现有的政务数据系统不能很好地对来自各部门的政务数据进行有效数据分类,使得政务数据的利用价值还处在较低的水平,并且政务数据中还包含许多隐私数据,如何在充分挖掘政务数据的利用价值前,对其中包含的隐私数据进行有效识别并进行隐私化处理,也是一个亟待解决的问题。

发明内容

(一)解决的技术问题

针对现有技术所存在的上述缺点,本发明提供了一种适用于电子政务平台的政务数据处理方法,能够有效克服现有技术所存在的不能较好地对政务数据进行有效分类、无法对包含的隐私数据进行有效识别并进行隐私化处理、政务数据的利用价值相对较低的缺陷。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

一种适用于电子政务平台的政务数据处理方法,包括以下步骤:

S1、采集政务数据,并对政务数据进行分类;

S2、建立数据隐私化模型,构建模型训练集,利用模型训练集对数据隐私化模型进行训练,并根据训练结果不断调整数据隐私化模型;

S3、利用训练好的数据隐私化模型对分类后的政务数据进行隐私化处理;

S4、基于用户的使用习惯,采集用户对于各类政务数据的数据期望,根据数据期望向用户推送相应类别的政务数据。

优选地,S1中采集政务数据,包括:

根据用户设定的采集规则,利用爬虫获取网站数据,并对网站数据进行在线解析;

基于用户设置的过滤条件,对解析数据进行过滤处理。

优选地,S1中采集政务数据之后,包括:

对过滤后的解析数据中的重复数据、错误数据进行二次过滤,并记录用户对于重复数据、过滤数据的操作内容,在之后完成二次过滤时,优先向用户推送之前采用的操作内容。

优选地,S1中对政务数据进行分类,包括:

对二次过滤后的解析数据进行数据溯源,并按照数据源以及数据源之间的关联性,对解析数据进行初分类;

基于数据格式的相似性,对初分类后的解析数据进行二次分类;

根据用户设定的分类规则,对二次分类后的解析数据进行细化分类。

优选地,S1中对政务数据进行分类,包括:

判断二次过滤后的解析数据的数据类型,根据数据类型采用合适的关键字提取模板从解析数据中提取数据关键字,并基于数据关键字构建数据标签;

计算数据标签之间的相似度,根据相似度计算结果对解析数据进行分类。

优选地,所述计算数据标签之间的相似度,根据相似度计算结果对解析数据进行分类,包括:

基于统计词频的余弦相似度算法计算数据标签之间的相似度,将相似度计算结果大于相似度阈值的解析数据进行归为一类。

优选地,S2中建立数据隐私化模型,构建模型训练集,利用模型训练集对数据隐私化模型进行训练,包括:

采集各类解析数据,并由人工对解析数据进行隐私化处理,形成模型训练集;

将一部分解析数据以及人工隐私化处理结果作为训练数据,另一部分解析数据以及人工隐私化处理结果作为校验数据,利用训练数据对数据隐私化模型进行训练。

优选地,S2中根据训练结果不断调整数据隐私化模型,包括:

将校验数据中的解析数据输入训练后的数据隐私化模型,并对经过数据隐私化模型处理后的解析数据与人工隐私化处理结果进行对比;

当经过数据隐私化模型处理后的解析数据与人工隐私化处理结果之间的匹配度大于匹配度阈值时,表明该数据隐私化模型训练完毕,否则需要对该数据隐私化模型中的参数进行调整。

优选地,S4中基于用户的使用习惯,采集用户对于各类政务数据的数据期望,包括:

统计用户对于各类解析数据的订阅、调用情况,并对统计数据进行归一化处理,将归一化数据作为该用户对于各类解析数据的数据期望,同时构建该用户关于各类解析数据的数据期望表。

优选地,S4中根据数据期望向用户推送相应类别的政务数据,包括:

将用户的数据期望表转换为向该用户推送各类解析数据的推送频率,并按照各类解析数据对应的推送频率向用户推送相应类别的政务数据。

(三)有益效果

与现有技术相比,本发明所提供的一种适用于电子政务平台的政务数据处理方法,一方面能够对政务数据进行有效分类,另一方面能够计算出用户对于各类政务数据的数据期望,并根据数据期望向用户推送相应类别的政务数据,从而能够大大提升政务数据的利用价值;通过建立数据隐私化模型,构建模型训练集,利用模型训练集对数据隐私化模型进行训练,利用训练好的数据隐私化模型对分类后的政务数据进行隐私化处理,能够对政务数据中的隐私数据进行有效识别并进行隐私化处理,防止出现隐私数据泄露的情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种适用于电子政务平台的政务数据处理方法,如图1所示,包括以下步骤:

S1、采集政务数据,并对政务数据进行分类;

S2、建立数据隐私化模型,构建模型训练集,利用模型训练集对数据隐私化模型进行训练,并根据训练结果不断调整数据隐私化模型;

S3、利用训练好的数据隐私化模型对分类后的政务数据进行隐私化处理;

S4、基于用户的使用习惯,采集用户对于各类政务数据的数据期望,根据数据期望向用户推送相应类别的政务数据。

本申请技术方案中,通过爬虫对政务数据进行有效采集:根据用户设定的采集规则,利用爬虫获取网站数据,并对网站数据进行在线解析;

基于用户设置的过滤条件,对解析数据进行过滤处理。

在采集到政务数据后,对过滤后的解析数据中的重复数据、错误数据进行二次过滤,并记录用户对于重复数据、过滤数据的操作内容,在之后完成二次过滤时,优先向用户推送之前采用的操作内容。

本申请技术方案中,包含两种对政务数据进行分类的方法,其中一种方法为:

对二次过滤后的解析数据进行数据溯源,并按照数据源以及数据源之间的关联性,对解析数据进行初分类;

基于数据格式的相似性,对初分类后的解析数据进行二次分类;

根据用户设定的分类规则,对二次分类后的解析数据进行细化分类。

另一种对政务数据进行分类的方法为:

判断二次过滤后的解析数据的数据类型,根据数据类型采用合适的关键字提取模板从解析数据中提取数据关键字,并基于数据关键字构建数据标签;

计算数据标签之间的相似度,根据相似度计算结果对解析数据进行分类。

其中,计算数据标签之间的相似度,根据相似度计算结果对解析数据进行分类,包括:

基于统计词频的余弦相似度算法计算数据标签之间的相似度,将相似度计算结果大于相似度阈值的解析数据进行归为一类。

本申请技术方案中,既可以根据政务数据来源以及政务数据本身的数据格式对政务数据进行分类,同时也可以基于政务数据对应数据关键字构建的数据标签的相似度对政务数据进行分类,确保政务数据的利用价值。

建立数据隐私化模型,构建模型训练集,利用模型训练集对数据隐私化模型进行训练,包括:

采集各类解析数据,并由人工对解析数据进行隐私化处理,形成模型训练集;

将一部分解析数据以及人工隐私化处理结果作为训练数据,另一部分解析数据以及人工隐私化处理结果作为校验数据,利用训练数据对数据隐私化模型进行训练。

根据训练结果不断调整数据隐私化模型,包括:

将校验数据中的解析数据输入训练后的数据隐私化模型,并对经过数据隐私化模型处理后的解析数据与人工隐私化处理结果进行对比;

当经过数据隐私化模型处理后的解析数据与人工隐私化处理结果之间的匹配度大于匹配度阈值时,表明该数据隐私化模型训练完毕,否则需要对该数据隐私化模型中的参数进行调整。

本申请技术方案中,通过建立数据隐私化模型,构建模型训练集,利用模型训练集对数据隐私化模型进行训练,利用训练好的数据隐私化模型对分类后的政务数据进行隐私化处理,能够对政务数据中的隐私数据进行有效识别并进行隐私化处理,防止出现隐私数据泄露的情况。

基于用户的使用习惯,采集用户对于各类政务数据的数据期望,包括:

统计用户对于各类解析数据的订阅、调用情况,并对统计数据进行归一化处理,将归一化数据作为该用户对于各类解析数据的数据期望,同时构建该用户关于各类解析数据的数据期望表。

根据数据期望向用户推送相应类别的政务数据,包括:

将用户的数据期望表转换为向该用户推送各类解析数据的推送频率,并按照各类解析数据对应的推送频率向用户推送相应类别的政务数据。

本申请技术方案中,通过统计用户对于各类解析数据的订阅、调用情况,将采集到的数据转换为数据期望,并构建该用户关于各类解析数据的数据期望表,再将数据期望表转换为向该用户推送各类解析数据的推送频率,基于推送频率向用户推送相应类别的政务数据,不仅能够保证用户及时更新需要的政务数据,有效提升政务数据的利用价值,同时还能够针对用户的需求情况选择合适的推送频率,防止用户对政务数据的推送产生反感。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 一种适用于电子政务平台的政务数据处理方法
  • 电子政务平台信息数据处理方法
技术分类

06120112939418