掌桥专利:专业的专利平台
掌桥专利
首页

一种基于人工智能的工程竣工档案归档方法及云平台

文献发布时间:2023-06-19 18:37:28


一种基于人工智能的工程竣工档案归档方法及云平台

技术领域

本申请涉及数据处理、人工智能领域,具体而言,涉及一种基于人工智能的工程竣工档案归档方法及云平台。

背景技术

在诸如高速公路工程管理中,工程竣工档案是严格按照规范编制得到的工程材料。工程竣工档案是对施工过程的总结与归纳,对工程竣工档案进行管理是工程文档管理的重要环节。对于工程竣工档案的管理,不仅仅需要验收工程竣工档案的内容的完备性与规范性,还需要按照实际需要,根据设定的归档规则将类似的工程竣工档案进行归类存储,以实现归档有序,便于后续调取。目前,该归档存储的过程是基于人工进行的,不仅占用了人力资源,且人力归档往往效率极低,且容易出错,如何自动对工程竣工档案进行归档,且确保归档的准确性和效率是亟待解决的技术问题。

发明内容

本发明的目的在于提供一种基于人工智能的工程竣工档案归档方法及云平台,以改善上述问题。

为了实现以上目的,本申请实施例的实现方式如下:

第一方面,本申请实施例提供一种基于人工智能的工程竣工档案归档方法,用于项目管理云平台,所述方法包括:

获取待归档工程竣工档案以及至少一个预设的归档要素;

获取所述待归档工程竣工档案中所述至少一个预设的归档要素关联的档案内容的原始档案描述数组;

对所述待归档工程竣工档案的原始档案描述数组进行描述数组投影处理,得到所述待归档工程竣工档案的定位描述数组;

对所述待归档工程竣工档案的原始档案描述数组进行代码生成处理,得到对应于所述待归档工程竣工档案的定位代码数组;

对所述待归档工程竣工档案的定位代码数组进行标准化处理,得到所述待归档工程竣工档案的定位代码数组的第一标准化数组;

通过所述待归档工程竣工档案的定位描述数组以及所述待归档工程竣工档案的第一标准化数组对多个候选已归档工程竣工档案进行相似度比较,获得和所述待归档工程竣工档案关联的候选已归档工程竣工档案;

将所述待归档工程竣工档案归类存储至所述关联的候选已归档工程竣工档案所在的存储空间。

作为一种实施方式,所述待归档工程竣工档案的定位描述数组以及所述待归档工程竣工档案的定位代码数组为依据调取的工程竣工档案归档模型得到的,在获取待归档工程竣工档案的原始档案描述数组之前,所述方法还包括:

基于所述工程竣工档案归档模型对工程竣工档案调试序列进行档案描述数组提取,得到所述工程竣工档案调试序列的定位描述数组以及所述工程竣工档案调试序列的定位代码数组;

通过所述工程竣工档案调试序列的定位描述数组进行误差结果确定,得到所述工程竣工档案调试序列的档案描述数组距离误差结果;

通过所述工程竣工档案调试序列的定位代码数组进行误差结果确定,得到所述工程竣工档案调试序列的代码数组距离误差结果和代码数组误差结果;

对所述工程竣工档案调试序列的档案描述数组距离误差结果、代码数组距离误差结果及代码数组误差结果中的不少于两个进行合并,并将合并后获得的误差结果确定为对应所述工程竣工档案归档模型的第一误差结果;

通过对应所述工程竣工档案归档模型的第一误差结果优化所述工程竣工档案归档模型。

作为一种实施方式,所述工程竣工档案调试序列包括参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案,所述真值调试工程竣工档案与所述参考调试工程竣工档案之间的匹配评分大于第一预设匹配评分,所述假值调试工程竣工档案与所述参考调试工程竣工档案之间的匹配评分小于第二预设匹配评分,所述第一预设匹配评分大于所述第二预设匹配评分;

所述工程竣工档案归档模型包括公共描述数组抽取单元、定位描述数组处理单元、定位代码数组处理单元;

所述基于所述工程竣工档案归档模型对工程竣工档案调试序列进行档案描述数组提取,得到所述工程竣工档案调试序列的定位描述数组以及所述工程竣工档案调试序列的定位代码数组,包括:

基于所述公共描述数组抽取单元分别对所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案进行公共档案描述数组提取,得到所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案分别对应的原始档案描述数组;

基于所述定位代码数组处理单元对所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案的原始档案描述数组分别进行数值描述数组投影处理,得到所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案分别对应的定位代码数组;

基于所述定位描述数组处理单元分别对所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案的原始档案描述数组进行描述数组投影处理,得到所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案分别对应的定位描述数组。

作为一种实施方式,所述通过所述工程竣工档案调试序列的定位描述数组进行误差结果确定,得到所述工程竣工档案调试序列的档案描述数组距离误差结果,包括:

确定所述参考调试工程竣工档案的定位描述数组与所述真值调试工程竣工档案的定位描述数组之间的第一定位描述数组差值,同时确定所述参考调试工程竣工档案的定位描述数组与所述假值调试工程竣工档案的定位描述数组之间的第二定位描述数组差值;

获取所述第一定位描述数组差值与第一预设误差结果的第一相加结果,同时确定所述第一相加结果与所述第二定位描述数组差值之间的第一相减结果;

如果所述第一相减结果大于0,则将所述第一相减结果确定为所述档案描述数组距离误差结果;

如果所述第一相减结果小于或等于0,则将所述档案描述数组距离误差结果确定为0。

作为一种实施方式,所述通过所述工程竣工档案调试序列的定位代码数组进行误差结果确定,得到所述工程竣工档案调试序列的代码数组距离误差结果,包括:

获取所述参考调试工程竣工档案的定位代码数组与所述真值调试工程竣工档案的定位代码数组之间的第一定位描述数组差值,同时确定所述参考调试工程竣工档案的定位代码数组与所述假值调试工程竣工档案的定位代码数组之间的第二定位描述数组差值;

确定所述第一定位描述数组差值与第二预设误差结果的第二相加结果,同时确定所述第二相加结果与所述第二定位描述数组差值之间的第二相减结果;

如果所述第二相减结果大于0,将所述第二相减结果确定为所述代码数组距离误差结果;

如果所述第二相减结果小于或等于0,将0值确定为所述代码数组距离误差结果。

作为一种实施方式,所述通过所述工程竣工档案调试序列的定位代码数组进行误差结果确定,得到所述工程竣工档案调试序列的代码数组误差结果,包括:

对所述参考调试工程竣工档案、所述真值调试工程竣工档案以及所述假值调试工程竣工档案分别对应的定位代码数组进行优化标准化处理,得到每个所述定位代码数组中的每一元素对应的优化数值;

确定每个所述定位代码数组中的每一元素与对应的优化数值的相减结果;

将与每一所述元素对应的相减结果进行求和,得到所述工程竣工档案调试序列的代码数组误差结果。

作为一种实施方式,所述通过对应所述工程竣工档案归档模型的第一误差结果优化所述工程竣工档案归档模型,包括:

如果所述第一误差结果为通过所述档案描述数组距离误差结果、所述代码数组距离误差结果以及所述代码数组误差结果获取,则通过所述第一误差结果优化所述公共描述数组抽取单元的参变量、所述定位代码数组处理单元的参变量以及所述定位描述数组处理单元的参变量;

或者基于所述第一误差结果优化所述定位代码数组处理单元的参变量以及所述定位描述数组处理单元的参变量;

如果所述第一误差结果是通过所述代码数组距离误差结果以及所述代码数组误差结果获取到,则通过所述第一误差结果优化所述定位代码数组处理单元的参变量。

作为一种实施方式,所述待归档工程竣工档案的定位描述数组以及所述待归档工程竣工档案的定位代码数组为依据调取工程竣工档案归档模型得到,所述工程竣工档案归档模型包括公共描述数组抽取单元、定位代码数组处理单元、定位描述数组处理单元,在获取待归档工程竣工档案的原始档案描述数组之前,所述方法还包括:

优化所述公共描述数组抽取单元的参变量以及所述定位描述数组处理单元的参变量直至对应所述工程竣工档案归档模型的第二误差结果符合预设的变化要求;

优化所述公共描述数组抽取单元的参变量、所述定位代码数组处理单元的参变量以及所述定位描述数组处理单元的参变量直至对应所述工程竣工档案归档模型的第三误差结果符合所述预设的变化要求;

所述优化所述公共描述数组抽取单元的参变量以及所述定位描述数组处理单元的参变量,包括:

基于所述工程竣工档案归档模型对工程竣工档案调试序列进行档案描述数组提取,得到所述工程竣工档案调试序列的定位描述数组;

通过所述工程竣工档案调试序列的定位描述数组进行误差结果确定,得到所述工程竣工档案调试序列的档案描述数组距离误差结果,并将所述档案描述数组距离误差结果确定为对应所述工程竣工档案归档模型的第二误差结果;

通过对应所述工程竣工档案归档模型的第二误差结果优化所述公共描述数组抽取单元的参变量以及所述定位描述数组处理单元的参变量。

作为一种实施方式,所述通过所述待归档工程竣工档案的定位描述数组以及所述待归档工程竣工档案的第一标准化数组对多个候选已归档工程竣工档案进行相似度比较,获得和所述待归档工程竣工档案关联的候选已归档工程竣工档案,包括:

通过所述多个候选已归档工程竣工档案的第二标准化数组,获取所述第二标准化数组与所述候选已归档工程竣工档案之间的对应关系,其中,每个所述第二标准化数组与一个及以上的所述候选已归档工程竣工档案对应;

通过所述第一标准化数组,在多个所述第二标准化数组中确定出检索标准化数组,并将所述检索标准化数组对应的候选已归档工程竣工档案确定为选定工程竣工档案;

获取所述检索标准化数组对应的候选已归档工程竣工档案的定位描述数组与所述待归档工程竣工档案的定位描述数组之间的矢量差值,将所述矢量差值大于预设矢量差值的候选已归档工程竣工档案确定为选定工程竣工档案;

所述获取所述第二标准化数组与所述候选已归档工程竣工档案之间的对应关系的步骤前,所述方法还包括:

确定所述多个候选已归档工程竣工档案的原始档案描述数组;

对所述多个候选已归档工程竣工档案的原始档案描述数组进行代码生成处理,得到对应于所述多个候选已归档工程竣工档案的定位代码数组;

对所述多个候选已归档工程竣工档案的定位代码数组进行标准化处理,得到所述多个候选已归档工程竣工档案的定位代码数组的第二标准化数组;

所述获取所述检索标准化数组对应的候选已归档工程竣工档案的定位描述数组与所述待归档工程竣工档案的定位描述数组之间的矢量差值的步骤前,所述方法还包括:

对所述多个候选已归档工程竣工档案的原始档案描述数组进行描述数组投影处理,得到所述多个候选已归档工程竣工档案的定位描述数组。

第二方面,本申请实施例提供了一种项目管理云平台,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器用于调用所述存储器存储的程序,所述程序用于实现以上所述的基于人工智能的工程竣工档案归档方法。

本申请实施例提供的基于人工智能的工程竣工档案归档方法及云平台,基于原始档案描述数组分别获得定位描述数组和定位代码数组,如此,定位代码数组与定位描述数组包含相同的表达意义,则包含近似的定位描述数组的两个工程竣工档案也具有近似的定位代码数组,同时在获取到定位描述数组时也得到定位代码数组,缓解了代码生成时的误差且增加了优化的效率。基于此,通过定位描述数组和对应定位代码数组的第一标准化数组在归档时,将第一标准化数组作为基础,定位描述数组作为协同要素进行关联比较然后归档,提高了工程竣工档案的归档合理性和效率。

在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中参考数字在附图的各个视图中代表相似的机构。

图1是根据本申请的一些实施例所示的一种项目管理云平台中硬件和软件组成的示意图。

图2是根据本申请的一些实施例所示的一种基于人工智能的工程竣工档案归档方法的流程图。

图3是本申请实施例提供的工程竣工档案归档装置的架构示意图。

具体实施方式

为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。

在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本申请。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要的模糊本申请的方面。

这些和其他特性、当前申请披露的功能、执行的方法、结构中相关元素的功能和部件的组合和生产经济性,在参照附图进行以下描述的考虑中可能会变得更加明显,所有这些形成本申请的一部分。然而,需要理解清楚的是,附图仅仅是为了说明和描述的目的,并不旨在限制本申请的范围。应当了解的是,这些图纸不是按比例绘制的。然而,应当明确理解的是,附图仅用于说明和描述的目的,并不意图限制本申请的范围。应当知晓的是,这些附图并不依照比例。

本申请中使用流程图说明根据本申请的实施例的系统所执行的执行过程。应当明确理解的是,流程图的执行过程可以不按顺序执行。相反,这些执行过程可以以相反的顺序或同时执行。另外,可以将至少一个其他执行过程添加到流程图。一个或多个执行过程可以从流程图中删除。

本申请实施例提供的基于人工智能的工程竣工档案归档方法应用于项目管理云平台,请参照图1,是项目管理云平台100的架构示意图,该项目管理云平台100包括工程竣工档案归档装置110、存储器120、处理器130和通信单元140。存储器120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。工程竣工档案归档装置110包括至少一个可以软件或固件(firmware)的形式存储于存储器120中或固化在项目管理云平台100的操作系统(operating system,OS)中的软件功能模块。处理器130用于执行存储器120中存储的可执行模块,例如工程竣工档案归档装置110所包括的软件功能模块及计算机程序等。

其中,所述存储器120可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器120用于存储程序,处理器130在接收到执行指令后,执行所述程序。通信单元140用于通过网络建立项目管理云平台100与业务交互设备之间的通信连接,并用于通过网络收发数据,例如扫描得到的电子档案。

处理器可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP))、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

可以理解,图1所示的结构仅为示意,项目管理云平台100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

本申请实施例提供的基于人工智能的工程竣工档案归档方法通过预设的工程竣工档案归档模型进行执行,可以理解,工程竣工档案归档模型的模型架构不做限定,例如卷积神经网络框架、深度学习网络框架、残差网络框架等。

工程竣工档案归档模型包括公共描述数组抽取单元、定位描述数组处理单元和定位代码数组处理单元。

公共描述数组抽取单元可以包括多个依次连接的包含不同卷积矩阵的滤波器,各个滤波器的个数、卷积矩阵的矩阵秩、通道数以及移动距离等据实而定,本申请实施例对此不做限定。

定位描述数组处理单元包括下采样单元(如最大池化单元)、标准化单元(例如配置归一化指数函数)和分类映射单元(包含多个全连接层)。

定位代码数组处理单元也可以包括下采样单元、标准化单元和分类映射单元。

工程竣工档案归档模型在优化的过程中,将工程竣工档案调试序列输入工程竣工档案归档模型,基于公共描述数组抽取单元进行多次卷积抽取得到工程竣工档案调试序列的各个工程竣工档案的原始档案描述数组(可以理解,抽取的是预设的归档要素关联的档案内容),基于定位描述数组处理单元对每个工程竣工档案的原始档案描述数组进行处理得到定位描述数组,例如对档案描述数组的描述数组投影处理(特征映射),基于定位代码数组处理单元对各个工程竣工档案的原始档案描述数组进行处理得到定位代码数组,例如进行代码生成处理(通过量化编码实现),基于原始档案描述数组分别得到定位描述数组和定位代码数组,令定位代码数组与定位描述数组具有相同的表达意义,则包含关联的定位描述数组的两个工程竣工档案也包含匹配的定位代码数组,包含匹配的定位描述数组的两个工程竣工档案不会因为定位代码数组不同被分割,当获取到定位描述数组时同时获得定位代码数组,不需要在确定了定位描述数组再优化,如此杜绝了多次优化增加无用流程,也杜绝了多次误差的产生,也就是描述数组误差和代码生成过程中的误差。通过定位描述数组获得档案描述数组距离误差结果,通过定位代码数组获得代码数组距离误差结果和代码数组误差结果,通过档案描述数组距离误差结果、代码数组距离误差结果以及代码数组误差结果获得总误差结果,以通过总误差结果优化工程竣工档案归档模型的参变量。

本申请实施例提供的基于人工智能的工程竣工档案归档方法,待归档工程竣工档案的定位描述数组和待归档工程竣工档案的定位代码数组采用上述工程竣工档案归档模型抽取得到,该工程竣工档案归档模型的优化过程可以包含如下步骤110~步骤150。

步骤110:基于工程竣工档案归档模型对工程竣工档案调试序列进行档案描述数组提取,得到工程竣工档案调试序列的定位描述数组以及工程竣工档案调试序列的定位代码数组。

关于工程竣工档案,其具体的内容包括但不限于设计方案(包括报审、审批部分)、会审记录、开工报告、技术交底、建筑材料、设备报验单、运行记录、竣工验收报告、竣工图纸等。在进行工程竣工档案归档时,往往需要按照预设的归档规则将类似的工程竣工档案进行归档,不同的单位预设的归档规则可能不同,例如按相似性归档时,参考的归档要素可能不同,例如参考的归档要素可以包括上述内容中的一个或多个,如归档要素为竣工验收报告。

在对拟优化的工程竣工档案归档模型进行优化时,采取工程竣工档案调试序列作为模板进行训练优化,工程竣工档案调试序列包括参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案。

真值调试工程竣工档案与参考调试工程竣工档案之间的匹配评分(用于衡量匹配度)大于第一预设匹配评分,假值调试工程竣工档案与参考调试工程竣工档案之间的匹配评分小于第二预设匹配评分,第一预设匹配评分大于第二预设匹配评分。

工程竣工档案归档模型包括公共描述数组抽取单元、定位描述数组处理单元、定位代码数组处理单元。

步骤110中,基于工程竣工档案归档模型对工程竣工档案调试序列进行档案描述数组提取,得到工程竣工档案调试序列的定位描述数组以及工程竣工档案调试序列的定位代码数组,具体包括:

基于公共描述数组抽取单元分别对参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案进行公共档案描述数组提取,得到参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案分别对应的原始档案描述数组;基于定位代码数组处理单元对参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案的原始档案描述数组分别进行数值描述数组投影处理,得到参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案分别对应的定位代码数组;基于定位描述数组处理单元对定位代码数组处理单元对参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案的原始档案描述数组进行描述数组投影处理,得到参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案分别对应的定位描述数组。

其中,工程竣工档案调试序列包括的参考调试工程竣工档案、真值调试工程竣工档案和假值调试工程竣工档案中,参考调试工程竣工档案与真值调试工程竣工档案为类似的工程竣工档案,则参考调试工程竣工档案和真值调试工程竣工档案之间的匹配评分大于第一预设匹配评分。

参考调试工程竣工档案和假值调试工程竣工档案为不相似的工程竣工档案,则参考调试工程竣工档案与假值调试工程竣工档案之间的匹配评分小于第二预设匹配评分。第一预设匹配评分大于第二预设匹配评分。

此外,还可以通过类似的工程竣工档案组获取工程竣工档案调试序列,例如,若包含15个工程竣工档案组,对于任一个工程竣工档案组I,将工程竣工档案组I中的任一个工程竣工档案I-1和余下14个工程竣工档案组中的每个工程竣工档案组的任一工程竣工档案进行匹配评分获取以得到14个匹配评分。

依据匹配评分对该14个工程竣工档案组按照递减的次序排列,将排列靠中的工程竣工档案组的随机的工程竣工档案确定为假值调试工程竣工档案,将工程竣工档案组I中任一工程竣工档案确定为参考调试工程竣工档案,将工程竣工档案组I中余下的工程竣工档案确定为真值调试工程竣工档案,排列靠中的工程竣工档案可基于第三预设匹配评分进行确定。

参考调试工程竣工档案与假值调试工程竣工档案之间的匹配评分小于第二预设匹配评分但大于第三预设匹配评分,第三预设匹配评分小于第二预设匹配评分。以此得到的假值调试工程竣工档案为合适难度的工程竣工档案模板,可以优化出泛化性更好的工程竣工档案归档模型。

作为一种实施方式,通过公共描述数组抽取单元对参考调试工程竣工档案、真值调试工程竣工档案和假值调试工程竣工档案分别进行通用档案描述数组提取,得到参考调试工程竣工档案的原始档案描述数组、真值调试工程竣工档案的原始档案描述数组和假值调试工程竣工档案的原始档案描述数组,基于定位代码数组处理单元对参考调试工程竣工档案的原始档案描述数组、真值调试工程竣工档案的原始档案描述数组和假值调试工程竣工档案的原始档案描述数组分别进行数值描述数组投影处理,得到参考调试工程竣工档案的定位代码数组、真值调试工程竣工档案的定位代码数组和假值调试工程竣工档案的定位代码数组,基于定位描述数组处理单元分别对参考调试工程竣工档案的原始档案描述数组、真值调试工程竣工档案的原始档案描述数组以及假值调试工程竣工档案的原始档案描述数组进行描述数组投影处理,得到参考调试工程竣工档案的定位描述数组、真值调试工程竣工档案的定位描述数组以及假值调试工程竣工档案的定位描述数组。

步骤120:通过工程竣工档案调试序列的定位描述数组进行误差结果确定,得到工程竣工档案调试序列的档案描述数组距离误差结果。

在本申请实施例的一种实施方案中,步骤120中通过工程竣工档案调试序列的定位描述数组进行误差结果确定,得到工程竣工档案调试序列的档案描述数组距离误差结果,包括:获取参考调试工程竣工档案的定位描述数组与真值调试工程竣工档案的定位描述数组之间的第一定位描述数组差值(即数组距离),同时确定参考调试工程竣工档案与假值调试工程竣工档案之间的第二定位描述数组差值;获取第一定位描述数组差值与第一预设误差结果的第一相加结果,同时确定第一相加结果与第二定位描述数组差值之间的第一相减结果;如果第一相减结果大于0,则将第一相减结果确定为档案描述数组距离误差结果;如果第一相减结果小于或等于0,则将0值确定为档案描述数组距离误差结果。

在本申请实施例的一种实施方案中,步骤120中通过工程竣工档案调试序列的定位代码数组进行误差结果确定,得到工程竣工档案调试序列的代码数组距离误差结果,包括:确定参考调试工程竣工档案的定位代码数组与真值调试工程竣工档案的定位代码数组之间的第一定位描述数组差值,同时确定参考调试工程竣工档案与假值调试工程竣工档案之间的第二定位描述数组差值;确定第一定位描述数组差值与第二预设误差结果的第二相加结果,同时确定第二相加结果与第二定位描述数组差值之间的第二相减结果;如果第二相减结果大于0,将第二相减结果确定为代码数组距离误差结果;如果第二相减结果小于或等于0,将代码数组距离误差结果确定为0。

步骤130:通过工程竣工档案调试序列的定位代码数组进行误差结果确定,得到工程竣工档案调试序列的代码数组距离误差结果和代码数组误差结果。

在本申请实施例的一种实施方案中,步骤130中通过工程竣工档案调试序列的定位代码数组进行误差结果确定,得到工程竣工档案调试序列的代码数组误差结果,包括:对参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案分别对应的定位代码数组进行标准化处理,完成数值的归一化,得到每个定位代码数组中的每一元素对应的优化数值;获取每个定位代码数组中的每一元素与对应的优化数值的相减结果,该预设计算结果例如是各元素与优化数值间的差值,并确定差值绝对值;将和每一元素对应的差值绝对值相加获得工程竣工档案调试序列的代码数组误差结果,或者,在另一实施方式中,可以将每一元素的绝对值进行二次幂运算并相加得到工程竣工档案调试序列的代码数组误差结果。

步骤140:对工程竣工档案调试序列的档案描述数组距离误差结果、代码数组距离误差结果及代码数组误差结果中的不少于两个进行合并,将合并后获得的误差结果确定为对应工程竣工档案归档模型的第一误差结果。

工程竣工档案归档模型在优化时,将工程竣工档案归档模型的全部参变量都确定为待优化状态,优化过程中对工程竣工档案调试序列的各个工程竣工档案进行运算,得到定位描述数组和定位代码数组,依据工程竣工档案调试序列的定位描述数组计算档案描述数组距离误差结果,通过工程竣工档案调试序列的定位代码数组计算代码数组距离误差结果,通过工程竣工档案调试序列的定位代码数组计算代码数组误差结果,对三个误差结果进行求和得到总误差结果。

步骤150:通过对应工程竣工档案归档模型的第一误差结果优化工程竣工档案归档模型。

在本申请实施例的实施方案中,步骤150中通过对应工程竣工档案归档模型的第一误差结果优化工程竣工档案归档模型,包括:如果第一误差结果是通过档案描述数组距离误差结果、代码数组距离误差结果以及代码数组误差结果而获取,则通过第一误差结果优化公共描述数组抽取单元的参变量、定位代码数组处理单元的参变量以及定位描述数组处理单元的参变量,或通过第一误差结果优化定位代码数组处理单元的参变量以及定位描述数组处理单元的参变量;如果第一误差结果是通过代码数组距离误差结果以及代码数组误差结果而获取,则通过第一误差结果优化定位代码数组处理单元的参变量。

例如,通过总误差结果优化工程竣工档案归档模型的参变量的过程中,可以优化工程竣工档案归档模型所有参变量或局部参变量,优化过程中可以同时学习定位代码数组处理单元和定位描述数组处理单元,通过第一误差结果优化公共描述数组抽取单元的参变量、定位代码数组处理单元的参变量和定位描述数组处理单元的参变量,或通过第一误差结果优化定位代码数组处理单元的参变量和定位描述数组处理单元的参变量。另外,可以只优化定位代码数组处理单元,不优化定位描述数组处理单元。

在本申请实施例的一种实施方案中,待归档工程竣工档案的定位描述数组和待归档工程竣工档案的定位代码数组为依据调取工程竣工档案归档模型得到的,工程竣工档案归档模型包括公共描述数组抽取单元、定位代码数组处理单元、定位描述数组处理单元,在基于调取工程竣工档案归档模型获取待归档工程竣工档案的原始档案描述数组之前,优化公共描述数组抽取单元的参变量和定位描述数组处理单元的参变量直至对应工程竣工档案归档模型的第二误差结果符合预设的变化要求;优化公共描述数组抽取单元的参变量、定位代码数组处理单元的参变量以及定位描述数组处理单元的参变量直至对应工程竣工档案归档模型的第三误差结果符合预设的变化要求,上述的预设条件例如是误差结果的变化小于预设值。

在本申请实施例的一种实施方案中,优化公共描述数组抽取单元的参变量和定位描述数组处理单元的参变量,例如包括:基于工程竣工档案归档模型对工程竣工档案调试序列进行档案描述数组提取,得到工程竣工档案调试序列的定位描述数组;通过工程竣工档案调试序列的定位描述数组进行误差结果确定,得到工程竣工档案调试序列的档案描述数组距离误差结果,并将档案描述数组距离误差结果确定为对应工程竣工档案归档模型的第二误差结果;通过对应工程竣工档案归档模型的第二误差结果优化公共描述数组抽取单元的参变量以及定位描述数组处理单元的参变量。

例如,优化公共描述数组抽取单元的参变量和定位描述数组处理单元的参变量,仅获取档案描述数组距离误差结果,基于工程竣工档案归档模型对参考调试工程竣工档案、真值调试工程竣工档案以及假值调试工程竣工档案进行档案描述数组提取,得到参考调试工程竣工档案的定位描述数组、真值调试工程竣工档案的定位描述数组以及假值调试工程竣工档案的定位描述数组,通过参考调试工程竣工档案的定位描述数组、真值调试工程竣工档案的定位描述数组以及假值调试工程竣工档案的定位描述数组进行误差结果确定,得到档案描述数组距离误差结果。

请参照图2,本申请实施例提供的基于人工智能的工程竣工档案归档方法包括如下步骤10~步骤70。

步骤10:获取待归档工程竣工档案以及至少一个预设的归档要素。

待归档工程竣工档案是需要归类存储到对应存储空间的工程竣工档案,可以理解,该待归档工程竣工档案是电子档案,例如对纸质工程竣工档案进行扫描得到的扫描件,或者对于电子化程度高的企业,工程竣工档案是直接生成的电子档案,本申请对此不做限定。

步骤20:获取待归档工程竣工档案的原始档案描述数组。

例如,本申请实施例提供的工程竣工档案归档模型包括公共描述数组抽取单元、定位描述数组处理单元和定位代码数组处理单元,定位描述数组处理单元和定位代码数组处理单元同时连接公共描述数组抽取单元。基于工程竣工档案归档模型的公共描述数组抽取单元获取待归档工程竣工档案的原始档案描述数组。

步骤30:对待归档工程竣工档案的原始档案描述数组进行描述数组投影处理,得到待归档工程竣工档案的定位描述数组。

在本申请实施例的一种实施方案中,描述数组投影处理可以依据定位描述数组处理单元执行,定位描述数组处理单元可以包括下采样模块I(如最大池化)、正则化模块I和全连接模块I。

步骤30中对待归档工程竣工档案的原始档案描述数组进行描述数组投影处理,得到待归档工程竣工档案的定位描述数组,包括:基于下采样模块I对待归档工程竣工档案的原始档案描述数组进行池化,获得原始档案描述数组的池化值I,基于正则化模块I对池化值I进行规范化,获得原始档案描述数组的正则化值,基于全连接模块I对正则化值进行分类映射得到待归档工程竣工档案的定位描述数组。

步骤40:对待归档工程竣工档案的原始档案描述数组进行代码生成处理,得到对应于待归档工程竣工档案的定位代码数组。

在本申请实施例的一种实施方案中,代码生成处理为依据定位代码数组处理单元得到,定位代码数组处理单元包括下采样模块II、正则化模块II以及全连接模块II,步骤40中对待归档工程竣工档案的原始档案描述数组进行代码生成处理,得到对应于待归档工程竣工档案的定位代码数组,包括:基于下采样模块II对待归档工程竣工档案的原始档案描述数组进行池化,获得原始档案描述数组的池化值II,基于正则化模块II对池化值II进行规范化,得到原始档案描述数组的正则化值,基于全连接模块II对正则化值进行分类映射,得到待归档工程竣工档案的定位代码数组。

步骤50:对待归档工程竣工档案的定位代码数组进行标准化处理,得到待归档工程竣工档案的定位代码数组的第一标准化数组。

本申请实施例中的标准化处理即归一化的过程,完成二值编码将定位代码数组中小于0的值归一化为0,将大于或等于0的值归一化为1。比如,定位代码数组为[0.33、-0.22、0.11]进行标准化处理得到第一标准化数组[1、0、1]。

步骤60:通过待归档工程竣工档案的定位描述数组以及待归档工程竣工档案的第一标准化数组对多个候选已归档工程竣工档案进行相似度比较,获得和待归档工程竣工档案关联的候选已归档工程竣工档案。

在本申请实施例的一种实施方案中,步骤60中通过待归档工程竣工档案的定位描述数组和待归档工程竣工档案的第一标准化数组,对多个候选已归档工程竣工档案进行相似度比较,获得和待归档工程竣工档案关联的候选已归档工程竣工档案,可以包括以下步骤61-63。

步骤61:通过多个候选已归档工程竣工档案的第二标准化数组,确定第二标准化数组与候选已归档工程竣工档案之间的对应关系。

该步骤61中,每个第二标准化数组与一个及以上的候选已归档工程竣工档案对应。例如,包含20个候选已归档工程竣工档案,每个候选已归档工程竣工档案都包含第二标准化数组,某部分候选已归档工程竣工档案包含有相同的第二标准化数组,则各个不同的第二标准化数组具有一个及以上的候选已归档工程竣工档案,得到一对多的对应关系。

步骤62:通过第一标准化数组,在多个第二标准化数组中识别出检索标准化数组,并将检索标准化数组对应的候选已归档工程竣工档案确定为选定工程竣工档案。

在本申请实施例的一种实施方案中,步骤62中通过第一标准化数组,在多个第二标准化数组中识别出检索标准化数组,包括:获取每个第二标准化数组与第一标准化数组的数组距离,将数组距离小于预设数组距离的第二数组距离确定为检索标准化数组。或者对第一标准化数组进行依据预设数组距离的转换处理,得到转换标准化数组,将多个第二标准化数组中与转换标准化数组一致的第二数组距离确定为检索标准化数组。

步骤63:确定检索标准化数组对应的候选已归档工程竣工档案的定位描述数组与待归档工程竣工档案的定位描述数组之间的矢量差值,将矢量差值大于预设矢量差值的候选已归档工程竣工档案确定为选定工程竣工档案。

在本申请实施例的步骤63中,检索标准化数组对应有一个及以上的候选已归档工程竣工档案,比如检索标准化数组A对应有候选已归档工程竣工档案I,检索标准化数组B对应有候选已归档工程竣工档案II和III,确定候选已归档工程竣工档案I、候选已归档工程竣工档案II和候选已归档工程竣工档案III的定位描述数组与待归档工程竣工档案的定位描述数组之间的矢量差值,将矢量差值大于预设矢量差值的候选已归档工程竣工档案确定为选定工程竣工档案。

另一种实施方式中,可以直接将检索标准化数组对应的候选已归档工程竣工档案确定为选定工程竣工档案,将匹配结果按矢量差值的大小按序排布。本申请实施例直接基于步骤20、40和50得到定位代码数组的第一数组距离确定为共性匹配的依据,省去了多余的运算消耗,提升效率,同时在模型优化过程中,对存储空间依赖较小,优化过程可以小批量反复进行。

在本申请实施例的一种实施方案中,步骤61确定第二标准化数组与候选已归档工程竣工档案之间的对应关系的步骤之前,获取多个候选已归档工程竣工档案的原始档案描述数组;对多个候选已归档工程竣工档案的原始档案描述数组进行代码生成处理,得到对应于多个候选已归档工程竣工档案的定位代码数组;对多个候选已归档工程竣工档案的定位代码数组进行标准化处理,得到多个候选已归档工程竣工档案的定位代码数组的第二标准化数组;在步骤63中确定检索标准化数组对应的候选已归档工程竣工档案的定位描述数组与待归档工程竣工档案的定位描述数组之间的矢量差值之前,对多个候选已归档工程竣工档案的原始档案描述数组进行描述数组投影处理,得到多个候选已归档工程竣工档案的定位描述数组。

例如,先对候选已归档工程竣工档案进行比较,将多个候选已归档工程竣工档案各自输入工程竣工档案归档模型,以得到定位描述数组以及定位代码数组的编码结果,在定位代码数组处理单元获得定位代码数组后通过标准化处理得到第二标准化数组,保存候选已归档工程竣工档案与定位描述数组的对应关系,对多个第二标准化数组进行去重,获得多个不同的归一值,关联至候选已归档工程竣工档案。

在本申请实施例的一种实施方案中,为了优化工程竣工档案归档模型,需要事先整理工程竣工档案调试序列,工程竣工档案调试序列可以是依据工程竣工档案组得到的,工程竣工档案组已被注释出彼此是否是相同的工程竣工档案,在进行匹配评分优化的过程中,是通过匹配的工程竣工档案组进行优化。为了优化获得的定位代码数组可以代表工程竣工档案组之间的匹配评分,则可以通过相同的工程竣工档案组优化定位代码数组。

本申请实施例中,工程竣工档案归档模型是基于工程竣工档案调试序列优化得到,通过相似的工程竣工档案组作为模型输入信息,在每代的多个工程竣工档案组中进行抽取得到三元组工程竣工档案模板。比如对工程竣工档案组I而言,在余下的多个工程竣工档案组的各个工程竣工档案组中任选一个工程竣工档案,获取确定的工程竣工档案与工程竣工档案组I中任一工程竣工档案的匹配情况,清洗掉确定的工程竣工档案中前面部分工程竣工档案,该部分工程竣工档案可能是与工程竣工档案组I类似的工程竣工档案,因而得清洗掉。

工程竣工档案组只能反映工程竣工档案组包含的两个工程竣工档案是类似的,不代表不同的工程竣工档案组之间是类似的,则每一代可能确定到工程竣工档案组I和工程竣工档案组B类似,选择余下的靠前的P个工程竣工档案为假值模板,将假值模板均与工程竣工档案组I构成工程竣工档案调试序列,工程竣工档案组I中任一工程竣工档案为真值模板,另一工程竣工档案为参考模板,则每个工程竣工档案组I可以得到P个的工程竣工档案调试序列,最后获得P×Q个工程竣工档案调试序列,Q为一代优化中工程竣工档案组的数量。

在本申请实施例的一种实施方案中,工程竣工档案归档模型包括公共描述数组抽取单元、定位描述数组处理单元、定位代码数组处理单元,公共描述数组抽取单元、定位描述数组处理单元和定位代码数组处理单元的如前文所述。

模型应用中,对定位代码数组处理单元的输出激活,公共描述数组抽取单元可以是残差网络,定位描述数组处理单元和定位代码数组处理单元可以是其他网络,将两个网络组合并与全连接模块连接,得到定位代码数组处理单元的输出,可以包括全连接模块(F)和激活单元(A),组合后的网络可以包含F-A-F-A-F结构,A的激活函数不做限定。采取上述结构在获取定位描述数组时,可以同时获得定位代码数组,通过激活算法将定位代码数组进行代码生成,杜绝了多次学习增加额外流程,通过公共描述数组抽取单元的并行优化,在工程竣工档案归档模型中同时产生定位描述数组和定位代码数组的数值结果,具备匹配的定位描述数组的两个工程竣工档案不会因为定位代码数组不同而被分离。

步骤70:将待归档工程竣工档案归类存储至关联的候选已归档工程竣工档案所在的存储空间。

综上,在本申请实施例的一种实施方案中,在工程竣工档案归档模型正向传递时,将全部参变量均设定成待优化,优化过程中对输入的工程竣工档案调试序列的每个工程竣工档案进行处理,得到定位描述数组以及定位代码数组,通过工程竣工档案调试序列的定位描述数组获取档案描述数组距离误差结果,通过工程竣工档案调试序列的定位代码数组获取代码数组距离误差结果,通过工程竣工档案调试序列的定位代码数组获取代码数组误差结果,将三个误差结果进行求和得到总误差结果。

请参照图3,是本发明实施例提供的工程竣工档案归档装置110的功能模块架构示意图,该工程竣工档案归档装置110可用于执行基于人工智能的工程竣工档案归档方法,其中,工程竣工档案归档装置110包括:

基础数据获取模块111,用于获取待归档工程竣工档案以及至少一个预设的归档要素;

原始数组获取模块112,用于获取所述待归档工程竣工档案中所述至少一个预设的归档要素关联的档案内容的原始档案描述数组;

描述数组投影模块113,用于对所述待归档工程竣工档案的原始档案描述数组进行描述数组投影处理,得到所述待归档工程竣工档案的定位描述数组;

代码数组生成模块114,用于对所述待归档工程竣工档案的原始档案描述数组进行代码生成处理,得到对应于所述待归档工程竣工档案的定位代码数组;

标注数组生成模块115,用于对所述待归档工程竣工档案的定位代码数组进行标准化处理,得到所述待归档工程竣工档案的定位代码数组的第一标准化数组;

关联档案确定模块116,用于通过所述待归档工程竣工档案的定位描述数组以及所述待归档工程竣工档案的第一标准化数组对多个候选已归档工程竣工档案进行相似度比较,获得和所述待归档工程竣工档案关联的候选已归档工程竣工档案;

工程档案存储模块117,用于将所述待归档工程竣工档案归类存储至所述关联的候选已归档工程竣工档案所在的存储空间。

其中,基础数据获取模块111可用于执行步骤10;原始数组获取模块112可用于执行步骤20;描述数组投影模块113可用于执行步骤30;代码数组生成模块114可用于执行步骤40;标注数组生成模块115可用于执行步骤50;关联档案确定模块116可用于执行步骤60;工程档案存储模块117可用于执行步骤70。

由于在上述实施例中,已经对本发明实施例提供的基于人工智能的工程竣工档案归档方法进行了详细的介绍,而该工程竣工档案归档装置110的原理与该方法相同,此处不再对工程竣工档案归档装置110的各模块的执行原理进行赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

需要理解的是,针对上述内容没有进行名词解释的技术术语,本领域技术人员可以根据上述所公开的内容进行前后推导毫无疑义地确定其所指代的含义。本申请实施例公开的上述内容对于本领域技术人员而言是清楚完整的。应当理解,本领域技术人员基于上述公开的内容对未作解释的技术术语进行推导和分析的过程是基于本申请所记载的内容进行的,因此上述内容并不是对整体方案的创造性的评判。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可以对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。

同样应当理解的是,为了简化本申请揭示的表述,从而帮助对至少一个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法幷不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

技术分类

06120115636838