掌桥专利:专业的专利平台
掌桥专利
首页

文档字段信息的处理方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 16:12:48



技术领域

本申请涉及数字化服务领域,尤其涉及一种文档字段信息的处理方法、装置、电子设备和存储介质。

背景技术

数字技术是推动政务服务高效化、便捷化的重要手段。依托数字化平台技术和相关数据库,公众在申请办理政务事项时,数字化政务服务平台可以自动获取相关信息填充到版式文件模板中,以生成事项审批文件,无需公众手写表单文件。

相关技术中,需要后台配置人员预先制作版式文件,手动将版式文件中的字段填充区域与字段进行绑定,流程复杂,存在效率低下、容易出错等问题。

发明内容

本申请实施例提供一种文档字段信息的处理方法、装置、电子设备和存储介质,以解决相关技术存在的问题,技术方案如下:

第一方面,本申请实施例提供了一种文档字段信息的处理方法,包括:

确定目标事项对应的多个待处理字段;

基于多个待处理字段,得到初始文档以及多个待处理字段中的每个字段在初始文档中的填充位置;

基于初始文档进行排版,得到目标事项对应的版式文件;

基于每个字段在初始文档中的填充位置以及排版过程中的布局调整信息,确定每个字段在版式文件中的填充位置。

第二方面,本申请实施例提供了一种文档字段信息的处理装置,包括:

字段确定模块,用于确定目标事项对应的多个待处理字段;

表格创建模块,用于基于多个待处理字段,得到初始文档以及多个待处理字段中的每个字段在初始文档中的填充位置;

文件排版模块,用于基于初始文档进行排版,得到目标事项对应的版式文件;

位置确认模块,用于基于每个字段在初始文档中的填充位置以及排版过程中的布局调整信息,确定每个字段在版式文件中的填充位置。

第三方面,本申请实施例提供一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器在执行计算机程序时实现本申请任一实施例提供的方法。

第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本申请任一实施例提供的方法。

第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本申请任一实施例提供的方法。

根据本申请实施例的技术方案,在制作政务事项审批的版式文件时,由于在排版之前先获取了字段在初始文档中的填充位置,因此,可以根据排版过程中的布局调整信息得到字段在版式文件中的填充位置,无需手动对各字段和版式文件中的各填充区域的位置进行绑定,从而可以提高获取版式文件中填充位置的效率和准确性。

上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。

图1是本申请相关技术中生成事项审批文件的流程示意图。

图2是一种示例性的可用于实现本申请文档字段信息的处理方法的场景的示意图;

图3是本申请一实施例提供的文档字段信息的处理方法的流程示意图;

图4是本申请另一实施例提供的文档字段信息的处理方法的流程示意图;

图5是本申请文档字段信息的处理方法的一个应用示例的流程示意图;

图6是本申请一实施例提供的文档字段信息的处理装置的结构框图;

图7是本申请另一实施例提供的文档字段信息的处理装置的结构框图;

图8是用于实现本申请文档字段信息的处理方法的电子设备的结构框图。

具体实施方式

在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。

为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明,以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。

图1示出了相关技术中生成事项审批文件的流程示意图。如图1所示,针对某种政务事项,后台配置人员开始制作版式文件。后台配置人员可以采用文本编辑软件(例如word软件)制作静态样表,具体地,可以基于文本编辑软件中的文字编辑、表格编辑等功能定义内容布局。然后,将制作好的静态样表导出为版式文件,用作事项审批文件的模板。在本申请实施例中,版式文件可以指版面呈现效果固定的电子文档,例如PDF(Portable DocumentFormat,可携带文档格式)文档,即版式文件的呈现效果不因软硬件环境、操作者的变化而变化。

在导出版式文件之后,通过人工方式或自动识别工具在导出的版式文件中确定出动态信息的填充区域。后台配置人员手动将这些填充区域与表单字段绑定,确定各个填充区域分别是用于填充哪个表单字段的信息。

针对某个用户的政务事项办理请求,可以利用渲染器(例如PDF渲染器)将用户的表单字段信息填充到该版式文件中,然后渲染生成最终的事项审批文件,该文件例如是PDF文件。

在上述流程中,不仅需要后台配置人员耗费时间采用文本编辑软件制作样表作为模板,在制作模板后还需要人工绑定字段。整体流程较复杂,并且人工编辑、绑定字段容易因人工手误等原因出错。

本申请实施例提供的文档字段信息的处理方法,主要为了解决以上技术问题中的至少一个。

为了更清楚地展示本申请实施例中提供的文档字段信息的处理方法,首先介绍一个示例性的可用于实现该方法的场景。图2为该场景的示意图。如图2所示,政务服务平台客户端100通过网络连接政务服务平台服务端200。用户可以利用政务服务平台客户端100填写表单信息以及发起针对政务事项的服务请求。在本申请实施例中,用户包括有事项办理需求的公众;表单为事项中必要填写的各种字段对应的用户信息的集合,例如用户姓名、职业等信息。

服务端200中配置有数据库210,其中存储用户填写的表单。服务端200包括文档字段信息的处理装置220,用于实现本申请实施例提供的文档字段信息的处理方法。装置220可以读取数据库中的字段和对应的用户信息。装置220通过读取字段,以生成用作事项审批文件模板的版式文件;通过读取字段对应的用户信息,以填充该版式文件得到供用户签章确认并提交到政务服务平台进行审批的事项审批文件。

图3示出了本申请一实施例提供的文档字段信息的处理方法的流程示意图。该方法可选地可以应用于上述装置,但不仅限于此。该方法包括:

S310、确定目标事项对应的多个待处理字段;

S320、基于多个待处理字段,得到初始文档以及多个待处理字段中的每个字段在初始文档中的填充位置;

S330、基于初始文档进行排版,得到目标事项对应的版式文件;

S340、基于每个字段在初始文档中的填充位置以及排版过程中的布局调整信息,确定每个字段在版式文件中的填充位置。

示例性地,目标事项可以为待生成事项审批的模板文件的政务事项,例如证明开具事项、信息查询事项、服务申请事项等。目标事项对应的字段,可以指办理该事项所需填写的信息的类型或属性,例如姓名、职业、联系方式等。实际应用中,上述步骤S310的多个待处理字段,可以是目标事项对应的部分或全部字段。

示例性地,本申请实施例中的初始文档,可以包含各字段的信息填充区域。例如,初始文档中可以包含表格,信息填充区域可以是表格中用于填写信息的单元格。在步骤S320中,通过在表格中为多个待处理字段分配信息填充区域,可以得到初始文档。这里,字段在初始文档中的填充位置即字段对应的信息填充区域的位置信息。实际应用中,填充位置可以包括信息填充区域的顶点坐标、长度、宽度等位置信息,例如,填充位置可以表示为(x,y,w,h),其中,x为信息填充区域的左上顶点的横坐标,y为信息填充区域的左上顶点的纵坐标,w为信息填充区域的宽度,h为信息填充区域的高度。

示例性地,基于初始文档进行排版,即对初始文档中各区域的布局进行调整,例如放大、缩小、左移、右移某个信息填充区域等。在确定排版结束后,可以将调整后的表格文件输出为版式文件例如PDF文件以使版面固定不可调。

在本申请实施例中,排版过程中的布局调整信息,可以指排版过程中对各区域的放大尺寸、缩小尺寸、左移距离、右移距离等信息。

根据上述描述,在得到目标事项对应的初始文档时,执行上述方法的装置/电子设备获取每个待处理字段在初始文档中的填充位置,之后再进行排版。也就是说,在排版之前,该装置/电子设备已得到表格中各信息填充区域与待处理字段之间的映射关系,并记录各字段对应的信息填充区域的位置信息。在排版过程中,各信息填充区域的位置信息随着对各区域的布局调整而变化,该装置/电子设备基于各信息填充区域原来的位置信息以及布局调整信息,得到各信息填充区域在上述版式文件中的位置信息,即各字段在版式文件中的填充位置。可见,本申请实施例中先建立信息填充区域与字段之间的映射关系再进行排版,相比相关技术中先排版固定版式后再对信息填充区域与字段进行绑定,具有流程简单的特点,且不需要人工绑定,可以提高获取版式文件中填充位置的效率和准确性。

在一种示例性的实施方式中,如图4所示,上述方法还可以包括:

S410、响应于接收到第一用户针对目标事项发起的服务请求,基于每个字段,在第一用户的表单信息集合中读取对应的待填充信息;

S420、基于每个字段在版式文件中的填充位置,将待填充信息填充到版式文件中,得到第一用户的事项审批文件。

示例性地,可以结合图2所示的应用场景,各用户的表单信息集合存储在政务服务平台服务端的数据中。可选地,表单信息集合中包含的用户信息可以是用户在发起服务请求时输入的,也可以是政务服务平台从其他政务系统中预先获得的。

示例性地,上述待填充信息为办理目标事项所需填写的各字段的用户信息。在读取上述待填充信息之后,基于每个字段在版式文件中的填充位置,可以准确地将待填充信息填充至对应的信息填充区域,从而得到填满必要信息的版式文件,作为第一用户的事项审批文件,该文件可以提交至政务服务平台,供后台审批人员审批处理。

作为一种可选的示例性实施方式,上述步骤S310,确定目标事项对应的多个待处理字段,可以包括:

基于待处理情形,在目标事项对应的字段集合中过滤出与待处理情形相关的多个字段;

基于与待处理情形相关的多个字段,得到多个待处理字段。

上述待处理情形为当前待生成的版式文件所针对的情形。实际应用中,针对同一事项,不同的情形具有不同的相关字段,例如,不同职业的用户在申报同一事项服务时,需要填写的字段信息不同。

在本申请实施例中,可以从政务服务平台服务端的数据库中共享出目标事项对应的字段集合,再基于待处理情形,从该字段集合中过滤出与待处理情形相关的多个字段,将过滤得到的多个字段作为上述待处理字段或者从过滤得到的多个字段中选择一些字段作为上述待处理字段,以生成版式文件。可见,本申请实施例支持从后台数据中自动共享、过滤出与目标事项、情形相关的字段,无需人工填写字段,因此能够提高版式文件的制作效率,并且杜绝了因手误填错等原因反复调试版式文件的问题。

作为一种可选的示例性实施方式,上述方法还包括待处理情形的确定步骤。具体地,上述方法还包括:

确定与目标事项相关的用户属性;

基于用户属性的多个取值,确定目标事项的多个情形;

在多个情形中确定待处理情形。

示例性地,与目标事项相关的用户属性,可以决定办理目标事项所需填写的字段信息类型。例如,针对不同职业,办理目标事项所需填写的字段信息不同,则职业是一种与目标事项相关的用户属性。

实际应用中,与目标事项相关的用户属性可以有多种,则目标事项的多个情形可以是多种用户属性的取值的组合。例如,与目标事项相关的用户属性包括职业和学历,其中,职业和学历各有3个取值,可以组合成9种情形,因此,目标事项对应有9种情形。

示例性地,可以遍历每种情形,将遍历到的情形作为待处理情形,从而可以针对目标事项的各种情形获得版式文件,高效、准确地获得目标事项对应的全部版式文件以及其中各字段的填充位置。

作为一种可选的示例性实施方式,上述步骤S320中,基于多个待处理字段得到初始文档,包括:

基于每个字段的字段类型,确定每个字段的填充需求信息;

在预配置文件中基于每个字段的填充需求信息,为每个字段分配表格区域,得到初始文档。

示例性地,填充需求信息可以包括字段所需的填充区域的宽度、次序等。不同的字段类型对应不同的填充需求信息。例如,重要的字段需要填充区域次序靠前,地址类字段需要较宽的填充区域。

示例性地,预配置文件可以是预配置了页面背景的文件或空白文档等。根据上述实施方式,在预配置文件中基于字段的填充需求信息为字段分配表格区域,从而得到初始文档,可以使初始表格中的表格区域分配合理,有利于减少排版过程中的布局调整幅度和次数,从而提高效率。

作为一种可选的示例性实施方式,上述步骤S330中,对初始文档进行排版,包括:

在编辑器界面中显示初始文档;

响应于在编辑器界面上检测到第二用户对初始文档的布局调整操作,基于布局调整操作对初始文档进行排版。

示例性地,可以在政务服务平台的客户端中提供编辑器界面,以供第二用户例如后台配置人员对初始文档进行排版。

示例性地,上述布局调整操作可以包括放大信息填充区域、缩小信息填充区域、移动信息填充区域、更改信息填充区域的呈现次序等操作。具体可以通过点击、拖拽、输入数值等方式实现。通过提供在线制作版式文件的方式,可以加快版式文件的制作流程,提供了更大的便携性。

为了更清楚地呈现本申请的技术思路,下面提供一个具体的应用示例。

如图5所示,该应用示例包括以下步骤:

S510、从表单的字段列表中叠加组合得到不同的情形,针对待处理情形,共享出表单中情形过滤后的字段;

S520、在过滤后的字段中选择实际所需的字段列表;

S530、在线排版,生成用作在线模板的版式文件;

S540、渲染最终PDF文件,作为事项审批文件。

可以看到,根据本申请实施例的方法,在制作事项审批的版式文件时,由于在排版之前先获取了字段在初始文档中的填充位置,因此,可以根据排版过程中的布局调整信息得到字段在版式文件中的填充位置,无需手动对各字段和版式文件中的各填充区域的位置进行绑定,从而可以提高获取版式文件中填充位置的效率和准确性。

与本申请实施例提供的方法的应用场景以及方法相对应地,本申请实施例还提供一种文档字段信息的处理装置600。参考图6,该装置600可以包括:

字段确定模块610,确定目标事项对应的多个待处理字段;

表格创建模块620,用于基于多个待处理字段,得到初始文档以及多个待处理字段中的每个字段在初始文档中的填充位置;

文件排版模块630,用于基于初始文档进行排版,得到目标事项对应的版式文件;

位置确认模块640,用于基于每个字段在初始文档中的填充位置以及排版过程中的布局调整信息,确定每个字段在版式文件中的填充位置。

示例性地,如图7所示,上述装置600还包括:

信息读取模块710,用于响应于接收到第一用户针对目标事项发起的服务请求,基于每个字段,在第一用户的表单信息集合中读取对应的待填充信息;

信息填充模块720,用于基于每个字段在版式文件中的填充位置,将待填充信息填充到版式文件中,得到第一用户的事项审批文件。

示例性地,如图7所示,上述文件排版模块630包括:

表格显示单元631,用于在编辑器界面中显示初始文档;

布局调整单元632,用于响应于在编辑器界面上检测到第二用户对初始文档的布局调整操作,基于布局调整操作对初始文档进行排版。

示例性地,如图7所示,字段确定模块610包括:

字段过滤单元611,用于基于待处理情形,在目标事项对应的字段集合中过滤出与待处理情形相关的多个字段;

字段获取单元612,用于基于与待处理情形相关的多个字段,得到多个待处理字段。

示例性地,装置600还包括:

属性确定模块,用于确定与目标事项相关的用户属性;

情形确定模块,用于基于用户属性的多个取值,确定目标事项的多个情形;

情形过滤模块,用于在多个情形中确定待处理情形。

示例性地,如图7所示,表格创建模块620,包括:

需求确定单元621,用于基于每个字段的字段类型,确定每个字段的填充需求信息;

区域分配单元622,用于在预配置文件中基于每个字段的填充需求信息,为每个字段分配表格区域,得到初始文档。

本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,并具备相应的有益效果,在此不再赘述。

本申请实施例还提供了一种用于实现上述方法的电子设备。图8示出根据本申请实施例的电子设备的结构框图。如图8所示,该电子设备包括:存储器810和处理器820,存储器810内存储有可在处理器820上运行的计算机程序。处理器820执行该计算机程序时实现上述实施例中的文档字段信息的处理方法。存储器810和处理器820的数量可以为一个或多个。

该电子设备还包括:

通信接口830,用于与外界设备进行通信,进行数据交互传输。

如果存储器810、处理器820和通信接口830独立实现,则存储器810、处理器820和通信接口830可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储器810、处理器820及通信接口830集成在一块芯片上,则存储器810、处理器820及通信接口830可以通过内部接口完成相互间的通信。

本申请实施例还提供一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本申请任一实施例中提供的方法。

本申请实施例还提供一种计算机程序产品,其包括计算机程序,该计算机程序在被处理器执行时实现本申请任一实施例中提供的方法。

本申请实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。

本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。

应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(Advanced RISC Machines,ARM)架构的处理器。

进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(Sync Link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。

应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 文档字段信息的处理方法、装置、电子设备和存储介质
  • 一种扫描文档信息处理方法、装置、电子设备及存储介质
技术分类

06120114739704