文档处理方法及装置
文献发布时间:2023-06-19 11:52:33
技术领域
本申请涉及一种文档处理方法及装置,属于计算机技术领域。
背景技术
现有的技术标文件在撰写完成后,需要检查该技术标文件的格式是否满足要求。例如:检查技术标文件中的字体大小,段落等是否满足格式要求。
现有的检查方式为:人为在技术标文件中检查格式是否满足要求,如有错误格式,则手动修改技术标文件的格式。
然而,人为检查格式及修改格式,效率比较低且容易出错。
发明内容
本申请提供了一种文档处理方法及装置,可以解决人工检查技术标文件时效率和准确性低的问题。本申请提供如下技术方案:
第一方面,提供了一种文档处理方法,所述方法包括:
获取模板文件,所述模板文件包括检查点和每个检查点对应的模板属性,所述模板属性包括自定义属性和/或固定属性,所述自定义属性包括至少一种属性分类的自定义组合以及自定义属性取值;所述固定属性包括一个属性分类和所述属性分类的固定属性值;所述检查点用于指示检查位置;
导入待检查文件,按照所述检查点获取所述待检查文件中的文本样式;
将每个检查点对应的文本样式的样式属性与对应的模板属性进行对比;
显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性。
可选地,所述获取模板文件,包括:
生成模板样式,所述模板样式包括所述模板属性;
将所述模板样式转换成各个检查点的固定格式,得到所述模板文件。
可选地,所述模板样式中的模板属性包括所述自定义属性,所述生成模板样式,包括:
接收用户输入的属性分类的组合,以及每种属性分类对应的自定义属性值,得到所述自定义属性;或者,
接收标准文本;识别所述标准文本中文本的属性分类以及对应的自定义属性值,得到所述自定义属性。
可选地,所述检查点的位置信息包括:所述检查点所在文字和/或段落。
可选地,所述显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性之后,还包括:
将所述错误属性自动优化为对应的模板属性,得到优化后的文档。
可选地,所述将所述错误属性自动优化为对应的模板属性之后,还包括:
对所述优化后的文档中,每个检查点对应的优化后的文本样式的样式属性与对应的模板属性进行对比;
在存在对比结果不一致的检查点时,确定所述检查点为无法优化的检查点;
显示所述无法优化的检查点的位置信息、错误属性和对应的模板属性。
可选地,所述将所述错误属性自动优化为对应的模板属性之后,还包括:
导出所述优化后的文档。
可选地,所述属性分类包括以下几种中的至少一种:字号、字体、段落、缩进、页面大小、行间距。
可选地,所述检查点包括以下几种中的至少一种:目录、表格和段落。
第二方面,提供了一种文档处理装置,所述装置包括:
模板获取模块,用于获取模板文件,所述模板文件包括检查点和每个检查点对应的模板属性,所述模板属性包括自定义属性和/或固定属性,所述自定义属性包括至少一种属性分类的自定义组合以及自定义属性取值;所述固定属性包括一个属性分类和所述属性分类的固定属性值;所述检查点用于指示检查位置;
文件获取模块,用于导入待检查文件,按照所述检查点获取所述待检查文件中的文本样式;
文件检查模块,用于将每个检查点对应的文本样式的样式属性与对应的模板属性进行对比;
信息显示模块,用于显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性。
本申请的有益效果在于:通过获取模板文件,模板文件包括检查点和每个检查点对应的模板属性,模板属性包括自定义属性和/或固定属性,自定义属性包括至少一种属性分类的自定义组合以及自定义属性取值;固定属性包括一个属性分类和属性分类的固定属性值;检查点用于指示检查位置;导入待检查文件,按照检查点获取待检查文件中的文本样式;将每个检查点对应的文本样式的样式属性与对应的模板属性进行对比;显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性;可以解决人工检查技术标文件时效率和准确性低的问题;可以实现文件的自动检查,提高文件检查效率。
另外,通过检查到错误的属性后进行自动优化,可以提高文档优化效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
图1是本申请一个实施例提供的文档处理方法的流程图;
图2是本申请一个实施例提供的文档处理装置的框图;
图3是本申请一个实施例提供的文档处理装置的框图。
具体实施方式
下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
可选地,本申请以各个实施例的执行主体为具有处理能力的电子设备为例进行说明,该电子设备可以为台式电脑、笔记本电脑、平板电脑、手机、服务器等,本实施例不对计算机设备的设备类型作限定。本实施例中,电子设备中预先运行有技术标规则编辑系统,该技术标规则编辑系统生成专属格式的技术标检查规则文件,可以把此文件作为附件插入到需要检查的文件中,实现了规则模块化使用的方式,手动导入需要检查的文件,自动读取文件中的规则附件,提取规则库内的检查方法针对需要检查的文件进行比对检查及优化,省去人工并且更加智能化。下面对技术标规则编辑系统的文档处理方法进行详细介绍。
图1是本申请一个实施例提供的文档处理方法的流程图。该方法至少包括以下几个步骤:
步骤101,获取模板文件,模板文件包括检查点和每个检查点对应的模板属性,模板属性包括自定义属性和/或固定属性,自定义属性包括至少一种属性分类的自定义组合以及自定义属性取值;固定属性包括一个属性分类和属性分类的固定属性值;检查点用于指示检查位置。
可选地,模板文件可以是其它设备发送的,或者是电子设备中的技术标规则编辑系统生成的。以后者为例,获取模板文件,包括:生成模板样式,模板样式包括模板属性;将模板样式转换成各个检查点的固定格式,得到模板文件。
在模板样式中的模板属性包括自定义属性的情况下,生成模板样式,包括:接收用户输入的属性分类的组合,以及每种属性分类对应的自定义属性值,得到自定义属性;或者,接收标准文本;识别标准文本中文本的属性分类以及对应的自定义属性值,得到自定义属性。
其中,属性分类包括以下几种中的至少一种:字号、字体、段落、缩进、页面大小、行间距。当然,属性分类还可以包括其它分类,本实施例在此不再一一列举。
可选地,技术标规则编辑系统为检查规则建立了一个规则库,规则库包括多种固定属性,可以供用户对固定属性进行选择。另外,规则库还提供规则编辑功能,以供用户输入自定义属性。
可选地,规则库获取到自定义属性后,还可以上传至云端,以使其它用户无需编辑直接使用。
检查点包括以下几种中的至少一种:目录、表格和段落。段落是指每段的起始位置。
步骤102,导入待检查文件,按照检查点获取待检查文件中的文本样式。
本实施例中,在技术标规则编辑系统中导入待检查文件,以使技术标规则编辑系统按照检查点获取待检查文件中的文本样式。
步骤103,将每个检查点对应的文本样式的样式属性与对应的模板属性进行对比。
技术标规则编辑系统将待检查文件中的样式属性与模板属性进行对比,逐一检查。之后,将错误检查点(即下文中的对比结果不一致的检查点)的所在文字、段落、标准检查点的属性、检查点的错误属性记录到数据库。
步骤104,显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性。
可选地,检查点的位置信息包括:检查点所在文字和/或段落。
为了提高文本属性的优化效果,在显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性之后,还包括:将错误属性自动优化为对应的模板属性,得到优化后的文档。
可选地,将错误属性自动优化为对应的模板属性之后,还包括:对优化后的文档中,每个检查点对应的优化后的文本样式的样式属性与对应的模板属性进行对比;在存在对比结果不一致的检查点时,确定检查点为无法优化的检查点;显示无法优化的检查点的位置信息、错误属性和对应的模板属性。
可选地,将错误属性自动优化为对应的模板属性之后,还包括导出优化后的文档。
综上所述,本实施例提供的文档处理方法,通过获取模板文件,模板文件包括检查点和每个检查点对应的模板属性,模板属性包括自定义属性和/或固定属性,自定义属性包括至少一种属性分类的自定义组合以及自定义属性取值;固定属性包括一个属性分类和属性分类的固定属性值;检查点用于指示检查位置;导入待检查文件,按照检查点获取待检查文件中的文本样式;将每个检查点对应的文本样式的样式属性与对应的模板属性进行对比;显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性;可以解决人工检查技术标文件时效率和准确性低的问题;可以实现文件的自动检查,提高文件检查效率。
另外,通过检查到错误的属性后进行自动优化,可以提高文档优化效率。
图2是本申请一个实施例提供的文档处理装置的框图。该装置至少包括以下几个模块:模板获取模块210、文件获取模块220、文件检查模块230和信息显示模块240。
模板获取模块210,用于获取模板文件,所述模板文件包括检查点和每个检查点对应的模板属性,所述模板属性包括自定义属性和/或固定属性,所述自定义属性包括至少一种属性分类的自定义组合以及自定义属性取值;所述固定属性包括一个属性分类和所述属性分类的固定属性值;所述检查点用于指示检查位置;
文件获取模块220,用于导入待检查文件,按照所述检查点获取所述待检查文件中的文本样式;
文件检查模块230,用于将每个检查点对应的文本样式的样式属性与对应的模板属性进行对比;
信息显示模块240,用于显示对比结果不一致的检查点的位置信息、错误属性和对应的模板属性。
相关细节参考上述方法实施例。
需要说明的是:上述实施例中提供的文档处理装置在进行文档处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将文档处理装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的文档处理装置与文档处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图3是本申请一个实施例提供的文档处理装置的框图。该装置至少包括处理器301和存储器302。
处理器301可以包括一个或多个处理核心,比如:4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器301所执行以实现本申请中方法实施例提供的文档处理方法。
在一些实施例中,文档处理装置还可选包括有:外围设备接口和至少一个外围设备。处理器301、存储器302和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。示意性地,外围设备包括但不限于:射频电路、触摸显示屏、音频电路、和电源等。
当然,文档处理装置还可以包括更少或更多的组件,本实施例对此不作限定。
可选地,本申请还提供有一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的文档处理方法。
可选地,本申请还提供有一种计算机产品,该计算机产品包括计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的文档处理方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
- 文档处理装置、文档处理系统、记录介质及文档处理方法
- 手写文档处理装置,手写文档处理方法,和手写文档处理程序