掌桥专利:专业的专利平台
掌桥专利
首页

一种文档数据录入的方法及系统

文献发布时间:2023-06-19 11:22:42


一种文档数据录入的方法及系统

技术领域

本发明涉及计算机文档编辑技术领域,具体是一种文档数据录入的方法及系统。

背景技术

数字化使企业提效的基础就是让一切变成可以分析的数据,这必然包括在企业生产经营流程中出现的文档,通过高效准确的提取文档中的数据能够十分有效的加速企业业务运转,比如,企业财务如果能够实时的获取销售合同的数据,将有助于更加及时的掌控企业现金流;检测机构如果能够实时的获取检测报告的数据,将有助于更加及时的通知送检单位;诸如此类,依赖各类关键性文档中承载的数据的应用场景不胜枚举,可见,提取文档中的数据技术就十分关键。

但是现有的文档编辑系统,仅仅支持了任意格式文档的数据录入,然而无法支持对于文档数据字段录入时的细粒度控制(例如数值类型、大小范围和数值枚举),更不具备文档数据的交互能力,而具备数据交互能力的现有系统,本质上不是文档系统,无法支持任意格式的文档数据录入。因此,本领域技术人员提供了一种文档数据录入的方法及系统,以解决上述背景技术中提出的问题。

发明内容

本发明的目的在于提供一种文档数据录入的方法及系统,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种文档数据录入的方法及系统,该文档录入系统包括:

文档模板,用于操作者根据文档内容结构为语义背景,在文档需要录入数据的部分进行数据录入;

规则集,用于定义文档模板中所有待录入数据项的录入规则,并以数据项在文档中的页码值为基准,将规则划分到不同规则文件中;

参数集,用于保存文档模板中所用待录入数据项对应录入的参数,并以数据项在文档中的页码值为基准,将录入参数划分到不同参数文件中;

数据文档集,用于保存文档录入数据完毕后,转化生成的各种格式文档;

控件库,用于确保标签数据类型集中定义的每一种数据类型,在文档数据类型输入控件库中都存在一个对应的数据输入控件;

解析引擎,用于解析文档的格式,并生成可操作的人机交付功能模块、以支持任意格式文档数据的录入功能;

该文档数据录入的方法包括以下步骤:

S1、文档模板制作方式;

建立一种包含语义的唯一标签,进行定义,形成标签数据类型集,通过蕴含的语义能够识别录入数据项所需的数据类型;

S2、建立文档数据输入控件库;

基于上述标签数据类型集,实现对应的校验型数据录入控件,构成文档数据输入控件库;

S3、文档数据的存储结构;

将文档数据采用一种多维坐标体系进行定位,利用多维坐标值构成存储项的key,数据值构成存储项的value,具体包括:单维录入型、二维录入型、图片型;

S4、建立文档数据描述报文,用于清晰的表达文档数据录入过程中,涉及的各项数据校验规则与交付规则;

S5、建立文档数据描述报文的可视化编织方法,并建立一种文档语法对上述文档数据描述报文进行定义;

S6、将文档模板、文档数据描述报文、已录入数据集封装为一体,形成一种自定义的文档类型,即WRS文档;

S7、设计建立解析引擎,解析WRS文档的格式,并生成可操作的人机交付功能模块、以支持任意格式文档数据的录入功能;

S8、以WRS文档作为操作对象,对上述WRS文档解析引擎实现WEB系统和PC系统两者模式,以支持有网和无网两种使用场景。

作为本发明进一步的方案:所述S1中的具体操作是:以文档内容结构作为语义背景,在文档需要录入数据的部分进行数据录入;

其中,标签数据类型集包括:整数、小数、文本、多选项、单选项、日期、时间、表格、图片,可覆盖现有文档数据录入过程中涉及的各种数据类型,并且支持对新数据类型的扩展。

作为本发明再进一步的方案:所述S2中每个校验型数据录入控件,根据其支持的数据类型嵌入其数据类型可能出现的各种业务校验规则;

具体为:整数录入控件,小数录入控件,文本录入控件,多选项录入控件,单选项录入控件,日期录入控件,时间录入控件,表格、图片录入控件,新数据类型录入控件。

作为本发明再进一步的方案:所述S4中报文包含以下内容:

①待填充文档的数据字段标识;

②待填充文档的数据字段数据类型约束;

③待填充文档的数据字段数据关系约束;

④待填充文档的数据字段数据校验约束;

⑤数据字段交互约束:定义两种数据交付约束,用于文档数据的输入和输出。

作为本发明再进一步的方案:所述S5中文档语法包括:

①数据字段定义段,具体为:字段顺序、字段标识、字段名称、字段数据类型、字段数据类型需要的基本约束和字段语义;

②数据关系定义段,具体为:联动类型、关系源字段、关系目标字段、目标字段取值依赖的触发条件、数据字段取值配对关系;

③数据校验定义段:定义文档数据提交时,需要执行的业务校验,对应文档数据描述报文的内容,包含:数据值空校验和业务相关的计算校验;

④数据交互定义段,具体为:接口地址、接口类型、请求类型、请求数据结构与涉及的数据字段坐标、响应数据结构与文档数据字段坐标的映射关系。

作为本发明再进一步的方案:所述S7中,再通过文档解析引擎渲染WRS文档,完成对WRS文档的数据录入和数据交互,具体操作包括:

①生成WRS文档模板的预览视图;

②动态绘制文档模板对应的数据录入视图;

③以数据坐标为key,数据值为value作为结构实时保存录入数据;

④提供交互能力,依据规则指示的交互约束,完成文档打开时进行数据初始化和文档提交时推送数据;

⑤提供追踪留痕,每提交一次,WRS文档保存依次数据修改差值;

⑥提供转换能力,支持WRS文档转换为WORD、WPS、PDF文档。

作为本发明再进一步的方案:所述S8中具体操作为:

①有网环境下:通过WEB系统操作WRS文档,完成数据录入并支持WRS文档导出到某存储设备中,之后,在无网环境下,支持从某存储设备中导入WRS文档到PC系统,完成WRS文档的相关操作;

②在无网环境下,通过PC系统操作WRS文档,完成数据导入并支持WRS文档导出到某存储设备中,之后,在有网环境下,支持从某存储设备中导入WRS文档到WEB系统,完成WRS文档的相关操作。

与现有技术相比,本发明的有益效果是:本发明设计的一种文档数据录入的方法及系统,在实际应用时;

相比传统文档仅仅包含文档的内容上下文环境,文档格式和文档数据,本发明设计的WRS文档在其基础上增加了数据约束规则,数据交互规则和数据定位规则,从文档自身组成内容上就已经支持对其数据录入过程中所需要的验证与交互逻辑,可以认为WRS文档是一种业务自检文档;

此外,围绕WRS文档实现的解析引擎采用动态解析技术生成其对应的人机交付功能,该方式可以从技术底层解决了传统技术模式采用的一种模板对应开发一种前端界面的实现方式所带来的无尽工作量的难题,从而有效的支持任意格式文档的数据录入。

附图说明

图1为一种文档数据录入的方法及系统中WRS文档的结构图;

图2为一种文档数据录入的方法及系统的执行原理图;

图3为一种文档数据录入的方法及系统中通过文档模板编制文档数据描述报文的步骤图;

图4为一种文档数据录入的方法及系统中WRS文档进行数据校验的原理图;

图5为一种文档数据录入的方法及系统中WRS文档进行数据交互的原理图;

图6为一种文档数据录入的方法及系统中WRS文档支持网络环境切换操作的原理图。

具体实施方式

下面将结合本发明实施例中,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1~6,本发明实施例中,一种文档数据录入系统,该文档录入系统包括:

文档模板,用于操作者根据文档内容结构为语义背景,在文档需要录入数据的部分进行数据录入;

规则集,用于定义文档模板中所有待录入数据项的录入规则,并以数据项在文档中的页码值为基准,将规则划分到不同规则文件中;

参数集,用于保存文档模板中所用待录入数据项对应录入的参数,并以数据项在文档中的页码值为基准,将录入参数划分到不同参数文件中;

数据文档集,用于保存文档录入数据完毕后,转化生成的各种格式文档;

控件库,用于确保标签数据类型集中定义的每一种数据类型,在文档数据类型输入控件库中都存在一个对应的数据输入控件;

解析引擎,用于解析文档的格式,并生成可操作的人机交付功能模块、以支持任意格式文档数据的录入功能;

一种文档数据录入的方法,该方法包括以下步骤:

第一步,文档模板制作方式;

相比较于传统文档模板仅采用唯一标签对文档中的待录入数据项进行定义的制作方式,本发明则重新建立一种包含语义的唯一标签,进行定义,形成标签数据类型集,通过蕴含的语义能够识别录入数据项所需的数据类型;

上述的唯一标签则为“

若以文档片段“姓名:__,年龄:__,性别:__;”制作文档模板进行举例,对应的文档模板中的片段如下所示:

姓名:

其中,文档标签中的[XXX]表示数据字段的数据类型,通过其蕴含的语义能够识别录入数据项所需要的数据类型;

而且,该方法内定义了一套标签数据类型集,具体包括:整数[int]、小数[dec]、文本[str]、多选项[select]、单选项[bool]、日期[date]、时间[time]、表格[table]、图片[image],可覆盖现有文档数据录入过程中涉及的各种数据类型,并且支持对新数据类型的扩展,新数据类型定义方式为“[type]”,比如:大写金额[money];

第二步、建立文档数据输入控件库;

基于上述标签数据类型集,实现对应的校验型数据录入控件,构成文档数据输入控件库;

其中,每个校验型数据录入控件,根据其支持的数据类型嵌入其数据类型可能出现的各种业务校验规则,具体为:

整数录入控件,仅支持合法整数的录入,包含整数范围的校验;

小数录入控件,仅支持合法小数的录入,包含小数范围,小数精度的校验;

文本录入控件,包含文本长度范围,非法字符,合法字符的校验;

多选项录入控件,不可编辑,限制在指定的多个数据项间选择;

单选项录入控件,仅支持选择和不选择两种;

日期录入控件,仅支持合法日期的录入,自动变换日期为指定格式;

时间录入控件,仅支持合法时间的录入,自动变换时间为指定格式;

表格录入控件,支持任意单元格合并样式的表格数据录入;

图片录入控件,仅支持合法格式的图片录入,包含对图片大小尺寸的缩放调整;

新数据类型录入控件,根据其数据类型进行扩展,比如,大写金额录入控件限制录入文本符合金额大写描述;

其中,标签数据类型集与文档数据录入控件库构成一一对应关系,即标签数据类型集中定义的每一种数据类型在文档数据输入控件库中都存在一个对应的数据输入控件;

S3、文档数据的存储结构;

将文档数据采用一种多维坐标体系“{x,y,z,...}”进行定位,利用多维坐标值构成存储项的key,数据值构成存储项的value;具体包括:

单维录入型,包括整数[int]、小数[dec]、文本[str]、多选项[select]、单选项[bool]、日期[date]等数据类型,采用文档ID、页码值、数据标识、数据类型构成该数据项的定位坐标,对应存储项key为{wrsID,pageNum,dataMark,dataType},对应存储项的value为数据值;

二维录入型,对应表格[table]数据类型,采用文档ID、页码值、数据标识、数据类型、行索引、列索引构成该数据项的定位坐标,对应存储项的key为{wrsID,pageNum,dataMark,dataType,rowIndex,colIndex},对应存储项的value为表格单元格的数据值;

图片型;对应图片[image]数据类型,采用文档ID、页码值、数据标识、数据类型构成该数据项的定位坐标,对应存储项的key为{wrsID,pageNum,dataMark,dataType},对应存储项的value为图片在WRS文档中的存储路径;

进一步的,{wrsID,pageNum,dataMark,dataType,rowIndex,colIndex}作为存储项的key的构成结构,进一步阐述如下:

wrsID是WRS文档的文档ID,该ID在WRS文档创建时,动态生成并被内置于WRS文档中不可更改;

pageNum是待录入数据项在WRS文档模板中所处页的页码值;

dataMark是待录入数据项在WRS文档模板中定义的数据标识;

dataType是待录入数据项在WRS文档模板中定义的数据类型,该类型决定该数据项值的处理方式;

rowIndex用于定位WRS文档模板中的待录入表格型数据对应单元格的行索引;

colIndex用于定位WRS文档模板中的待录入表格型数据对应单元格的列索引;

如上所述的,在系统内,通过wrsID定位WRS文档,通过pageNum定位模板页面,通过dataMark定位数据项,可以精确定位文档中具体的某一类型的待录入数据项,再进一步的,通过rowIndex和colIndex可以定位表格类型数据的具体单元格数据项;

如上所述的,在WRS文档执行数据交互时,系统根据dataType决定对存储项的value值的处理方式,具体为:

对于字符型:包含整数[int]、小数[dec]、文本[str]、多选项[select]、单选项[bool]、日期[date]、时间[time]、表格[table],采用value值参与数据交互;

对于字节型:包括图片[image],根据value值获取原始图片文件参与数据交互;

第四步、建立文档数据描述报文,用于清晰的表达文档数据录入过程中,涉及的各项数据校验规则与交付规则;

且报文包含以下内容:

①待填充文档的数据字段标识

数据字段标识包括:数据标识、数据类型和数据语义;

其中,数据标识指示数据在文档中的唯一标识,比如对文档中的第一项待录入数据标识为t1,第二项待录入数据标识为t2,数据标识被用于构成数据项在文档中的坐标;

其中,数据类型指示数据字段属于文档中待填充的文本数据、表格数据还是图片数据,比如,对文档中的文本类型数据标识为str,对文档中的表格类型数据标识为table,对文档中的图像类型数据标识为image,数据类型用于标明文档数据录入时采用的处理方法;

②待填充文档的数据字段数据类型约束

数据类型包括:整数[int]、小数[dec]、文本[str]、多选项[select]、单选项[bool]、日期[date]、时间[time]、表格[table]、图片[image]和其他扩展处的新类型;具体为:

整数:最小值约束,最大值约束,默认值约束;

小数:最小值约束,最大值约束,默认值约束,精度约束;

文本:长度约束,非法字符约束,合法字符约束,默认值约束;

多选项:可选项约束,默认值约束;

单选项:可选项约束,默认值约束;

日期:日期范围约束,日期格式约束,默认值约束;

时间:时间范围约束,时间格式约束,默认值约束;

表格:格式约束;图片:图片尺寸约束;新类型:根据扩展类型的业务需要定义具体的约束方式;

③待填充文档的数据字段数据关系约束

将文档中的多个数据字段之间存在的有限类别的关系约束定义为动作,并为每一项动作定义一个关键词,构成关联动作集;具体为:转换动作、选择动作和计算动作;可覆盖现有文档数据录入过程中涉及的各种联动关系,并支持对新动作类型的扩展;

其中,转换动作的解释为:当文档中的金额数值字段与金额大写描述字段两个字段存在一一对应关系,可将这种关系指定为金额大写转换动作,在文档数据描述报文中,用金额大写转换关联动作对这两个字段添加数据关系约束,当金额数值发生变化,那么金额大写根据金额数值自动变化;

选择动作的解释为:当文档中的公司名称,开户银行和开户账号三个字段存在一一对应关系,可将这种关系指定为多级联动选择动作,在文档数据描述报文中,用多级联动选择关联动作对这三个字段添加数据关系约束,当公司发生变化,那么开户银行和开户账号根据公司名称自动变化;

计算动作的解释为:当文档中的已付款项和剩余款项两个字段在统计求和等于某一固定数值的计算关系,可将这种关系指定为求和计算动作,在文档数据描述报文中,用求和计算关联动作对折两个字段添加数据关系约束,当已付款项数值发生变化,那么剩余款项根据求和固定数值自动变化;

再进一步的,根据扩展数据关系的业务需要定义新的动作类型;

④待填充文档的数据字段数据校验约束

设计两类数据校验约束,并为每类数据校验约束中的每一种校验规则定义一个关键词,作为约束动作构成数据校验约束集,分别为:

判断型约束:对单字段的数值判断符合某一规则,比如:非空判断;

计算型约束;对多个字段数值计算符合某一结果,比如:求和运算;

其中,定义数据校验约束包含两部分内容,分别为:

约束动作:标识数据校验约束执行方式;

约束字段集:标识被数据校验约束动作进行校验的字段集;

⑤数据字段交互约束

定义两种数据交付约束,用于文档数据的输入和输出,具体为:

数据获取、从外部数据源获取数据,初始化文档数据内容;

数据推送;文档数据录入正确完毕后,提交数据给外部系统;

其中,定义数据交付约束包含内容具体为:数据接口、接口类型、请求类型、参数体和响应转换关系;

第五步、建立文档数据描述报文的可视化编织方法,并建立一种文档语法对上述文档数据描述报文进行定义;

其中,文档语法包括:

①数据字段定义段,具体为:字段顺序、字段标识、字段名称、字段数据类型、字段数据类型需要的基本约束和字段语义;

②数据关系定义段,具体为:联动类型、关系源字段、关系目标字段、目标字段取值依赖的触发条件、数据字段取值配对关系;

③数据校验定义段:定义文档数据提交时,需要执行的业务校验,对应文档数据描述报文的内容,包含:数据值空校验和业务相关的计算校验;

④数据交互定义段,具体为:接口地址、接口类型、请求类型、请求数据结构与涉及的数据字段坐标、响应数据结构与文档数据字段坐标的映射关系;

进一步的,获取文档模板内容文本,依据是从上至下,从左至右的顺序,解析其中复合

第六步、将文档模板、文档数据描述报文、已录入数据集封装为一体,形成一种自定义的文档类型,即WRS文档;

第七步、设计建立解析引擎,解析WRS文档的格式,并生成可操作的人机交付功能模块、以支持任意格式文档数据的录入功能;

进一步的,再通过文档解析引擎渲染WRS文档,完成对WRS文档的数据录入和数据交互,具体操作包括:

①生成WRS文档模板的预览视图;

②动态绘制文档模板对应的数据录入视图;

③以数据坐标为key,数据值为value作为结构实时保存录入数据;

④提供交互能力,依据规则指示的交互约束,完成文档打开时进行数据初始化和文档提交时推送数据;

⑤提供追踪留痕,每提交一次,WRS文档保存依次数据修改差值;

⑥提供转换能力,支持WRS文档转换为WORD、WPS、PDF文档;

第八步、以WRS文档作为操作对象,对上述WRS文档解析引擎实现WEB系统和PC系统两者模式,以支持有网和无网两种使用场景;

两种使用场景的具体操作为:

①有网环境下:通过WEB系统操作WRS文档,完成数据录入并支持WRS文档导出到某存储设备中,之后,在无网环境下,支持从某存储设备中导入WRS文档到PC系统,完成WRS文档的相关操作;

②在无网环境下,通过PC系统操作WRS文档,完成数据导入并支持WRS文档导出到某存储设备中,之后,在有网环境下,支持从某存储设备中导入WRS文档到WEB系统,完成WRS文档的相关操作。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

相关技术
  • 一种文档数据录入的方法及系统
  • 一种文档存储方法及系统以及文档解析方法及系统
技术分类

06120112900340