掌桥专利:专业的专利平台
掌桥专利
首页

基于人机交互的叠加信息处理方法及相关装置

文献发布时间:2023-06-19 11:14:36


基于人机交互的叠加信息处理方法及相关装置

技术领域

本发明涉及文件处理技术领域,具体而言,涉及一种基于人机交互的叠加信息处理方法及相关装置。

背景技术

随着信息技术的迅速发展,电子办公的普及,文档电子化交换分发的需求迅速增长,PDF(PowderDiffractionFile,简称PDF)文件具备安全、便捷等多种特性与优点,泛应用于各个领域,已成为了电子文档交换的格式标准,未来的需求将继续持续增长。

目前,针对PDF文件批注方案提供的批注样式单一,无法为用户提供不同的批注样式,而且,用户批注的内容仅仅可以是文字,无法在批注中使用公式、表格、图片,难以满足用户的需求。

发明内容

有鉴于此,本发明的提供一种基于人机交互的叠加信息处理方法及相关装置,用以为用户提供多种批注样式,实现在待处理文件中叠加文字、公式、表格、图片等形式的批注内容以及用户自定义的批注内容,满足用户的需求。

本发明技术方案可以这样实现:

第一方面,本发明提供一种基于人机交互的叠加信息处理方法,所述方法包括:显示交互界面;所述交互界面用于显示待处理文件的文本内容;所述交互界面具有多种输入控件;每种所述输入控件用于指示用户针对所述文本内容输入至少一种类型的叠加信息;响应用户针对至少一种所述输入控件的操作,获取用户操作的所述输入控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息;根据所述输入控件对应的所述叠加位置和所述叠加信息,生成数据包;所述数据包内包含至少一个数据字段,每种所述输入控件对应至少一个所述数据字段;每个所述数据字段对应一种类型的叠加信息;根据所述数据包内的所述数据字段对所述待处理文件处理后,在位于所述叠加位置的文本内容处显示所述至少一种类型的叠加信息。

可选地,响应用户针对至少一种所述输入控件的操作,获取任意至少一个叠加位置处的所述至少一种类型的叠加信息,包括:响应用户针对第一类输入控件的操作,通过光学字符识别接口获取所述任意至少一个叠加位置处的第一类叠加信息;所述第一类叠加信息为用户绘制的字符和/或图形;和/或,响应用户针对第二类输入控件的操作,获取所述任意至少一个叠加位置处的第二类叠加信息;所述第二类叠加信息包括以下任意一种及组合:公式、图片、文本以及表格。

可选地,响应用户针对第二类输入控件的操作,获取所述任意至少一个叠加位置处的第二类叠加信息,包括:响应针对所述第二类输入控件的操作,显示子交互界面;所述子交互界面包含插入子控件和输入框;所述插入子控件用于指示所述用户插入所述图片和/或所述表格;所述输入框用于指示所述用户输入所述公式和所述文本;响应用户针对所述插入子控件的操作,和/或,响应用户针对所述输入框的操作,获取所述第二类叠加信息。

可选地,响应用户针对第一类输入控件的操作,通过光学字符识别接口获取所述任意至少一个叠加位置处的第一类叠加信息,包括:响应用户针对所述第一类输入控件的操作,通过所述光学字符识别接口识别所述任意至少一个叠加位置处的叠加信息的类型信息;将所述叠加信息的类型信息对应的编号作为第一类叠加信息。

可选地,在根据所述数据包对所述待处理文件处理后,在位于所述叠加位置的文本内容处显示所述至少一种类型的叠加信息之前,还包括:获取用户操作的输入控件对应的标识符,将所述标识符与所述数据包中所述输入控件对应的所述数据字段进行关联。

可选地,根据所述数据包对所述待处理文件处理后,在所述叠加位置的文本内容处显示输出所述至少一种类型的叠加信息,包括:根据所述数据包内的标识符,确定目标渲染数据库;所述标识符与预设的渲染数据库对应;根据所述目标渲染数据库,将所述数据包中的所述叠加信息进行处理,以使所述叠加信息位于所述叠加位置的文本内容处。

可选地,根据所述目标渲染数据库,将所述叠加信息进行处理,以使所述叠加信息位于所述叠加位置的文本内容处,包括:获取所述待处理文件的副本文件;根据所述目标渲染数据库,将所述数据包中的所述叠加信息叠加到所述副本文件中对应的所述文本内容处;根据所述副本文件,将所述叠加信息渲染到所述待处理文件中对应的所述文本内容处。

第二方面,本发明提供一种基于人机交互的叠加信息处理装置,包括:交互模块,用于显示交互界面;所述交互界面用于显示待处理文件的文本内容;所述交互界面具有多种输入控件;每种所述输入控件用于指示用户针对所述文本内容输入至少一种类型的叠加信息;用于响应用户针对至少一种所述输入控件的操作,获取用户操作的所述输入控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息;用于根据所述输入控件对应的所述叠加位置和所述叠加信息,生成数据包;所述数据包内包含至少一个数据字段,每种所述输入控件对应至少一个所述数据字段;每个所述数据字段对应一种类型的叠加信息;处理模块,用于根据所述数据包内的所述数据字段对所述待处理文件处理后,在位于所述叠加位置的文本内容处显示所述至少一种类型的叠加信息。

可选地,交互模块,具体用于:响应用户针对第一类输入控件的操作,通过光学字符识别接口获取任意至少一个叠加位置处的第一类叠加信息;第一类叠加信息为用户绘制的字符和/或图形;和/或,响应用户针对第二类输入控件的操作,获取任意至少一个叠加位置处的第二类叠加信息;第二类叠加信息包括以下任意一种及组合:公式、图片、文本以及表格。

可选地,交互模块,还具体用于响应针对第二类输入控件的操作,显示子交互界面;子交互界面包含插入子控件和输入框;插入子控件用于指示用户插入图片和/或表格;输入框用于指示用户输入公式和文本;响应用户针对插入子控件的操作,和/或,响应用户针对输入框的操作,获取第二类叠加信息。

可选地,交互模块,还具体用于响应用户针对第一类输入控件的操作,通过光学字符识别接口识别任意至少一个叠加位置处的叠加信息的类型信息;将叠加信息的类型信息对应的编号作为第一类叠加信息。

可选地,交互模块,还用于获取用户操作的输入控件对应的标识符,将标识符与数据包中输入控件对应的数据字段进行关联。

可选地,处理模块,具体用于根据数据包内的标识符,确定目标渲染数据库;标识符与预设的渲染数据库对应;根据目标渲染数据库,将数据包中的叠加信息进行处理,以使叠加信息位于叠加位置的文本内容处。

可选地,处理模块,还具体用于获取待处理文件的副本文件;根据目标渲染数据库,将数据包中的叠加信息叠加到副本文件中对应的文本内容处;根据副本文件,将叠加信息渲染到待处理文件中对应的文本内容处。

第三方面,本发明提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现如第一方面所述的基于人机交互的叠加信息处理方法。

第四方面,本发明提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于人机交互的叠加信息处理方法。

本发明提供的一种基于人机交互的叠加信息处理方法及相关装置,方法包括:显示交互界面;交互界面用于显示待处理文件的文本内容;交互界面具有多种输入控件;每种输入控件用于指示用户针对文本内容输入至少一种类型的叠加信息;响应用户针对至少一种输入控件的操作,获取用户操作的输入控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息;根据输入控件对应的叠加位置和叠加信息,生成数据包;数据包内包含至少一个数据字段,每种输入控件对应至少一个数据字段;每个数据字段对应一种类型的叠加信息;根据数据包内的数据字段对待处理文件处理后,在位于叠加位置的文本内容处显示至少一种类型的叠加信息。与现有技术的区别在于,现有技术的批注形式较为单一,用户仅仅能批注文字内容,不能输入公式、图片或者公式这类内容,无法满足用户的需求,而本发明提供了多种输入控件,针对每种输入控件可以输入至少一种类型的叠加信息,其中可以包含公式、图片或者公式这类内容以及文字内容,为用户提供了丰富的批注形式,能够满足用户需求。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的一种基于人机交互的叠加信息处理方法的示意性流程图;

图2为本发明实施例提供的一种交互界面的示意图;

图3为本发明实施例提供的步骤S12的一种实现方式的示意性流程图;

图4为本发明实施例提供的步骤S12-1的一种实现方式的示意性流程图;

图5为本发明实施例提供的步骤S12-2的一种实现方式的示意性流程图;

图6为本发明实施例提供的另一种交互界面的示意图;

图7为本发明实施例提供的另基于人机交互的叠加信息处理方法的示意性流程图;

图8为本发明实施例提供的步骤S15的一种实现方式的示意性流程图;

图9为本发明实施例提供的一种基于人机交互的叠加信息处理装置的功能模块图;

图10为本发明实施例提供的一种电子设备结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。

在介绍本发明实施例之前,先对本发明实施例中涉及的术语进行解释:

LaTeX:LaTeX是一种基于TEX的排版系统,方便用户没有排版和程序设计的知识也可以充分发挥由TEX所提供的强大功能,不必一一亲自去设计或校对,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。它非常适用于生成高印刷质量的科技和数学、物理文档。

PDF:便携式文档格式(英语:PortableDocumentFormat,缩写:PDF)是一种用独立于应用程序、硬件、操作系统的方式呈现文档的文件格式。每个PDF文件包含固定布局的平面文档的完整描述,包括文本、字形、图形及其他需要显示的信息。

OCR:OpticalCharacterRecognition,光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

JSON:JSON是一种资料交换语言,该语言以易于让人阅读的文字为基础,用来传输由属性值或者序列性的值组成的数据对象。

随着信息技术的迅速发展,电子办公的普及,文档电子化交换分发的需求迅速增长,便携式文档PDF为电子文档交换以及共享的格式标准,广泛应用于各个领域。PDF具备安全、便捷等多种特性与优点,已成为了电子文档交换的格式标准,未来的需求将继续持续增长。

目前,针对阅读PDF文件时在文件中编写批注的需求,相关技术提供了一种文档编辑工具,例如,AcrobatProDC文档编辑工具,这种文档编辑工具中提供了标注功能。但该技术的缺陷在于,第一,标注的内容只可以是纯文本内容。若用户想添加公式、表格或是图片内容时,无法进行添加标记的工作。

基于上述相关技术分析可知,批注中的内容仅可以为文字。当用户需要在批注中使用公式、表格、图片时,或是用户需要使用不同的标注样式时,这些解决方案就存在很大的缺陷,难以满足用户的需求。

为了解决上述批注类型单一,用户无法对文本添加公式、表格或图片的问题,本发明提供一种基于人机交互的叠加信息处理方法,请参见图1,图1为本发明实施例提供的一种基于人机交互的叠加信息处理方法的示意性流程图,该方法可以包括:

S11、显示交互界面。

在一些可能的实施例中,上述的交互界面用于显示待处理文件的文本内容;交互界面中可以具有多种输入控件,每种输入控件可以用于指示用户针对文本内容输入至少一种类型的叠加信息。可以理解,该叠加信息可以是用户绘制的字符和/或图形,还可以是用户输入的公式、文本、图片以及表格中的一种或者多种。

S12、响应用户针对至少一种输入控件的操作,获取用户操作的批注控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息。

在一些可能的实施例中,其中,叠加信息可以理解为用户输入的批注内容,叠加位置可以理解为批注内容的批注位置。例如,交互界面中的输入控件可以有画笔控件,则该画笔控件可以指示用户绘制的字符和/或图形,其中,当用户绘制的叠加信息为图形,该图形可以是直线、曲线、弧线等任意形式的图形;交互界面中还可以具有注释控件,则该注释控件可以指示用户输入公式、文本、图片以及表格中的一种或者多种。其中,当用户输入公式时,既可以使用LaTeX语法进行公式的编写,也可以使用交互界面中的工具栏中的公式工具进行公式的编写。

S13、根据输入控件对应的叠加位置和叠加信息,生成数据包。

在一些可能的实施例中,上述数据包内包含至少一个数据字段,每种输入控件对应至少一个数据字段,每个数据字段对应一种类型的叠加信息。每个数据字段包含叠加信息和叠加位置。

在本发明实施例中,数据包可以是JSON文件的形式,由于JSON文件可以用来传输由属性值或者序列性的值组成的数据对象,因此,上述的叠加信息可以通过不同的属性值区分。

例如,输入控件为画笔控件,用户可以通过画笔控件在文本内容位置绘制直线或者弧线,那么可以预先在数据库定义直线和弧线的属性值,比如,直线的属性值可以为1,弧线的属性值可以为2,那么若用户通过画笔在一个文档中的两个位置分别画了一条弧线和一条直线,则数据包中画笔控件对应两个数据字段,分别为{(x1,y1),1},表示在坐标(x1,y1)处的叠加信息为直线,{(x2,y2),2},表示在坐标(x2,y2)处的叠加信息为弧线。

可以理解的是,用户可以通过操作不同的输入控件,在同一叠加位置输入不同类型的叠加信息,也可以在不同位置输入同一类型的叠加信息,还可以在不同叠加位置输入不同类型的叠加信息,例如,待处理文件为PDF文件,用户可以在显示的文本内容标题位置绘制直线图形,还可以在标题位置插入图片,还可以在文本内容的结束位置绘制与标题位置处相同的直线图形。

需要说明的是,生成数据包的形式可以是:对于每一张显示页面,用户每操作一次输入控件,生成该输入控件对应的数据包,数据包中仅包含本次输入的叠加信息和叠加位置,即每次操作之后生成一个数据包,多次操作之后生成多个数据包;还可以是在每一张显示页面中,获取到不同输入控件操作后的全部输入信息之后,根据全部输入控件对应的叠加信息和叠加位置生成单独一个数据包,在进行下一个页面批注时,再生成下一个页面的数据包。

S15、根据数据包内的数据字段对待处理文件处理后,在位于叠加位置的文本内容处显示至少一种类型的叠加信息。

在一些可能的实施例中,获得数据包后,可以根据数据中的叠加位置,将叠加信息添加至待处理文件的文本内容处,此时交互界面上可以向用户呈现待处理文件的文本内容和叠加信息(也就是批注内容)。

本发明实施例体提供的一种基于人机交互的叠加信息处理方法,包括:显示交互界面;交互界面用于显示待处理文件的文本内容;交互界面具有多种输入控件;每种输入控件用于指示用户针对文本内容输入至少一种类型的叠加信息;响应用户针对至少一种输入控件的操作,获取用户操作的输入控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息;根据输入控件对应的叠加位置和叠加信息,生成数据包;数据包内包含至少一个数据字段,每种输入控件对应至少一个数据字段;每个数据字段对应一种类型的叠加信息;根据数据包内的数据字段对待处理文件处理后,在位于叠加位置的文本内容处显示至少一种类型的叠加信息。与现有技术的区别在于,现有技术的批注形式较为单一,用户仅仅能批注文字内容,不能输入公式、图片或者公式这类内容,无法满足用户的需求,而本发明提供了多种输入控件,针对每种输入控件可以输入至少一种类型的叠加信息,其中可以包含公式、图片或者公式这类内容以及文字内容,为用户提供了丰富的批注形式,能够满足用户需求。

为了方便理解上述交互过程,下面给出一种交互界面的示意图,参见图2,图2为本发明实施例提供的一种交互界面的示意图,在该交互界面10中显示有待处理文件的示例文本内容,输入控件选择区域13,其中,输入控件选择区域内可以包含的输入控件有:画笔控件11和注释控件12。

在一种场景中,当用户操作画笔控件11(图2中的“①”),即可在示例文本内容的位置绘制叠加信息,例如,如图2所示的弧线,用户绘制的叠加信息还可以是直线、正方形、圆形等任意形式的字符或者图形。若用户操作注释控件12(如图2中的“②”),即可在示例文本内容的位置输入如图2所示的绘制叠加信息,例如公式、文本、图片以及表格等。

需要说明的是,图2所示画笔控件11可以满足用户对于自定义批注形式的需求,其中画笔控件的样式可以有多种,每种画笔样式可以设置不同的颜色格式、尺寸格式等。

还需要说明的是,图2所示注释控件12可以满足用户输入公式、文本、图片以及表格等类型批注的需求,在一种实现方式中,可以在输入控件选择区域13内设置注释控件12的操作标识,方便用户查找并操作,在另一种实现方式中,也可以不在输入控件选择区域13内显示注释控件12的标识,可以采用用户点击界面的方式触发显示注释控件12。

可选地,为了能够提供多种形式的输入内容,满足用户对文字、公式、表格以及图片的批注需求,下面给出一种获取不同类型叠加信息的实现方式,参见图3,图3为本发明实施例提供的步骤S12的一种实现方式的示意性流程图,步骤S12可以包括:

S12-1、响应用户针对第一类输入控件的操作,通过光学字符识别接口获取任意至少一个叠加位置处的第一类叠加信息;

在本发明实施例中,上述的第一类输入控件可以用于指示用户绘制任意形式的第一类叠加信息,例如,第一类输入控件可以为画笔控件,其中,第一类叠加信息为用户绘制的字符和/或图形。

S12-2、响应用户针对第二类输入控件的操作,获取任意至少一个叠加位置处的第二类叠加信息,并将第二类叠加信息转换为预设的编译语句。

在本发明实施例中,上述的第二类输入控件可以用于指示用户输入类似公式、图片及表格形式的叠加信息,例如,第一类输入控件可以为注释控件,当用户操作注释控件后,即可获得第二类叠加信息。

可选地,为了能够准确识别用户自定义的叠加信息,例如,用户绘制的字符、图形等类似信息,下面给出一种实现方式,参见图4,图4为本发明实施例提供的步骤S12-1的一种实现方式的示意性流程图,即步骤S12-1可以包括:

S12-1-1、响应用户针对第一类输入控件的操作,通过光学字符识别接口识别任意至少一个叠加位置处的叠加信息的类型;

S12-1-2、将叠加信息的类型信息对应的编号作为第一类叠加信息。

在一些可能的实施例中,针对用户绘制的字符、图形等形式的第一类叠加信息,可以通过不同的属性值区分,即可以预先在数据库定义各种类型的第一类叠加信息的属性值,作为每个类型的第一类叠加信息的类型编号,例如,直线的类型编号可以为1,弧线的类型编号可以为2,当用户操作第一类输入控件输入直线或者弧线等形式的叠加信息,可以通过光学字符识别接口识别信息类型,然后从预设的数据库中获取该叠加信息的类型对应的编号,并将该编号作为第一类叠加信息,可以减少数据包的存储量,节省存储空间。

可选地,为了提供丰富的交互过程,满足用户的公式、文本、表格以及图片的输入需求,本发明还提供另一种实现方式及对应的交互界面,参见图5,图5为本发明实施例提供的步骤S12-3的一种实现方式的示意性流程图,步骤S12可以包括:

S12-2-1、响应针对第二类输入控件的操作,显示子交互界面。

在一些可能的实现方式中,用户在交互界面中通过操作第二类输入控件可以触发显示子交互界面,在子交互界面中可以包含插入子控件和输入框,插入子控件用于指示用户插入图片和/或表格,即插入子控件可以是插入图片子控件,用户可以通过操作插入图片子控件可以插入图片,插入子控件还可以是插入表格子控件,用户可以通过操作插入表格子控件可以插入表格;输入框用于指示用户输入公式、文本,当输入内容为公式,用户既可以使用LaTeX语法进行公式的编写,也可以使用交互界面中的工具栏中的公式工具进行公式的编写,生成的数据段是LaTeX语法下的格式。

S12-2-2、响应用户针对插入子控件的操作,和/或,响应用户针对输入框的操作,获取第二类叠加信息。

在一些可能的实施例中,用户可以根据需要选择要输入的内容,从而实现用户对公式、图片以及表格的批注需求。

为了方便理解上述流程,下面在图2的基础上,参见图6,图6为本发明实施例提供的另一种交互界面的示意图,其中当用户操作注释控件12之后(如图6中的“①”),显示子交互界面14,子交互界面14内可以具有插入控件和输入框,其中,插入控件还可以分为出插入图片控件和插入表格控件,当用户操作插入控件(如图6中的“②”)之后,即可插入图片、表格等内容,用户还可以操作输入框(如图6中的“③”),在输入框内输入公式或者文字。

可选地,在一些可能的实施例中,用户通过操作不同的输入控件可以输入不同类型的叠加信息,生成的数据包中包含了多种输入控件的叠加信息,该叠加信息以数据段的形式呈现,为了区分不同数据段对应的输入控件,下面给出一种可能的实现方式,参见图7,图7为本发明实施例提供的另基于人机交互的叠加信息处理方法的示意性流程图,该方法还包括:

S14、获取用户操作的输入控件对应的标识符,将标识符与数据包中输入控件对应的数据字段进行关联。

在一些可能实施例中,标识符可以用于标识用户进行的操作的输入控件的类型。例如,交互界面提供了画笔控件和注释控件,用户操作是画笔控件时,则可以用第一标识符进行标识,并将第一标识符与画笔控件对应的数据字段进行关联,数据字段的形式可以为:{叠加位置,第一类叠加信息};若用户操作是注释控件,则可以用第二标识符进行标识,并将第二标识与注释控件对应的数据字段进行关联,数据字段的形式可以为:{叠加位置,第二类叠加信息},第二类叠加信息还可以被转化为LaTeX语句,因此数据字段的形式还可以为:{叠加位置,LaTeX语句}。若注释控件对应的第二类叠加信息为图片或者公式,数据字段中还需要写入图片内容。

针对上述将第二类叠加信息还可以被转化为LaTeX语句的有益效果在于:由于LaTeX的编译原理,以往的方案都采用对整个文档进行编译的解决方案。这样会浪费大量的计算资源,且实时性差。在本方案中,若用户需要在修改批注,仅加载标注所在的页面,大大减少了计算资源的开销。完成该单一页面的编译后,即可将修改后的该页面发送给用户查看,相比以往的方案,减少了通信时的开销。

可选地,下面在图7的基础上,给出一种实现方式,参见图8,图8为本发明实施例提供的步骤S15的一种实现方式的示意性流程图,步骤S15可以包括:

S15-1、根据数据包内的标识符,确定目标渲染数据库。

可以理解的是,标识符与预设的渲染数据库对应。

S15-2、根据目标渲染数据库,将叠加信息进行处理,以使叠加信息位于叠加位置的文本内容处。

在一些可能的实施例中,如果用户操作对应的是第一类输入控件,则根据第一类输入控件的标识符,确定目标渲染数据可以为tikz库,tikz库可以用于画图,可以根据数据包中的第一类输入控件对应的数据字段,读取其中的叠加位置和叠加信息,然后将叠加信息绘制在叠加位置处;如果用户操作对应的是第二类输入控件,则根据第二类输入控件的标识符,确定目标渲染数据可以为todonotes数据库,其中,todonotes数据库用于编写注释,可以根据数据包中的第二类输入控件对应的数据字段,读取其中的叠加位置和叠加信息,完成对叠加信息的编译。

可选地,为了保证待处理文件的完整性,在进行叠加信息的处理过程中,还可以先在待处理文件的副本中进行处理,然后将处理后的结果渲染到待处理文件中,因此,下面还给出一种可能的实现方式,即步骤S15-2可以包括:

第一步,获取待处理文件的副本文件。

可以理解的是,当用户打开待处理文件时,可以先根据待处理文件的副本文件,然后对副本文件中的大小进行修改,例如,将副本文件的宽度减少为待处理文件的80%,用于适配添加得加信息后的页面分布。

第二步,根据目标渲染数据库,将数据包中的叠加信息叠加到副本文件中对应的文本内容处。

第三步,根据副本文件,将叠加信息渲染到待处理文件中对应的文本内容处。

需要说明的是,前述任意一项实施例中的基于人机交互的叠加信息处理方法可以应用在前端设备和后端设备中,当前端设备和后端设备为同一个电子设备,也可以为不同设备。

在一种场景中,当前端设备和后端设备为同一个电子设备,则该电子设备可以用来执行前述任意一项实施例中的基于人机交互的叠加信息处理方法。

在另一种场景中,当前端设备和后端设备为不同设备,则前端设备和后端设备协同执行上述任意一项实施例中的基于人机交互的叠加信息处理方法的实现过程可以是:

前端设备,用于显示交互界面;交互界面用于显示待处理文件的文本内容;交互界面具有多种输入控件;每种输入控件用于指示用户针对文本内容输入至少一种类型的叠加信息;还用于响应用户针对至少一种输入控件的操作,获取用户操作的输入控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息;还根据输入控件对应的叠加位置和叠加信息,生成数据包;数据包内包含至少一个数据字段,每种输入控件对应至少一个数据字段;每个数据字段对应一种类型的叠加信息;还用于将数据包发送给后端设备。

后端设备,用于收到数据包之后,根据数据包内的数据字段对待处理文件处理,并将处理结果发送给前端设备。

前端设备,还用于收到处理结果之后在位于叠加位置的文本内容处显示至少一种类型的叠加信息。

在一些可能的实施例中,前端设备还可以用于:响应用户针对至少一种输入控件的操作,获取任意至少一个叠加位置处的至少一种类型的叠加信息,包括:响应用户针对第一类输入控件的操作,通过光学字符识别接口获取任意至少一个叠加位置处的第一类叠加信息;第一类叠加信息为用户绘制的字符和/或图形;和/或,响应用户针对第二类输入控件的操作,获取任意至少一个叠加位置处的第二类叠加信息;第二类叠加信息包括以下任意一种及组合:公式、图片、文本以及表格。

在一些可能的实施例中,前端设备还用于:响应针对第二类输入控件的操作,显示子交互界面;子交互界面包含插入子控件和输入框;插入子控件用于指示用户插入图片和/或表格;输入框用于指示用户输入公式和文本;响应用户针对插入子控件的操作,和/或,响应用户针对输入框的操作,获取第二类叠加信息。

在一些可能的实施例中,前端设备还用于:响应用户针对第一类输入控件的操作,通过光学字符识别接口识别任意至少一个叠加位置处的叠加信息的类型信息;将叠加信息的类型信息对应的编号作为第一类叠加信息。

在一些可能的实施例中,前端设备还用于:获取用户操作的输入控件对应的标识符,将标识符与数据包中输入控件对应的数据字段进行关联。

在一些可能的实施例中,后端设备还用于:根据数据包内的标识符,确定目标渲染数据库;标识符与预设的渲染数据库对应;根据目标渲染数据库,将数据包中的叠加信息进行处理,以使叠加信息位于叠加位置的文本内容处。

在一些可能的实施例中,后端设备还用于:获取待处理文件的副本文件;根据目标渲染数据库,将数据包中的叠加信息叠加到副本文件中对应的文本内容处;根据副本文件,将叠加信息渲染到待处理文件中对应的文本内容处。

为了实现实施例中的各个步骤,以达到对应的技术效果,下面给出一种基于人机交互的叠加信息处理装置的实现方式,参见图9,图9为本发明实施例提供的一种基于人机交互的叠加信息处理装置的功能模块图,其中,该基于人机交互的叠加信息处理装置20包括:交互模块201、处理模块202。

交互模块201,用于显示交互界面;交互界面用于显示待处理文件的文本内容;交互界面具有多种输入控件;每种输入控件用于指示用户针对文本内容输入至少一种类型的叠加信息;用于响应用户针对至少一种输入控件的操作,获取用户操作的输入控件对应的任意至少一个叠加位置处的至少一种类型的叠加信息;用于根据输入控件对应的叠加位置和叠加信息,生成数据包;数据包内包含至少一个数据字段,每种输入控件对应至少一个数据字段;每个数据字段对应一种类型的叠加信息;

处理模块202,用于根据数据包内的数据字段对待处理文件处理后,在位于叠加位置的文本内容处显示至少一种类型的叠加信息。

可选地,交互模块201,具体用于:响应用户针对第一类输入控件的操作,通过光学字符识别接口获取任意至少一个叠加位置处的第一类叠加信息;第一类叠加信息为用户绘制的字符和/或图形;和/或,响应用户针对第二类输入控件的操作,获取任意至少一个叠加位置处的第二类叠加信息;第二类叠加信息包括以下任意一种及组合:公式、图片、文本以及表格。

可选地,交互模块201,还具体用于响应针对第二类输入控件的操作,显示子交互界面;子交互界面包含插入子控件和输入框;插入子控件用于指示用户插入图片和/或表格;输入框用于指示用户输入公式和文本;响应用户针对插入子控件的操作,和/或,响应用户针对输入框的操作,获取第二类叠加信息。

可选地,交互模块201,还具体用于响应用户针对第一类输入控件的操作,通过光学字符识别接口识别任意至少一个叠加位置处的叠加信息的类型信息;将叠加信息的类型信息对应的编号作为第一类叠加信息。

可选地,交互模块201,还用于获取用户操作的输入控件对应的标识符,将标识符与数据包中输入控件对应的数据字段进行关联。

可选地,处理模块202,具体用于根据数据包内的标识符,确定目标渲染数据库;标识符与预设的渲染数据库对应;根据目标渲染数据库,将数据包中的叠加信息进行处理,以使叠加信息位于叠加位置的文本内容处。

可选地,处理模块202,还具体用于获取待处理文件的副本文件;根据目标渲染数据库,将数据包中的叠加信息叠加到副本文件中对应的文本内容处;根据副本文件,将叠加信息渲染到待处理文件中对应的文本内容处。

本发明实施例还提供一种电子设备,如图10,图10为本发明实施例提供的一种电子设备结构框图。该电子设备80包括通信接口801、处理器802和存储器803。该处理器802、存储器803和通信接口801相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器803可用于存储软件程序及模块,如本发明实施例所提供的基于人机交互的叠加信息处理方法对应的程序指令/模块,处理器802通过执行存储在存储器803内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口801可用于与其他节点设备进行信令或数据的通信。在本发明中该电子设备80可以具有多个通信接口801。

其中,存储器803可以是但不限于,随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。

处理器802可以是一种集成电路芯片,具有信号处理能力。该处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DigitalSignalProcessing,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

需要说明的是,由于前述任意一项实施例中的基于人机交互的叠加信息处理方法可以应用在一个电子设备中,则该电子设备可以是图10所示的电子设备,可以用来执行如本发明实施例所提供的基于人机交互的叠加信息处理方法。在另一种场景中,前述任意一项实施例中的基于人机交互的叠加信息处理方法可以应用在前端设备和后端设备两个电子设备中,则前端设备和后端设备的结构框图可以如图10所示,但是前端设备的存储器可用于存储前述与前端设备对应的实施例流程的软件程序及模块,后端设备的存储器可用于存储前述与后端设备对应的实施例流程的软件程序及模块。

本发明实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述实施方式中任一项基于人机交互的叠加信息处理方法。该计算机可读存储介质可以是,但不限于,U盘、移动硬盘、ROM、RAM、PROM、EPROM、EEPROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 基于人机交互的叠加信息处理方法及相关装置
  • 基于人机交互的语音信息处理方法、装置、设备及介质
技术分类

06120112858951