掌桥专利:专业的专利平台
掌桥专利
首页

一种基于软件机器人的数据转换方法及装置

文献发布时间:2024-01-17 01:27:33


一种基于软件机器人的数据转换方法及装置

技术领域

本申请属于配方数据转换技术领域,特别的涉及一种基于软件机器人的数据转换方法及装置。

背景技术

在配方数据转换业务中,存在大量的重复性人工操作,例如手写表格内容的理解以及在配方系统中对相应信息的录入,这种方式不仅会降低转换效率,且无法有效保障数据转换的准确性。

发明内容

本申请为解决上述提到的在配方数据转换业务中,存在大量的重复性人工操作,例如手写表格内容的理解以及在配方系统中对相应信息的录入,这种方式不仅会降低转换效率,且无法有效保障数据转换的准确性等技术缺陷,提出一种基于软件机器人的数据转换方法及装置,其技术方案如下:

第一方面,本申请实施例提供了一种基于软件机器人的数据转换方法,包括:

对用户上传的图表文件进行图像识别处理,得到文本图像;

当检测到文本图像中的文本字体无法识别时,将文本图像输入至训练好的深度学习模型中,得到与文本图像对应的文本数据;其中,深度学习模型由多个不同字体的样本文本训练得到;

基于预设的配置参数对文本数据进行录入处理,并在指定界面展示录入结果。

在第一方面的一种可选方案中,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

向用户展示文本数据,并在预设的时间间隔内获取用户的反馈数据;

根据反馈数据对文本数据进行更新处理;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对经过更新处理后的文本数据进行录入处理。

在第一方面的又一种可选方案中,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

基于预设的表格模板对图表文件中的每个表格赋予坐标信息;

根据文本数据在图表文件中的位置,对文本数据以及每个表格的坐标信息进行匹配处理,得到包含坐标信息的文本数据;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对包含坐标信息的文本数据进行录入处理。

在第一方面的又一种可选方案中,在基于预设的配置参数对包含坐标信息的文本数据进行录入处理之前,还包括:

确定用户选择的表格类型,并根据表格类型打开对应的填报网站;

将预设的配置参数导入至填报网站中,生成配置文件;

基于预设的配置参数对包含坐标信息的文本数据进行录入处理,包括:

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理。

在第一方面的又一种可选方案中,在对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理之前,还包括:

按照预设的提取方式从文本数据中提取出至少两个文本特征,并根据至少两个文本特征以及随机密钥,生成目标密钥;

基于目标密钥对配置文件进行加密处理;

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理,包括:

基于目标密钥对经过加密处理后的配置文件进行解密处理;

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理。

在第一方面的又一种可选方案中,根据至少两个文本特征以及随机密钥,生成目标密钥,包括:

确定与图表文件对应的上传时间;

将至少两个文本特征转换为字符特征,并按照预设的顺序对字符特征、随机密钥以及上传时间进行合成处理,得到合成字符串;

基于哈希函数对合成字符串进行处理,得到哈希值,并将哈希值作为目标密钥。

在第一方面的又一种可选方案中,在对用户上传的图表文件进行图像识别处理,得到文本图像之前,还包括:

获取用户输入的身份信息,并判断身份信息是否正确;

对用户上传的图表文件进行图像识别处理,得到文本图像,包括:

当检测到身份信息正确时,对用户上传的图表文件进行图像识别处理,得到文本图像。

第二方面,本申请实施例提供了一种基于软件机器人的数据转换装置,包括:

文件处理模块,用于对用户上传的图表文件进行图像识别处理,得到文本图像;

数据获取模块,用于当检测到文本图像中的文本字体无法识别时,将文本图像输入至训练好的深度学习模型中,得到与文本图像对应的文本数据;其中,深度学习模型由多个不同字体的样本文本训练得到;

结果展示模块,用于基于预设的配置参数对文本数据进行录入处理,并在指定界面展示录入结果。

第三方面,本申请实施例还提供了一种基于软件机器人的数据转换装置,包括处理器以及存储器;

处理器与存储器连接;

存储器,用于存储可执行程序代码;

处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现本申请实施例第一方面或第一方面的任意一种实现方式提供的基于软件机器人的数据转换方法。

第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,可实现本申请实施例第一方面或第一方面的任意一种实现方式提供的基于软件机器人的数据转换方法。

在本申请实施例中,可在进行配方数据的转换业务过程中,对用户上传的图表文件进行图像识别处理,得到文本图像;当检测到文本图像中的文本字体无法识别时,将文本图像输入至训练好的深度学习模型中,得到与文本图像对应的文本数据;基于预设的配置参数对文本数据进行录入处理,并在指定界面展示录入结果。通过深度学习模型识别文本数据的方式,可有效保障录入数据的准确性,并结合预设的配置参数对文本数据进行录入处理的方式,将该文本数据自动快速的写入配方系统,不仅极大程度上节省人力成本,还可提高整体转换效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于软件机器人的数据转换方法的整体流程图;

图2为本申请实施例提供的一种基于软件机器人的数据转换界面效果示意图;

图3为本申请实施例提供的又一种基于软件机器人的数据转换界面效果示意图;

图4为本申请实施例提供的又一种基于软件机器人的数据转换界面效果示意图;

图5为本申请实施例提供的一种基于软件机器人的数据转换装置的结构示意图;

图6为本申请实施例提供的一种控制终端的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。

在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。

下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。

请参阅图1,图1示出了本申请实施例提供的一种基于软件机器人的数据转换方法的整体流程图。

如图1所示,该基于软件机器人的数据转换方法至少可以包括以下步骤:

步骤102、对用户上传的图表文件进行图像识别处理,得到文本图像。

在本申请实施例中,基于软件机器人的数据转换方法可以但不局限于用于在控制终端,该控制终端可通过光学字符识别(Optical Character Recognition,OCR)等识别方式对图表文件进行分析识别处理,得到相应位置所填写的文本信息,并可通过软件机器人技术(Robotic Process Automation,RPA)将该文本信息自动填写至配方系统,这种结合光学字符识别技术以及软件机器人技术的方式,不仅极大程度上节省人力成本,还可提高整体转换效率。此处,控制终端可以但不局限于安装有基于软件机器人工作流程的自动化信息录入平台,以在保证系统各流程输入输出规则严格性的基础上,通过接收用户的输入内容实现系统录入表格的无人化管理和上传。

可以理解的是,光学字符识别技术是指对文本资料的图像文件进行分析识别处理、获取文字及版面信息的过程,亦即对图像中的文字进行识别,并以文本的形式返回结果,例如现今证件识别和车牌识别就是光学字符识别的典型应用。随着深度学习和计算机视觉的发展,基于深度学习的光学字符识别技术逐渐成熟,相比传统的字符识别方法,基于深度学习的光学字符识别可以处理更为复杂的自然场景,更适用于在背景丰富、文字布局多样、光照不均、字体字号多样的情况下进行字符识别,因此具有广泛的应用前景。

软件机器人技术在提升业务数据整合能力、培养数字化劳动力以及提高业务数字化水平中发挥着越来越重要的作用,其设计标准化、资源集约化以及建设成果共享化,可提高企业精益化管理水平和核心竞争力,实现降本增效的目的。此处,可使用配置好的软件机器人规则对配方录入系统进行自动化管理,不仅实现模拟人工甚至超越手动与计算机交互的目的,还可实现7×24小时连续运行,具有不改变原有结构的非侵入性优点和贴合实际业务、无缝对接的灵活配置优点,且可提高工作效率并降低信息核对环节错误率。

具体地,在进行配方数据的转换业务过程中,控制终端可在文件接收界面接收由用户上传的图表文件,并对该图表文件进行图像识别处理,以从该图表文件中识别出包含文本信息的文本图像,以便于后续识别文本内容的准确性,此处文本图像可理解为包含有图表文件中各个文本信息的文本框图像,且图表文件中不同位置的文本信息可分别对应不同的文本框图像。可以理解的是,此处对图表文件进行图像识别处理的方式可以但不局限于为常规的图像处理技术,此处不过多赘述。

作为本申请实施例的一种可选,在对用户上传的图表文件进行图像识别处理,得到文本图像之前,还包括:

获取用户输入的身份信息,并判断身份信息是否正确;

对用户上传的图表文件进行图像识别处理,得到文本图像,包括:

当检测到身份信息正确时,对用户上传的图表文件进行图像识别处理,得到文本图像。

具体地,在对用户上传的图表文件进行图像识别处理,得到文本图像之前,为了保障数据转换过程的安全性以及以隐私性,控制终端可以但不局限于向用户展示用于验证用户身份信息的登录界面,以便于用户在该登录界面上输入身份信息。可以理解的是,控制终端可存储有身份信息数据库,以在接收到用户输入的身份信息之后,通过在身份信息数据库中查找是否存在该身份信息的方式来判断该身份信息是否准确,可能的,若在身份信息数据库中查找到该身份信息,则表明该身份信息验证成功;若在身份信息数据库中未查找到该身份信息,则表明该身份信息验证失败。

需要说明的是,若用户为新用户,则可在登录界面接收用户选择的注册控件,以通过向用户展示注册界面的方式,提示用户输入相应的信息进行身份注册。

此处,当检测到身份信息正确时,控制终端可跳转至用于接收图表文件的界面,以对用户上传的图表文件进行接收以及图像识别处理,得到文本图像。

此处可参阅图2示出的本申请实施例提供的一种基于软件机器人的数据转换界面效果示意图。如图2所示,该示意图展示了一种用于用户登录的界面示意图,用户需在用户名所对应的输入框内输入用户名称,并在密码所对应的输入框内输入与用户名称对应的用户密码,只有当该用户名称以及用户密码对应正确时,控制终端才可根据用户所选择的登录控件跳转至下一界面。此处,若用户选择注册控件,控制终端可根据该注册控件跳转至用户注册界面,以提示用户进行新用户注册操作。

步骤104、当检测到文本图像中的文本字体无法识别时,将文本图像输入至训练好的深度学习模型中,得到与文本图像对应的文本数据。

具体地,在得到文本图像之后,控制终端可对该文本图像进行初步文本扫描处理,以判断该文本图像中的文本字体是否可被识别,可能的,当对该文本图像的文本扫描处理为扫描失败时(也可理解为扫描不出文本数据),表明该文本图像中的文本字体无法被有效识别,进而可将该文本图像输入至训练好的深度学习模型中,以预测出与该文本数据对应的文本数据。其中,由于部分文本图像中的字体可能存在书写不规范,潦草以及歧义等问题,为了保障文本数据的识别精度,可设置多个不同字体的样本文本对深度学习模型进行训练,以使该深度学习模型的预测结果更加准确。

可能的,当对该文本图像的文本扫描结果为扫描成功时,表明该文本图像中的文本字体可被有效识别,进而可直接从文本图像中提取出文本数据,并基于预设的配置参数对该文本数据进行录入处理。此处,从文本图像中提取出文本数据的方式可以但不局限于为通过光学字符识别技术对该文本图像进行识别转换处理,以识别非结构化配方标准数据中的文本信息,并将识别到的文本信息转化为结构化数据,且该通过光学字符识别技术所识别出的文本数据可同步展示给用户。

此处还可参阅图3示出的本申请实施例提供的又一种基于软件机器人的数据转换界面效果示意图,如图3所示,该示意图展示了一种文本识别的界面示意图,在示意图中左侧框内包含logo框以及OCR识别框,该OCR识别框可表明此时处于OCR识别阶段;在示意图中右侧上部分框内包含侧边栏框、界面名称框以及用户显示框,该侧边栏框用于表征可执行的编辑控件,该界面名称框用于表征当前阶段所对应的界面名称,该用户显示框用于表征所登录的用户信息;在示意图中右侧下部分框内包含上传文本列表框、表格图片展示框以及OCR结果展示框,该上传文本列表框用于展示用户所上传的所有图表文件名称,该表格图片展示框用于展示当前用户所上传的图表文件中的表格图片,该OCR结果展示框用于展示通过光学字符识别技术所识别出的文本数据。

作为本申请实施例的又一种可选,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

向用户展示文本数据,并在预设的时间间隔内获取用户的反馈数据;

根据反馈数据对文本数据进行更新处理;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对经过更新处理后的文本数据进行录入处理。

具体地,在得到与文本图像对应的文本数据之后,为了进一步提高文本数据的识别准确性,控制终端可以但不局限于跳转至文本识别的下一界面,并在界面中向用户展示文本数据,以便于用户判断该文本数据是否准确。可以理解的是,当在预设的时间间隔内获取到用户输入的反馈数据时,表明该文本数据识别有误,进而可结合用户所输入的反馈数据对该文本数据进行更新处理。此处,当识别出的用户所输入的反馈数据为修改内容时,可根据修改内容直接对文本数据进行修改处理;当识别出的用户所输入的反馈数据为文本数据时,可比较该用户所输入的反馈数据与文本数据之间的相似性,并在相似性超过预设阈值的情况下,将该用户所输入的反馈数据作为文本数据。

在本申请实施例中,当通过光学字符识别技术识别出文本数据之后,控制终端可以但不局限于在用于表征OCR结果确认的界面中依次展示出通过光学字符识别技术所识别出的文本数据、用户所上传的图表文件中的表格图片以及根据用户输入的反馈数据所经过更新处理后的文本数据,以便于用户直观查看。

作为本申请实施例的又一种可选,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

基于预设的表格模板对图表文件中的每个表格赋予坐标信息;

根据文本数据在图表文件中的位置,对文本数据以及每个表格的坐标信息进行匹配处理,得到包含坐标信息的文本数据;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对包含坐标信息的文本数据进行录入处理。

具体地,在得到与文本图像对应的文本数据之后,为了进一步提高后续录入处理的效率,控制终端可基于预设的表格模板对图表文件中的每个表格赋予坐标信息,该坐标信息具体可为每个表格四个顶点所对应的顶点坐标,或是每个表格的中心坐标,并可根据文本数据在图表文件中的位置,对文本数据以及每个表格的坐标信息进行匹配处理,以得到包含坐标信息的文本数据。其中,预设的表格模板可包含多种不同页面布局的表格模板,以通过匹配的方式确定出与图表文件的表格布局对应的表格模板,并可在对文本数据以及每个表格的坐标信息进行匹配处理的过程中,将与每个表格对应的文本数据赋予表格所对应的坐标信息。

步骤106、基于预设的配置参数对文本数据进行录入处理,并在指定界面展示录入结果。

为了提高软件机器人的自动执行效率,具体地,控制终端可在基于预设的配置参数对包含所述坐标信息的文本数据进行录入处理之前,接收用户所选择需要填报的表格类型,并根据该表格类型打开对应的填报网站,以通过存储预设的配置参数的方式自动生成软件机器人自动化执行配置文件。其中,填报网站可以但不局限于理解为与用户选择的表格类型所对应的网页模板,预设的配置参数可以但不局限于包括在网页内所提供的新建指令、编辑指令、上移指令、下移指令、删除指令等保存指令,以便于用户可在生成的网页内通过选择不同的控件来执行相应的指令。

进一步的,在生成配置文件之后,当需要对文本数据进行录入处理时,控制终端可对该配置文件进行解析处理,以生成相应的软件机器人执行代码,并通过读取文本数据以及客户端运行配置信息的方式,执行对应的软件机器人操作,以对该文本数据进行录入处理,且可在录入过程中实时展示录入结果。

此处可参阅图4示出的本申请实施例提供的又一种基于软件机器人的数据转换界面效果示意图,如图4所示,该示意图展示了一种文本识别的界面示意图,在示意图中左侧框内包含logo框以及运行框,该运行框可表明此时处于录入运行阶段;在示意图中右侧上部分框内包含侧边栏框、界面名称框以及用户显示框,该侧边栏框用于表征可执行的编辑控件,该界面名称框用于表征当前阶段所对应的界面名称,该用户显示框用于表征所登录的用户信息;在示意图中右侧下部分框内包含运行参数配置框、报告框以及运行控制框,该运行参数配置框用于展示执行录入操作所涉及的所有参数,该报告框用于展示实时录入结果,该运行控制框用于展示在录入过程所执行的控制操作。

作为本申请实施例的又一种可选,在所述对所述配置文件进行解析处理,并基于经过解析处理后的所述配置文件对包含所述坐标信息的文本数据进行读取录入处理之前,还包括:

按照预设的提取方式从所述文本数据中提取出至少两个文本特征,并根据所述至少两个文本特征以及随机密钥,生成目标密钥;

基于所述目标密钥对所述配置文件进行加密处理;

所述对所述配置文件进行解析处理,并基于经过解析处理后的所述配置文件对包含所述坐标信息的文本数据进行读取录入处理,包括:

基于所述目标密钥对经过加密处理后的所述配置文件进行解密处理;

对所述配置文件进行解析处理,并基于经过解析处理后的所述配置文件对包含所述坐标信息的文本数据进行读取录入处理。

为了保障用户信息的安全性,可在得到配置文件之后,控制终端通过生成密钥的方式对该配置文件进行加密处理,以避免配置文件遭到泄露,并可在读取配置文件生成网页自动化程序的过程中,通过密钥对该配置文件进行解密处理。此处,可按照预设的提取方式从所述文本数据中提取出至少两个文本特征,并根据所述至少两个文本特征以及随机密钥,生成目标密钥,该预设的提取方式可以但不局限于为将文本数据中从前往后第N个至第N+M个字提取为文本特征,且此处不限定于此。

在本申请实施例中,可在生成密钥的过程中,确定与所述图表文件对应的上传时间,并将所述至少两个文本特征转换为字符特征,以按照预设的顺序对所述字符特征、所述随机密钥以及所述上传时间进行合成处理,得到合成字符串。其中,对文本特征转换为字符特征时,可以但不局限于先将文本特征划分为拼音缩写,并按照预设的字母-字符的转换方式对该文本特征进行转换处理,且此处不限定于此。

接着,控制终端可基于哈希函数对所述合成字符串进行处理,得到哈希值,并将所述哈希值作为目标密钥。可以理解的是,在得到目标密钥之后,控制终端可在生成配置文件的过程中,基于该目标密钥对生成的配置文件进行加密处理,以及在后续生成网页自动化程序的过程中,通过目标密钥对该配置文件进行解密处理,以便于进行录入处理。

请参阅图5,图5示出了本申请实施例提供的一种基于软件机器人的数据转换装置的结构示意图。

如图5所示,该基于软件机器人的数据转换装置至少可以包括文件处理模块501、数据获取模块502以及结果展示模块503,其中:

文件处理模块501,用于对用户上传的图表文件进行图像识别处理,得到文本图像;

数据获取模块502,用于当检测到文本图像中的文本字体无法识别时,将文本图像输入至训练好的深度学习模型中,得到与文本图像对应的文本数据;其中,深度学习模型由多个不同字体的样本文本训练得到;

结果展示模块503,用于基于预设的配置参数对文本数据进行录入处理,并在指定界面展示录入结果。

在一些可能的实施例中,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

向用户展示文本数据,并在预设的时间间隔内获取用户的反馈数据;

根据反馈数据对文本数据进行更新处理;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对经过更新处理后的文本数据进行录入处理。

在一些可能的实施例中,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

基于预设的表格模板对图表文件中的每个表格赋予坐标信息;

根据文本数据在图表文件中的位置,对文本数据以及每个表格的坐标信息进行匹配处理,得到包含坐标信息的文本数据;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对包含坐标信息的文本数据进行录入处理。

在一些可能的实施例中,在基于预设的配置参数对包含坐标信息的文本数据进行录入处理之前,还包括:

确定用户选择的表格类型,并根据表格类型打开对应的填报网站;

将预设的配置参数导入至填报网站中,生成配置文件;

基于预设的配置参数对包含坐标信息的文本数据进行录入处理,包括:

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理。

在一些可能的实施例中,在对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理之前,还包括:

按照预设的提取方式从文本数据中提取出至少两个文本特征,并根据至少两个文本特征以及随机密钥,生成目标密钥;

基于目标密钥对配置文件进行加密处理;

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理,包括:

基于目标密钥对经过加密处理后的配置文件进行解密处理;

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理。

在一些可能的实施例中,根据至少两个文本特征以及随机密钥,生成目标密钥,包括:

确定与图表文件对应的上传时间;

将至少两个文本特征转换为字符特征,并按照预设的顺序对字符特征、随机密钥以及上传时间进行合成处理,得到合成字符串;

基于哈希函数对合成字符串进行处理,得到哈希值,并将哈希值作为目标密钥。

在一些可能的实施例中,在对用户上传的图表文件进行图像识别处理,得到文本图像之前,还包括:

获取用户输入的身份信息,并判断身份信息是否正确;

对用户上传的图表文件进行图像识别处理,得到文本图像,包括:

当检测到身份信息正确时,对用户上传的图表文件进行图像识别处理,得到文本图像。

本领域的技术人员可以清楚地了解到本申请实施例的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是现场可编程门阵列(Field-ProgrammableGate Array,FPGA)、集成电路(Integrated Circuit,IC)等。

请参阅图6,图6示出了本申请实施例提供的一种控制终端的结构示意图。

如图6所示,该控制终端600可以包括至少一个处理器601、至少一个网络接口604、用户接口603、存储器605以及至少一个通信总线602。

其中,通信总线602可用于实现上述各个组件的连接通信。

其中,用户接口603可以包括按键,可选用户接口还可以包括标准的有线接口、无线接口。

其中,网络接口604可以但不局限于包括蓝牙模块、NFC模块、Wi-Fi模块等。

其中,处理器601可以包括一个或者多个处理核心。处理器601利用各种接口和线路连接控制终端600内的各个部分,通过运行或执行存储在存储器605内的指令、程序、代码集或指令集,以及调用存储在存储器605内的数据,执行路由控制终端600的各种功能和处理数据。可选的,处理器601可以采用DSP、FPGA、PLA中的至少一种硬件形式来实现。处理器601可集成CPU、GPU和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器601中,单独通过一块芯片进行实现。

其中,存储器605可以包括RAM,也可以包括ROM。可选的,该存储器605包括非瞬时性计算机可读介质。存储器605可用于存储指令、程序、代码、代码集或指令集。存储器605可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器605可选的还可以是至少一个位于远离前述处理器601的存储装置。如图6所示,作为一种计算机存储介质的存储器605中可以包括操作系统、网络通信模块、用户接口模块以及基于软件机器人的数据转换应用程序。

具体地,处理器601可以用于调用存储器605中存储的基于软件机器人的数据转换应用程序,并具体执行以下操作:

对用户上传的图表文件进行图像识别处理,得到文本图像;

当检测到文本图像中的文本字体无法识别时,将文本图像输入至训练好的深度学习模型中,得到与文本图像对应的文本数据;其中,深度学习模型由多个不同字体的样本文本训练得到;

基于预设的配置参数对文本数据进行录入处理,并在指定界面展示录入结果。

在一些可能的实施例中,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

向用户展示文本数据,并在预设的时间间隔内获取用户的反馈数据;

根据反馈数据对文本数据进行更新处理;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对经过更新处理后的文本数据进行录入处理。

在一些可能的实施例中,在得到与文本图像对应的文本数据之后,基于预设的配置参数对文本数据进行录入处理之前,还包括:

基于预设的表格模板对图表文件中的每个表格赋予坐标信息;

根据文本数据在图表文件中的位置,对文本数据以及每个表格的坐标信息进行匹配处理,得到包含坐标信息的文本数据;

基于预设的配置参数对文本数据进行录入处理,包括:

基于预设的配置参数对包含坐标信息的文本数据进行录入处理。

在一些可能的实施例中,在基于预设的配置参数对包含坐标信息的文本数据进行录入处理之前,还包括:

确定用户选择的表格类型,并根据表格类型打开对应的填报网站;

将预设的配置参数导入至填报网站中,生成配置文件;

基于预设的配置参数对包含坐标信息的文本数据进行录入处理,包括:

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理。

在一些可能的实施例中,在对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理之前,还包括:

按照预设的提取方式从文本数据中提取出至少两个文本特征,并根据至少两个文本特征以及随机密钥,生成目标密钥;

基于目标密钥对配置文件进行加密处理;

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理,包括:

基于目标密钥对经过加密处理后的配置文件进行解密处理;

对配置文件进行解析处理,并基于经过解析处理后的配置文件对包含坐标信息的文本数据进行读取录入处理。

在一些可能的实施例中,根据至少两个文本特征以及随机密钥,生成目标密钥,包括:

确定与图表文件对应的上传时间;

将至少两个文本特征转换为字符特征,并按照预设的顺序对字符特征、随机密钥以及上传时间进行合成处理,得到合成字符串;

基于哈希函数对合成字符串进行处理,得到哈希值,并将哈希值作为目标密钥。

在一些可能的实施例中,在对用户上传的图表文件进行图像识别处理,得到文本图像之前,还包括:

获取用户输入的身份信息,并判断身份信息是否正确;

对用户上传的图表文件进行图像识别处理,得到文本图像,包括:

当检测到身份信息正确时,对用户上传的图表文件进行图像识别处理,得到文本图像。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。其中,计算机可读存储介质可以包括但不限于任何类型的盘,包括软盘、光盘、DVD、CD-ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC),或适合于存储指令和/或数据的任何类型的媒介或设备。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(RandomAccess Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(Read-Only Memory, ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。

以上者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。

技术分类

06120116228701