掌桥专利:专业的专利平台
掌桥专利
首页

基于图片输入的脑图生成方法、装置、设备及存储介质

文献发布时间:2023-06-19 09:58:59


基于图片输入的脑图生成方法、装置、设备及存储介质

技术领域

本申请属于人工智能技术领域,具体涉及一种基于图片输入的脑图生成方法、装置、设备及存储介质。

背景技术

脑图一般指思维导图。思维导图,英文是The Mind Map,又叫心智导图,是表达发散性思维的有效图形思维工具,它简单却又很有效,是一种实用性的思维工具。思维导图运用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接。思维导图充分运用左右脑的机能,利用记忆、阅读、思维的规律,协助人们在科学与艺术、逻辑与想象之间平衡发展,从而开启人类大脑的无限潜能。思维导图因此具有人类思维的强大功能。

目前,行业中很多脑图、思维导图的绘制都需要操作人员手动在专用的脑图工具(如xmind)上进行绘制,一般都是以不同格式的树状图展示。但现在设计人员绘制脑图之后,导入的格式有限,受到脑图绘制工具版权和收费等因素影响,导入的格式大都为不同工具自己的自定义的格式。比如,比较流行的脑图工具如xmind,支持导入的格式有word文本格式、excel表格格式以及xmind自身的格式等,但是xmind不支持图片样式的导入,当操作人员需要将图片样式的文件转换为脑图时,首先需要操作人员通过手动的方式将图片样式的文件中的内容提取出来,然后转换为word文本格式、excel表格格式,最后输入到xmind构建新的脑图,整个过程操作繁琐,这无疑大大增加了操作人员的工作量,且在手动转换过程中,容易出现失误。

发明内容

本申请实施例的目的在于提出一种基于图片输入的脑图生成方法、装置、计算机设备及存储介质,以解决现有脑图工具不支持图片样式的导入,导致操作人员需要经过比较繁琐的操作才能将图片样式导入的文件转化为新建脑图页面的技术问题。

为了解决上述技术问题,本申请实施例提供一种基于图片输入的脑图生成方法,采用了如下所述的技术方案:

一种基于图片输入的脑图生成方法,包括:

获取输入图片,对输入图片进行文本识别,得到输入图片中的所有文本;

按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域;

对输入图片进行遍历扫描,获取输入图片中所有文字区域之间的关联信息;

将关联信息导入到预设的json文件中,得到关联信息的树结构;

基于关联信息的树结构新建脑图绘制页面,并将输入图片中所有的文本导入到新建脑图绘制页面,得到新建脑图。

进一步地,按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域的步骤,具体包括:

获取文本信息,并根据文本信息识别文本的边缘,其中,文本信息包括文本中的字符大小和字符间距;

按照预定的扫描规则对文本的边缘预定范围内的像素点进行扫描,根据扫描结果判断文本是否存在文本边框;

若文本存在文本边框,则根据文本边框确定文本的文字区域;

若文本不存在文本边框,则将文本的边缘扩大预定数量的像素点后生成新的边缘,并基于新的边缘确定文本的文字区域。

进一步地,按照预定的扫描规则对文本的边缘预定范围内的像素点进行扫描,根据扫描结果判断文本是否存在文本边框的步骤,具体包括:

设定扫描目标区域,其中,扫描目标区域位于文本的边缘外侧;

对扫描目标区域内的像素点进行扫描,获取扫描目标区域内所有像素点的像素值;

根据扫描目标区域内所有像素点的像素值,识别扫描目标区域内是否存在像素值突变的像素点;

根据识别结果判断文本是否存在文本边框。

进一步地,根据识别结果判断文本是否存在文本边框的步骤之后,还包括:

以扫描目标区域内像素值突变的像素点作为初始点,基于封闭图形识别算法获取所有像素值突变的像素点;

根据得到的所有像素值突变的像素点生成文本的文本边框。

进一步地,按照预定的扫描规则对文本的边缘预定范围内的像素点进行扫描,根据扫描结果判断文本是否存在文本边框的步骤,具体包括:

获取文本的边缘预定范围内的每一个像素点的灰度值;

将每一个像素点的灰度值与预设阈值进行比对,根据比对结果判断文本是否存在文本边框。

进一步地,对输入图片进行遍历扫描,获取输入图片中所有文字区域之间的关联信息的步骤,具体包括:

获取所有文字区域的位置信息,并基于位置信息确定所有文字区域之间的路径生长关系;

基于路径生长关系对输入图片进行遍历扫描,获取所有文字区域之间的路径信息;

根据路径信息,获取输入图片中所有文字区域之间的关联信息。

进一步地,获取所有文字区域的位置信息,并基于位置信息确定所有文字区域之间的路径生长关系的步骤,具体包括:

在输入图片上建立基准坐标系,获取每一个文字区域在基准坐标系中的位置坐标;

基于每一个文字区域的位置坐标确定所有文字区域之间的路径生长关系。为了解决上述技术问题,本申请实施例还提供一种基于图片输入的脑图生成装置,采用了如下所述的技术方案:

一种基于图片输入的脑图生成装置,包括:

输入图片获取模块,用于获取输入图片,对输入图片进行文本识别,得到输入图片中的所有文本;

文字区域识别模块,用于按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域;

关联信息提取模块,用于对输入图片进行遍历扫描,获取输入图片中所有文字区域之间的关联信息;

关系树生成模块,用于将关联信息导入到预设的json文件中,得到关联信息的树结构;

新建脑图模块,用于基于关联信息的树结构新建脑图绘制页面,并将输入图片中所有的文本导入到新建脑图绘制页面,得到新建脑图。

为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,处理器执行计算机可读指令时实现如上述任一项的基于图片输入的脑图生成方法的步骤。

为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:

一种计算机可读存储介质,计算机可读存储介质上存储有计算机可读指令,计算机可读指令被处理器执行时实现如上述任一项的基于图片输入的脑图生成方法的步骤。

与现有技术相比,本申请实施例主要有以下有益效果:

本申请公开了一种基于图片输入的脑图生成方法、装置、设备及存储介质,属于人工智能技术领域,所述方法通过对输入图片上的脑图进行文本识别和连接线识别,分别得到输入图片上脑图的文字区域和文字区域之间的关联信息,通过将文字区域之间的关联信息转化成树结构的关系对象,并基于树结构的关联信息新建脑图绘制页面,将所有的文本依次导入到新建脑图绘制页面的对应位置,得到新建脑图。本方案通过对基于输入图片进行识别,获取输入图片中文本对应的文字区域和文字区域之间的关联信息,根据得到文字区域和文字区域之间的关联信息在新建脑图绘制页面绘制与输入图片内容对应的新建脑图,可以实现图片样式导入的文件转换为脑图格式文件,供用户查看和编辑。

附图说明

为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本申请可以应用于其中的示例性系统架构图;

图2示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的流程图;

图3示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的文本的边缘和文本边框的示意图;

图4示出了图2中步骤S202的一种具体实施方式的流程图;

图5示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的输入图片的示意图;

图6示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的文字区域识别结果示意图;

图7示出了图2中步骤S203的一种具体实施方式的流程图;

图8示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的路径信息识别结果示意图;

图9示出了根据本申请的基于图片输入的脑图生成装置的一个实施例的结构示意图;

图10示出了根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving PictureExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是,本申请实施例所提供的基于图片输入的脑图生成方法一般由服务器执行,相应地,基于图片输入的脑图生成装置一般设置于服务器中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,示出了根据本申请的基于图片输入的脑图生成的方法的一个实施例的流程图。所述的基于图片输入的脑图生成方法,包括以下步骤:

S201,获取输入图片,对输入图片进行文本识别,得到输入图片中的所有文本;

其中,目前比较流行的脑图工具如xmind,xmind支持导入的格式有word文本格式、excel表格格式以及xmind自身的格式等,但是xmind不支持图片样式的导入,当操作人员需要将图片样式的文件转换为脑图时,首先需要操作人员通过手动的方式将图片样式的文件中的内容提取出来,然后转换为word文本格式、excel表格格式,最后输入到xmind构建新的脑图,整个过程操作繁琐,这无疑大大增加了操作人员的工作量,且在手动转换过程中,容易出现失误。本方案通过对基于输入图片进行识别,获取输入图片中文本对应的文字区域和文字区域之间的关联信息,根据得到文字区域和文字区域之间的关联信息在新建脑图绘制页面绘制与输入图片内容对应的新建脑图,可以实现图片样式导入的文件转换为脑图格式文件,供用户查看和编辑。

具体的,在接收到用户的新建脑图指令时,获取用户的输入的图片,采用OCR文字识别技术对输入图片进行文本识别,得到输入图片中所有的文本。输入图片的图片格式一般为bmp、jpg、png、tif、gif等中的任意一种,目前脑图软件还无法识别这些图片格式的文件。其中,OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

在本申请一种具体的实施例中,在接收输入图片之后,需要对输入图片进行预处理操作,其中,预处理操作包括灰度化、二值化、去噪、倾斜度校正、字符切割和归一化。通过对输入图片进行预处理,增强图片特征,有利于后续的处理操作。

在本实施例中,基于图片输入的脑图生成方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收用户的新建脑图指令。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

S202,按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域;

其中,脑图一般包括文字区域和连接线,如图3所示,图3示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的文本的边缘和文本边框的示意图,文字区域一般通过一边框(粗线条边框)包围起来,文字区域包括文本和文本边框。当然,在一些具体的实施例中也存在无边框的文字区域。在本申请实施例中,通过对文本的边缘四周预定范围内的像素点进行扫描,根据扫描结果判断文本是否存在文本边框,文本的边缘可以认为是由像素点组成的、最靠近文本的矩形框(如图的虚线框),需要说明的是,文本的边缘为本申请的处理过程中计算机根据文本信息生成的虚拟边界,用于确定文本是否存在边框,且其在脑图中并不真实存在,文本的边缘的范围一般小于文本边框的范围。

具体的,按照预设的扫描规则对每一个文本的边缘四周的像素点进行扫描,根据扫描结果判断文本是否存在文本边框,若存在上述文本存在文本边框,则获取文本的文字区域。其中,预设的扫描规则可以根据实际需求进行设定,如对文本的边缘四周预定像素范围内每一个像素点都进行扫描,或者设定扫描目标区域然后基于封闭图形识别算法进行扫描,以判断和获取文本的文字区域。

S203,对输入图片进行遍历扫描,获取输入图片中所有文字区域之间的关联信息;

具体的,在输入图片上建立基准坐标系,获取每一个文字区域在基准坐标系中的位置坐标,基于文字区域具体的位置坐标值确定文字区域之间的路径生长关系。其中,路径生长关系也即路径生长方向,在本申请具体的实施例中,文字区域可以看做是一个节点,相互连接的文字区域可以看做是对父子节点,父子节点之间通过路径相互连接,路径生长方向是从父节点指向子节点。基于路径生长关系并以行或列的形式依次遍历输入图片所有像素点,以对输入图片完成遍历扫描,获取所有文字区域之间的路径信息。扫描时,可以依据文字区域具体的位置坐标值对文字区域进行剔除,即仅对文字区域以外的部分进行扫描,获取文字区域以外部分的像素点信息,根据上述像素点信息确定文字区域之间的关联路径,根据关联路径的起始坐标、终止坐标和文字区域的位置坐标确定文字区域之间的关联信息。

S204,将关联信息导入到预设的json文件中,得到关联信息的树结构;

具体的,对关联信息进行解析,在将解析后的关联信息导入预设的树模型结构,生成文字区域之间的关系树结构,并将这个树结构存储为JSON文件形式,便于后期解析生成各种形式(如echarts展示、Excel展示、图片展示等),JSON文件形式其实就是树结构解析处理关系信息的另一种形式。其中,JSON(JavaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式。它基于ECMAScript(欧洲计算机协会制定的JS规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据,简洁和清晰的层次结构使得JSON成为理想的数据交换语言,易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。

S205,基于关联信息的树结构新建脑图绘制页面,并将输入图片中所有的文本导入到新建脑图绘制页面,得到新建脑图。

具体的,在脑图软件上新建脑图绘制页面,并根据关联信息的树结构绘制脑图的树干结构,确定每一个文字区域在树干结构中的位置,识别出来的所有文本导入到新建脑图绘制页面的对应位置,得到新的脑图。其中,在步骤S203对输入图片进行遍历扫描,并依据文字区域具体的位置坐标值对文字区域进行剔除后,可以在文字区域的剔除位置与对应的文本之间建立关联标识,新建脑图绘制页面上进行文本插入时,可以依据关联标识,将文本导入到新建脑图绘制页面的对应位置。

本申请公开了一种基于图片输入的脑图生成方法,属于人工智能技术领域,所述方法通过对输入图片上的脑图进行文本识别和连接线识别,分别得到输入图片上脑图的文字区域和文字区域之间的关联信息,通过将文字区域之间的关联信息转化成树结构的关系对象,并基于树结构的关联信息新建脑图绘制页面,将所有的文本依次导入到新建脑图绘制页面的对应位置,得到新建脑图。本方案通过对基于输入图片进行识别,获取输入图片中文本对应的文字区域和文字区域之间的关联信息,根据得到文字区域和文字区域之间的关联信息在新建脑图绘制页面绘制与输入图片内容对应的新建脑图,可以实现图片样式导入的文件转换为脑图格式文件,供用户查看和编辑。

进一步地,请参考图4,图4示出了图2中步骤S202的一种具体实施方式的流程图,按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域的步骤,具体包括:

S301,获取文本信息,并根据文本信息识别文本的边缘,其中,文本信息包括文本中的字符大小和字符间距;

S302,按照预定的扫描规则对文本的边缘预定范围内的像素点进行扫描;

S303,根据扫描结果判断文本是否存在文本边框;

S304,若文本存在文本边框,则根据文本边框确定文本的文字区域;

S305,若文本不存在文本边框,则将文本的边缘扩大预定数量的像素点后生成新的边缘,并基于新的边缘确定文本的文字区域。

其中,文本信息包括字符大小和字符间距,文本的边缘可以认为是由像素点组成的、最靠近文本的矩形框,需要说明的是,文本的边缘为本申请的处理过程中计算机根据文本信息生成的虚拟边界,用于确定文本是否存在边框,且其在脑图中并不真实存在,文本的边缘的范围一般小于文本边框的范围。在本申请具体的实施例中,通过对文本的边缘四周的像素点进行扫描,根据扫描结果判断文本是否存在文本边框。

具体的,基于文本信息识别文本的边缘,按照预定的扫描规则对文本的边缘四周的像素点进行扫描,根据扫描结果判断文本是否存在文本边框。在本申请一种具体的实施例中,可以通过识别文本外的区域范围内是否存在相应的边框线来判断文本是否存在文本边框。请参考图5所示,图5示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的输入图片的示意图,以文本“ROOT”为例,通过OCR文本识别得到文本“ROOT”,扫描文本“ROOT”获取其字体大小、字体间距,基于上述文本信息计算文本“ROOT”的边缘,基于文本“ROOT”的边缘扫描文本“ROOT”四周的像素点,根据“ROOT”四周像素点的信息判断文本“ROOT”是否存在文本框。若存在,将文本框内区域视为文本“ROOT”的文字区域,对文本“ROOT”的文本框内区域着色。输入图片上的其他文本的处理方式与文本“ROOT”的处理方式相同,最终得到输入图片的所有文字区域如图6所示,图6示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的文字区域识别结果示意图。若文本“ROOT”不存在文本边框,则将文本“ROOT”的边界朝四周扩大若干个像素点以生成新的边缘,并基于新的边缘确定文本“ROOT”的文字区域。

进一步地,按照预定的扫描规则对文本的边缘预定范围内的像素点进行扫描,根据扫描结果判断文本是否存在文本边框的步骤,具体包括:

设定扫描目标区域,其中,扫描目标区域位于文本的边缘外侧;

对扫描目标区域内的像素点进行扫描,获取扫描目标区域内所有像素点的像素值;

根据扫描目标区域内所有像素点的像素值,识别扫描目标区域内是否存在像素值突变的像素点;

根据识别结果判断文本是否存在文本边框。

进一步地,根据识别结果判断文本是否存在文本边框的步骤之后,还包括:

以扫描目标区域内像素值突变的像素点作为初始点,基于封闭图形识别算法获取所有像素值突变的像素点;

根据得到的所有像素值突变的像素点生成文本的文本边框。

具体的,扫描目标区域可以依据实际需求进行设定,扫描目标区域位于文本的边缘外侧,且扫描目标区域与文本的边缘相邻。在本申请一种具体的实施例中,扫描目标区域可以是与文本的边缘相邻的某一像素点所处的行或列上的所有像素点组成的区域,通过扫描行或列上的所有像素点识别扫描目标区域内是否存在像素值突变的像素点,根据识别结果判断文本是否存在文本边框,如果目标区域内存在像素值突变的像素点,则确定文本存在文本边框。确定文本是否存在文本边框之后,以扫描得到的目标区域内像素值突变的像素点作为初始点,基于封闭图形识别算法计算出所有像素值突变的像素点,根据得到的所有像素值突变的像素点生成文本的文本边框。其中,基于封闭图形识别算法获取其他像素值突变的像素点,可以以目标区域内像素值突变的像素点作为初始点,获取初始点像素值,并在与初始点相邻的8个像素点中查找与初始点像素值相同的像素点,得到新的像素值突变的像素点,获取与新的像素值突变的像素点相邻的8个像素点的像素值,继续比对像素值以得到更多新的像素值突变的像素点,持续上述查找过程,直至获得所有像素值突变的像素点,且所有像素值突变的像素点构成一个封闭的封闭图形,即所有像素值突变的像素点生成文本的文本边框。

进一步地,按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域的步骤,具体包括:

获取文本的边缘四周预定像素范围内每一个像素点的灰度值;

将每一个像素点的灰度值与预设阈值进行比对,根据比对结果判断文本是否存在文本边框;以及

在将每一个像素点的灰度值与预设阈值进行比对,根据比对结果判断文本是否存在文本边框的步骤之后,还包括:

获取文本的边缘四周预定像素范围内灰度值大于预设阈值的所有像素点;

连接灰度值大于预设阈值的所有像素点,得到文本的文本边框。

具体的,对文本的边缘四周预订范围内的像素点进行全局扫描,获取文本的边缘四周预定像素范围内每一个像素点的灰度值,将每一个像素点的灰度值与预设阈值进行比对,根据比对结果判断文本是否存在文本边框。其中,扫描的范围可以根据实际需求进行设定,如半径5个像素点、半径10个像素点等等。一般而言,文本边框上的像素点的灰度值大于预设阈值,文本边框内的像素点的灰度值小于预设阈值,由此判断文本是否存在文本边框,即若文本的边缘四周存在灰度值大于预设阈值的像素点,且灰度值大于预设阈值的像素点可以构成闭合的形状,即确定文本存在文本边框。

在本申请一种具体的实施例中,在确定文本存在文本边框后,获取文本的边缘四周预定像素范围内灰度值大于预设阈值的所有像素点,连接灰度值大于预设阈值的所有像素点,得到文本的文本边框,通过上述实施例,可以快速判断文本是否存在文本边框。

进一步地,请参考图7,图7示出了图2中步骤S203的一种具体实施方式的流程图,对输入图片进行遍历扫描,获取输入图片中所有文字区域之间的关联信息的步骤,具体包括:

S401,获取所有文字区域的位置信息,并基于位置信息确定所有文字区域之间的路径生长关系;

S402,基于路径生长关系对输入图片进行遍历扫描,获取所有文字区域之间的路径信息。

S403,根据路径信息,获取输入图片中所有文字区域之间的关联信息。

进一步地,获取所有文字区域的位置信息,并基于位置信息确定所有文字区域之间的路径生长关系的步骤,具体包括:

在输入图片上建立基准坐标系,获取每一个文字区域在基准坐标系中的位置坐标;

基于每一个文字区域的位置坐标确定所有文字区域之间的路径生长关系。

其中,在输入图片上建立基准坐标系,并获取每一个文字区域在基准坐标系中的位置坐标,基于每一个文字区域的位置坐标确定所有文字区域之间的路径生长关系。其中,路径生长关系也即路径生长方向。在本申请具体的实施例中,文字区域可以看做是一个节点,相互连接的文字区域可以看做是对父子节点,父子节点之间通过路径相互连接,路径生长方向是从父节点指向子节点。

具体的,基于路径生长关系并以行或列的形式依次遍历输入图片所有像素点,以对输入图片完成遍历扫描,获取所有文字区域之间的路径信息。扫描时,可以依据文字区域具体的位置坐标值对文字区域进行剔除,即仅对文字区域以外的部分进行扫描,获取文字区域以外部分的像素点信息,根据上述像素点信息确定文字区域之间的关联路径,根据关联路径的起始坐标、终止坐标和文字区域的位置坐标确定文字区域之间的关联信息。

在本申请具体的实施例中,通过像素点坐标的偏移值生成路径信息,可以保证每个关系路径的唯一性。具体如下:

其中,通过计算x轴偏移量、y轴偏移量的方式遍历所有子节点和兄弟节点,得到输入图片中各个文字区域之间的路径信息,通过像素点坐标的偏移值生成路径信息,可以保证每个关系路径的唯一性。在上述实施例中,输入图片中各个文字区域之间的路径信息识别结果如图8所示,图8示出了根据本申请的基于图片输入的脑图生成方法的一个实施例的路径信息识别结果示意图。

需要强调的是,为进一步保证上述关系对象的私密和安全性,上述关系对象还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图9,作为对上述图2所示方法的实现,本申请提供了一种基于图片输入的脑图生成装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图9所示,本实施例所述的基于图片输入的脑图生成装置包括:

输入图片获取模块501,用于获取输入图片,对输入图片进行文本识别,得到输入图片中的所有文本;

文字区域识别模块502,用于按照预设的扫描规则对每一个文本周围预定范围内的像素点进行扫描,识别每一个文本的文字区域;

关联信息提取模块503,用于对输入图片进行遍历扫描,获取输入图片中所有文字区域之间的关联信息;

关系树生成模块504,用于将关联信息导入到预设的json文件中,得到关联信息的树结构;

新建脑图模块505,用于基于关联信息的树结构新建脑图绘制页面,并将输入图片中所有的文本导入到新建脑图绘制页面,得到新建脑图。

进一步地,文字区域识别模块502具体包括:

文本的边缘识别单元,用于获取文本信息,并根据文本信息识别文本的边缘,其中,文本信息包括文本中的字符大小和字符间距;

文本边框判断单元,用于按照预定的扫描规则对文本的边缘周围预定范围内的像素点进行扫描,根据扫描结果判断文本是否存在文本边框;

第一判断结果单元,用于当文本存在文本边框时,根据文本边框确定文本的文字区域;

第二判断结果单元,用于当文本不存在文本边框时,将文本的边缘扩大预定数量的像素点后生成新的边缘,并基于新的边缘确定文本的文字区域。

进一步地,文本边框判断单元具体包括:

设定子单元,用于设定扫描目标区域,其中,扫描目标区域位于文本的边缘外侧;

扫描子单元,用于对扫描目标区域内的像素点进行扫描,获取扫描目标区域内所有像素点的像素值;

识别子单元,用于根据扫描目标区域内所有像素点的像素值,识别扫描目标区域内是否存在像素值突变的像素点;

第一判断子单元,用于根据识别结果判断文本是否存在文本边框。

进一步地,该基于图片输入的脑图生成装置还包括:

第一像素点获取子单元,用于以扫描目标区域内像素值突变的像素点作为初始点,基于封闭图形识别算法获取所有像素值突变的像素点;

文本边框生成子单元,用于根据得到的所有像素值突变的像素点生成文本的文本边框。

进一步地,文本边框判断单元还包括:

灰度值获取子单元,用于获取文本的边缘预定像素范围内的每一个像素点的灰度值;

第二判断子单元,用于将每一个像素点的灰度值与预设阈值进行比对,根据比对结果判断文本是否存在文本边框;

第二像素点获取子单元,用于获取文本的边缘四周预定像素范围内灰度值大于预设阈值的所有像素点;

像素点连接子单元,用于连接灰度值大于预设阈值的所有像素点,得到文本的文本边框。

进一步地,关联信息提取模块503具体包括:

路径生长关系提取单元,用于获取所有文字区域的位置信息,并基于位置信息确定所有文字区域之间的路径生长关系;

路径信息获取单元,用于基于路径生长关系对输入图片进行遍历扫描,获取所有文字区域之间的路径信息。

关联信息生成单元,用于根据路径信息,获取输入图片中所有文字区域之间的关联信息。

进一步地,路径生长关系提取单元具体包括:

基准坐标系构建子单元,用于在输入图片上建立基准坐标系,获取每一个文字区域在基准坐标系中的位置坐标;

路径生长关系提取子单元,用于基于每一个文字区域的位置坐标确定所有文字区域之间的路径生长关系。

本申请公开了一种基于图片输入的脑图生成装置,属于人工智能技术领域,所述方法通过对输入图片上的脑图进行文本识别和连接线识别,分别得到输入图片上脑图的文字区域和文字区域之间的关联信息,通过将文字区域之间的关联信息转化成树结构的关系对象,并基于树结构的关联信息新建脑图绘制页面,将所有的文本依次导入到新建脑图绘制页面的对应位置,得到新建脑图。本方案通过对基于输入图片进行识别,获取输入图片中文本对应的文字区域和文字区域之间的关联信息,根据得到文字区域和文字区域之间的关联信息在新建脑图绘制页面绘制与输入图片内容对应的新建脑图,可以实现图片样式导入的文件转换为脑图格式文件,供用户查看和编辑。

为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图10,图10为本实施例计算机设备基本结构框图。

所述计算机设备6包括通过系统总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作系统和各类应用软件,例如基于图片输入的脑图生成方法的计算机可读指令等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的计算机可读指令或者处理数据,例如运行所述基于图片输入的脑图生成方法的计算机可读指令。

所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。

本申请公开了一种计算机设备,属于人工智能技术领域,所述方法通过对输入图片上的脑图进行文本识别和连接线识别,分别得到输入图片上脑图的文字区域和文字区域之间的关联信息,通过将文字区域之间的关联信息转化成树结构的关系对象,并基于树结构的关联信息新建脑图绘制页面,将所有的文本依次导入到新建脑图绘制页面的对应位置,得到新建脑图。本方案通过对基于输入图片进行识别,获取输入图片中文本对应的文字区域和文字区域之间的关联信息,根据得到文字区域和文字区域之间的关联信息在新建脑图绘制页面绘制与输入图片内容对应的新建脑图,可以实现图片样式导入的文件转换为脑图格式文件,供用户查看和编辑。

本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于图片输入的脑图生成方法的步骤。

本申请公开了存储介质,属于人工智能技术领域,所述方法通过对输入图片上的脑图进行文本识别和连接线识别,分别得到输入图片上脑图的文字区域和文字区域之间的关联信息,通过将文字区域之间的关联信息转化成树结构的关系对象,并基于树结构的关联信息新建脑图绘制页面,将所有的文本依次导入到新建脑图绘制页面的对应位置,得到新建脑图。本方案通过对基于输入图片进行识别,获取输入图片中文本对应的文字区域和文字区域之间的关联信息,根据得到文字区域和文字区域之间的关联信息在新建脑图绘制页面绘制与输入图片内容对应的新建脑图,可以实现图片样式导入的文件转换为脑图格式文件,供用户查看和编辑。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。

显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

相关技术
  • 基于图片输入的脑图生成方法、装置、设备及存储介质
  • 基于图片识别的骨架屏生成方法、装置、设备及存储介质
技术分类

06120112376772