掌桥专利:专业的专利平台
掌桥专利
首页

基于图片类电子书的排版方法、电子设备及存储介质

文献发布时间:2023-06-19 11:32:36


基于图片类电子书的排版方法、电子设备及存储介质

技术领域

本发明涉及计算机领域,具体涉及一种基于图片类电子书的排版方法、电子设备及存储介质。

背景技术

在电子书排版过程中,需要针对版式排版的电子书原稿进行识别,并根据识别结果通过流式排版方式实现自定义效果的排版。其中,电子书原稿通常为PDF等不可编辑的格式。在针对电子书原稿进行识别的过程中,能够自动识别出原稿中的各种页面元素,具体包括文字类元素、图片类元素等多种类型。然后,根据识别结果自动转换至流式文档中实现自定义排版。

但是,在实现本发明的过程中,发明人发现现有技术中的上述方案至少存在下述缺陷:为了丰富图片的展示效果,电子书中的图片通常并非由单一的图片元素构成,而是通过多个图片元素组合而成。相应地,若直接根据解析得到的各个页面元素进行排版,则会导致用于构成同一张图片的多个图片元素之间的位置关系发生改变,从而破坏图片本身的构图方式,使最终得到的排版内容与电子书原始内容不一致。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于图片类电子书的排版方法、电子设备及存储介质。

根据本发明的一个方面,提供了一种基于图片类电子书的排版方法,该方法包括:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

根据本发明的另一方面,提供了一种电子设备,该电子设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

根据本发明的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行以下操作:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

在本发明提供的基于图片类电子书的排版方法、电子设备及存储介质中,将位置相邻的若干图片元素合并为图片分组,并确定与图片分组相对应的外接矩形区域及其区域边框线,根据边框图片元素沿区域边框线方向的长度累积和与区域边框线的长度之间的比较结果,判断图片分组是否符合边框校验条件,若符合则针对图片分组执行截图处理,并根据截图图片生成与原始页面相对应的排版页面。由此可见,该方式能够自动将间隔较近的多个图片元素划分为一个图片分组,并根据沿区域边框线方向的长度校验结果,判断各个图片元素是否有效填充整个图片区域,从而根据判断结果校验图片分组内的各个图片元素是否同属于一张图片,并在校验结果为是时针对图片分组内的各个图片元素执行截图处理,从而保留原始图片的构图方式,避免同一图片中的多个图片元素在排版过程中被割裂的问题。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明一个实施例提供的基于图片类电子书的排版方法的流程图;

图2示出了本发明另一个实施例提供的基于图片类电子书的排版方法的流程图;

图3示出了根据本发明另一个实施例的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

图1示出了本发明一个实施例提供的基于图片类电子书的排版方法的流程图。如图1所示,该方法包括以下步骤:

步骤S110:获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组。

其中,本实施例中的电子书为图片类电子书。所谓图片类电子书,是指书籍内容中包含多张图片的电子书,具体的,可以是漫画类电子书,也可以是包含多处插图的文本类电子书,本发明对此不作限定。

具体的,针对电子书的原始页面进行解析后,能够得到页面中包含的各类页面元素,具体包括:文本元素、图片元素、表格元素等多种。并且,能够得到各类页面元素在原始页面中的位置信息。相应的,提取出原始页面中的各个图片元素,并确定各个图片元素在原始页面中的位置信息,从而将位置相邻的若干图片元素合并为图片分组。其中,在判断位置是否相邻时,可以设置一个间隔阈值,当两个图片元素之间的间隔小于该间隔阈值时,确定该两个图片元素位置相邻,应合并至同一个图片分组内。

步骤S120:确定与图片分组相对应的外接矩形区域以及外接矩形区域的区域边框线,将图片分组中包含的沿区域边框线排布的各个图片元素确定为与区域边框线相对应的边框图片元素。

其中,与图片分组相对应的外接矩形区域通常为图片分组的最小外接矩形所对应的区域。相应的,外接矩形区域的区域边框线是指最小外接矩形的边。具体地,在确定边框图片元素时,针对至少一条区域边框线,将沿该条区域边框线排布的多个图片元素确定为与该条区域边框线相对应的边框图片元素。其中,沿该条区域边框线排布是指:图片元素的一条图片边框线与该条区域边框线大致重合。

步骤S130:根据获取到的各个边框图片元素沿区域边框线方向的长度累积和与区域边框线的长度之间的比较结果,判断图片分组是否符合边框校验条件。

其中,由于各个边框图片元素的一条图片边框线与对应的区域边框线大致重合,因此,各个边框图片元素沿区域边框线方向的长度累积和即为各个边框图片元素与区域边框线大致重合的图片边框线的长度之和。将长度累积和与区域边框线的长度进行比较,具体比较时,可通过差值比较法或比值比较法等多种方式实现。当二者之间的差值较小或比值接近1时,说明该图片分组在该条区域边框线的方向上符合边框校验条件。

具体实施时,可以针对至少一条区域边框线判断是否符合边框校验条件,也可以同时针对四条区域边框线判断是否符合边框校验条件,本发明对具体细节不作限定。

步骤S140:若是,针对图片分组执行截图处理,得到与图片分组相对应的截图图片,根据截图图片生成与原始页面相对应的排版页面。

当符合边框校验条件时,说明该图片分组内部的各个图片元素同属于一个图片,因此,为了防止因各个图片元素在排版过程中被打乱顺序而导致的构图错乱的问题,针对图片分组执行截图处理,从而确保截图图片中包含的各个图片元素的位置关系与原始页面相同。

由此可见,该方式能够自动将间隔较近的多个图片元素划分为一个图片分组,并根据沿区域边框线方向的长度校验结果,判断各个图片元素是否有效填充整个图片区域,从而根据判断结果校验图片分组内的各个图片元素是否同属于一张图片,并在校验结果为是时针对图片分组内的各个图片元素执行截图处理,从而保留原始图片的构图方式,避免同一图片中的多个图片元素在排版过程中被割裂的问题。

实施例二

图2示出了本发明另一个实施例提供的基于图片类电子书的排版方法的流程图。如图2所示,该方法包括以下步骤:

步骤S210:获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组。

其中,本实施例中的电子书为图片类电子书。所谓图片类电子书,是指书籍内容中包含多张图片的电子书,具体的,可以是漫画类电子书,也可以是包含多处插图的文本类电子书,本发明对此不作限定。具体的,针对电子书的原始页面进行解析后,能够得到页面中包含的各类页面元素,具体包括:文本元素、图片元素、表格元素等多种。并且,能够得到各类页面元素在原始页面中的位置信息。相应的,提取出原始页面中的各个图片元素,并确定各个图片元素在原始页面中的位置信息,从而将位置相邻的若干图片元素合并为图片分组。

具体实施时,判断相邻的两个图片元素之间的间隔是否小于预设间隔阈值,若是,将相邻的两个图片元素合并至一个图片分组。其中,两个图片元素之间的间隔主要是指图片元素的图片边框线之间的间隔。图片元素所在的范围由图片边框线(即图片外边框)确定。若两个图片元素的图片边框线相互重合,则说明该两个图片元素之间的间隔小于预设间隔阈值。

由此可见,本步骤主要基于各个图片元素之间的位置间隔进行合并处理。由于同一个图片中的多个图片元素往往间隔较近,因此,按照位置间隔能够将可能属于同一个图片的多个图片元素大致合并到同一个分组里。

步骤S220:确定与图片分组相对应的外接矩形区域以及外接矩形区域的区域边框线,将图片分组中包含的沿区域边框线排布的各个图片元素确定为与区域边框线相对应的边框图片元素。

具体的,绘制与图片分组相对应的最小外接矩形,得到与图片分组相对应的外接矩形区域;将最小外接矩形的四条边中的至少一条确定为外接矩形区域的区域边框线。其中,图片分组内包含多个图片元素,该多个图片元素共同构成一个图片区域,无论该图片区域属于何种形状,都能够绘制出该图片区域对应的最小外接矩形,从而将该最小外接矩形所在的区域作为与图片分组相对应的外接矩形区域。另外,由于最小外接矩形有四条边,因此,将最小外接矩形中的边确定为外接矩形区域的区域边框线。由此可见,外接矩形区域的区域边框线的数量也为四条。

另外,为了沿区域边框线方向校验图片分组内的各个图片元素是否同属于一张图片,需要确定与区域边框线相对应的边框图片元素。具体的,确定图片分组中包含的沿区域边框线排布的各个图片元素,从而将沿该条区域边框线排布的各个图片元素作为与该条区域边框线相对应的边框图片元素。其中,沿该条区域边框线排布是指:图片元素的一条图片边框线与该条区域边框线大致重合。相应的,在将图片分组中包含的沿区域边框线排布的各个图片元素确定为与区域边框线相对应的边框图片元素时,分别针对每条区域边框线,将图片边框线与该条区域边框线匹配的图片元素确定为与该区域边框线相对应的边框图片元素。例如,对于左侧区域边框线而言,判断各个图片元素的左侧图片边框线是否与左侧区域边框线之间的间隔小于预设值,若是,则确定该图片元素的左侧图片边框线与左侧区域边框线相匹配。

步骤S230:根据获取到的各个边框图片元素沿区域边框线方向的长度累积和与区域边框线的长度之间的比较结果,判断图片分组是否符合边框校验条件。

其中,由于各个边框图片元素的一条图片边框线与对应的区域边框线大致重合,因此,各个边框图片元素沿区域边框线方向的长度累积和即为各个边框图片元素中与区域边框线大致重合的图片边框线的长度之和。

例如,仍以区域边框线为左侧区域边框线的情况为例,假设左侧图片边框线与左侧区域边框线相重合的图片元素共有三个,分别为图片元素1、图片元素2以及图片元素3,则分别获取图片元素1的左侧图片边框线的长度L1,图片元素2的左侧图片边框线的长度L2以及图片元素3的左侧图片边框线的长度L3,相应的,各个边框图片元素沿左侧区域边框线方向的长度累积和即为L1+L2+L3=L,假设左侧区域边框线的长度为s,则将L与s进行比较,若L与s之间的差值小于预设边框差值阈值(或比值大于预设边框比值阈值),则说明各个边框图片元素基本沿左侧方向填满整个区域边框线。其他方向的区域边框线,如右侧边框线、上方边框线以及下方边框线的校验方式与之同理。总之,边框校验条件旨在判断某一区域边框线的方向上是否被边框图片元素填满。若某一区域边框线的方向上明显存在大量空白区域而未被边框图片元素填满,则说明该方向上可能存在空缺或其他非图片元素的干扰,即:图片分组的区域范围需要调整。由此可见,将长度累积和与区域边框线的长度进行比较时,可通过差值比较法或比值比较法等多种方式实现。当二者之间的差值较小或比值接近1时,说明该图片分组在该条区域边框线的方向上符合边框校验条件。

具体实施时,分别针对每条区域边框线,计算与该条区域边框线相对应的边框图片元素沿该条区域边框线方向的长度累积和,将长度累积和与该条区域边框线的长度之间的差值与预设差值阈值进行比较,得到与该条区域边框线相对应的比较结果;根据与至少一条区域边框线相对应的比较结果,判断图片分组是否符合边框校验条件。例如,本领域技术人员可以灵活设置图片分组的边框校验条件:在一种实现方式中,当四条区域边框线相对应的比较结果的差值都小于预设边框差值阈值(或比值大于预设边框比值阈值)时,确定整个图片分组符合边框校验条件;在又一种实现方式中,只要至少一条区域边框线相对应的比较结果的差值小于预设边框差值阈值(或比值大于预设边框比值阈值)时,则确定整个图片分组符合边框校验条件,当然,在其余区域边框线相对应的比较结果的差值不小于预设边框差值阈值(或比值不大于预设边框比值阈值)时,还可以进一步结合其他辅助校验条件进行判断。

步骤S240:当判断出图片分组符合边框校验条件时,进一步判断该图片分组是否符合辅助校验条件。

其中,步骤S240为一个可选的步骤,目的在于加强验证,在本发明其他的实施例中,也可以省略本步骤。

具体的,边框校验条件能够确保沿区域边框线排布的各个边框图片元素布满整个区域边框线,从而避免在边缘区域留白。但是,发明人在实现本发明的过程中发现,即使沿区域边框线排布的各个边框图片元素布满整个区域边框线,还可能存在一些特殊情况而导致图片分组的区域范围不合理。为了避免上述特殊情况,通过辅助校验条件进行辅助判断。其中,辅助校验条件可从面积维度、文本维度进行多维度的校验,本发明不限定辅助校验的具体形式。

在一种可选的实现方式中,辅助校验条件为基于面积的校验条件。相应的,当根据与至少一条区域边框线相对应的比较结果,判断出图片分组符合边框校验条件之后,进一步判断图片分组中的各个图片元素的面积累积和与外接矩形区域的区域总面积之间的比较结果是否符合面积校验条件;当符合面积校验条件时,执行后续步骤S250。在该实现方式中,当与四条区域边框线相对应的比较结果都符合边框校验条件时,说明图片分组在上下左右四个区域边框线的方向上都没有空白区域,即:各个边框图片元素能够紧密填充各个区域边框线。此时,为了防止图片分组的中间区域存在文字等干扰内容,进一步判断上述的面积校验条件是否满足。具体的,分别获取图片分组中的各个图片元素的面积,将图片分组中的各个图片元素的面积进行累加求和,得到图片分组中的各个图片元素的面积累积和,若图片分组中的各个图片元素的面积累积和与外接矩形区域的区域总面积之间的差值小于预设面积差值阈值(或图片分组中的各个图片元素的面积累积和与外接矩形区域的区域总面积之间的比值大于预设面积比值阈值),则说明各个图片元素基本能够布满整个图片分组区域,即:图片分组的中间不存在留白或文本等干扰内容,因而图片分组符合面积校验条件。另外,当图片分组不符合面积校验条件时,还可以进一步判断外接矩形区域内部是否包含非图片区域;若是,剔除非图片区域后,执行后续步骤S250。其中,非图片区域主要是指文本区域等干扰区域。通常情况下,当图片分组的边框校验条件设置为上文提到的第一种实现方式,即:当四条区域边框线相对应的比较结果的差值都小于预设边框差值阈值(或比值大于预设边框比值阈值),则确定整个图片分组符合边框校验条件时,进一步结合面积校验条件进行辅助校验。

在又一种可选的实现方式中,辅助校验条件为基于文本的校验条件。相应的,当根据与至少一条区域边框线相对应的比较结果,判断出图片分组符合边框校验条件之后,进一步判断外接矩形区域内部是否包含文本区域;当外接矩形区域内部未包含文本区域时,执行后续步骤S250。在该实现方式中,可以在与至少一条区域边框线相对应的比较结果符合边框校验条件,且与其余区域边框线相对应的比较结果不符合边框校验条件时,进一步执行上述的判断外接矩形区域内部是否包含文本区域的操作。例如,图表类的图片(如柱状图等),至少在一个方向上是对齐的。因此,图表类图片中的各个图片元素至少能够布满一条区域边框线。此时,只要在图片分组内部未包含文本区域,则可以确定该图片分组内的各个图片元素同属于一个图片。另外,当外接矩形区域内部包含文本区域时,还可以在剔除文本区域后,执行后续步骤S250。具体的,在剔除文本区域时,可以根据各个页面元素的类型和位置,自动识别位于外接矩形区域内部的文本元素,从而剔除识别到的文本元素。或者,也可以根据接收到的由用户触发的文本框选指令剔除文本区域,本发明对具体细节不作限定。通常情况下,当图片分组的边框校验条件设置为上文提到的第二种实现方式,即:只要至少一条区域边框线相对应的比较结果的差值小于预设边框差值阈值(或比值大于预设边框比值阈值),则确定整个图片分组符合边框校验条件时,进一步结合文本校验条件进行辅助校验。

当然,本发明不限定面积校验条件、文本校验条件以及各种边框校验条件之间的组合方式,本领域技术人员可以对其进行各种灵活组合。

步骤S250:当符合辅助校验条件时,针对图片分组执行截图处理,得到与图片分组相对应的截图图片,根据截图图片生成与原始页面相对应的排版页面。

当图片分组同时符合边框校验条件以及辅助校验条件时,说明该图片分组内部的各个图片元素同属于一个图片,因此,为了防止因各个图片元素在排版过程中被打乱顺序而导致的构图错乱的问题,针对图片分组执行截图处理,从而确保截图图片中包含的各个图片元素的位置关系与原始页面相同。

具体地,针对整个图片分组所在的图片区域执行截图处理,从而将整个图片区域所对应的内容截图为一张截图图片,该截图图片作为一个完整的图片元素,从而根据该完整的图片元素以及原始页面内容中包含的其他页面元素进行排版处理,以得到与原始页面相对应的排版页面。由于截图图片以图片形式完整保留了用于构成图片的各个元素,从而避免了构图方式被打乱的问题。

本实施例中的原始页面为版式页面,排版页面为流式页面。例如,原始页面为不可编辑的PDF页面,经排版处理后得到的排版页面为EPUB文档或WORD文档等便于编辑的页面。

综上可知,该方式能够自动将间隔较近的多个图片元素划分为一个图片分组,并根据沿区域边框线方向的长度校验结果,判断各个图片元素是否有效填充整个图片区域,从而根据判断结果校验图片分组内的各个图片元素是否同属于一张图片,并在校验结果为是时针对图片分组内的各个图片元素执行截图处理,从而保留原始图片的构图方式,避免同一图片中的多个图片元素在排版过程中被割裂的问题。总之,该方式能够保留图片本身的构图方式,使最终得到的排版内容与电子书原始内容一致,进而提升了排版的效率和准确性。并且,该方式能够准确识别图片区域的范围,对不属于图片的页面元素(如文本元素等)进行剔除,从而确保最终截图得到的图片的准确性。

实施例三

本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于图片类电子书的排版方法。

可执行指令具体可以用于使得处理器执行以下操作:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

在一种可选的实现方式中,所述可执行指令使所述处理器执行以下操作:

绘制与所述图片分组相对应的最小外接矩形,得到与所述图片分组相对应的外接矩形区域;

将所述最小外接矩形的四条边中的至少一条确定为所述外接矩形区域的区域边框线。

在一种可选的实现方式中,所述可执行指令使所述处理器执行以下操作:分别针对每条区域边框线,将图片边框线与该条区域边框线匹配的图片元素确定为与该区域边框线相对应的边框图片元素;

分别针对每条区域边框线,计算与该条区域边框线相对应的边框图片元素沿该条区域边框线方向的长度累积和,将所述长度累积和与该条区域边框线的长度之间的差值与预设差值阈值进行比较,得到与该条区域边框线相对应的比较结果;

根据与至少一条区域边框线相对应的比较结果,判断所述图片分组是否符合边框校验条件。

在一种可选的实现方式中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,所述可执行指令进一步使所述处理器执行以下操作:判断所述图片分组中的各个图片元素的面积累积和与所述外接矩形区域的区域总面积之间的比较结果是否符合面积校验条件;

当符合面积校验条件时,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与四条区域边框线相对应的比较结果都符合边框校验条件;

并且,当不符合面积校验条件时,所述可执行指令进一步使所述处理器执行以下操作:判断所述外接矩形区域内部是否包含非图片区域;若是,剔除所述非图片区域后,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,所述可执行指令进一步使所述处理器执行以下操作::

判断所述外接矩形区域内部是否包含文本区域;

当所述外接矩形区域内部未包含文本区域时,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与至少一条区域边框线相对应的比较结果符合边框校验条件,且与其余区域边框线相对应的比较结果不符合边框校验条件;

并且,当所述外接矩形区域内部包含文本区域时,所述可执行指令进一步使所述处理器执行以下操作:剔除所述文本区域后,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,所述可执行指令使所述处理器执行以下操作:

判断相邻的两个图片元素之间的间隔是否小于预设间隔阈值,若是,将所述相邻的两个图片元素合并至一个图片分组。

在一种可选的实现方式中,所述原始页面为版式页面,所述排版页面为流式页面。

实施例四

图3示出了根据本发明另一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。

如图3所示,该电子设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。

其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述基于图片类电子书的排版方法实施例中的相关步骤。

具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。

处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。

存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序310具体可以用于使得处理器302执行以下操作:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

在一种可选的实现方式中,所述可执行指令使所述处理器执行以下操作:

绘制与所述图片分组相对应的最小外接矩形,得到与所述图片分组相对应的外接矩形区域;

将所述最小外接矩形的四条边中的至少一条确定为所述外接矩形区域的区域边框线。

在一种可选的实现方式中,所述可执行指令使所述处理器执行以下操作:分别针对每条区域边框线,将图片边框线与该条区域边框线匹配的图片元素确定为与该区域边框线相对应的边框图片元素;

分别针对每条区域边框线,计算与该条区域边框线相对应的边框图片元素沿该条区域边框线方向的长度累积和,将所述长度累积和与该条区域边框线的长度之间的差值与预设差值阈值进行比较,得到与该条区域边框线相对应的比较结果;

根据与至少一条区域边框线相对应的比较结果,判断所述图片分组是否符合边框校验条件。

在一种可选的实现方式中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,所述可执行指令进一步使所述处理器执行以下操作:判断所述图片分组中的各个图片元素的面积累积和与所述外接矩形区域的区域总面积之间的比较结果是否符合面积校验条件;

当符合面积校验条件时,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与四条区域边框线相对应的比较结果都符合边框校验条件;

并且,当不符合面积校验条件时,所述可执行指令进一步使所述处理器执行以下操作:判断所述外接矩形区域内部是否包含非图片区域;若是,剔除所述非图片区域后,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,所述可执行指令进一步使所述处理器执行以下操作::

判断所述外接矩形区域内部是否包含文本区域;

当所述外接矩形区域内部未包含文本区域时,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与至少一条区域边框线相对应的比较结果符合边框校验条件,且与其余区域边框线相对应的比较结果不符合边框校验条件;

并且,当所述外接矩形区域内部包含文本区域时,所述可执行指令进一步使所述处理器执行以下操作:剔除所述文本区域后,执行所述针对所述图片分组执行截图处理的步骤。

在一种可选的实现方式中,所述可执行指令使所述处理器执行以下操作:

判断相邻的两个图片元素之间的间隔是否小于预设间隔阈值,若是,将所述相邻的两个图片元素合并至一个图片分组。

在一种可选的实现方式中,所述原始页面为版式页面,所述排版页面为流式页面。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明还公开了A1.一种基于图片类电子书的排版方法,其中,所述方法包括:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

A2.根据A1所述的方法,其中,所述确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线包括:

绘制与所述图片分组相对应的最小外接矩形,得到与所述图片分组相对应的外接矩形区域;

将所述最小外接矩形的四条边中的至少一条确定为所述外接矩形区域的区域边框线。

A3.根据A1或2所述的方法,其中,所述将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素包括:分别针对每条区域边框线,将图片边框线与该条区域边框线匹配的图片元素确定为与该区域边框线相对应的边框图片元素;

则所述根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件包括:

分别针对每条区域边框线,计算与该条区域边框线相对应的边框图片元素沿该条区域边框线方向的长度累积和,将所述长度累积和与该条区域边框线的长度之间的差值与预设差值阈值进行比较,得到与该条区域边框线相对应的比较结果;

根据与至少一条区域边框线相对应的比较结果,判断所述图片分组是否符合边框校验条件。

A4.根据A3所述的方法,其中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,进一步包括:

判断所述图片分组中的各个图片元素的面积累积和与所述外接矩形区域的区域总面积之间的比较结果是否符合面积校验条件;

当符合面积校验条件时,执行所述针对所述图片分组执行截图处理的步骤。

A5.根据A4所述的方法,其中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与四条区域边框线相对应的比较结果都符合边框校验条件;

并且,当不符合面积校验条件时,判断所述外接矩形区域内部是否包含非图片区域;若是,剔除所述非图片区域后,执行所述针对所述图片分组执行截图处理的步骤。

A6.根据A3所述的方法,其中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,进一步包括:

判断所述外接矩形区域内部是否包含文本区域;

当所述外接矩形区域内部未包含文本区域时,执行所述针对所述图片分组执行截图处理的步骤。

A7.根据A6所述的方法,其中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与至少一条区域边框线相对应的比较结果符合边框校验条件,且与其余区域边框线相对应的比较结果不符合边框校验条件;

并且,当所述外接矩形区域内部包含文本区域时,剔除所述文本区域后,执行所述针对所述图片分组执行截图处理的步骤。

A8.根据A1-7任一所述的方法,其中,所述将位置相邻的若干图片元素合并为图片分组包括:

判断相邻的两个图片元素之间的间隔是否小于预设间隔阈值,若是,将所述相邻的两个图片元素合并至一个图片分组。

A9.根据A1-8任一所述的方法,其中,所述原始页面为版式页面,所述排版页面为流式页面。

B10.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:

获取针对电子书的原始页面进行解析后得到的多个图片元素以及各个图片元素在所述原始页面中的位置信息,将位置相邻的若干图片元素合并为图片分组;

确定与所述图片分组相对应的外接矩形区域以及所述外接矩形区域的区域边框线,将所述图片分组中包含的沿所述区域边框线排布的各个图片元素确定为与所述区域边框线相对应的边框图片元素;

根据获取到的各个边框图片元素沿所述区域边框线方向的长度累积和与所述区域边框线的长度之间的比较结果,判断所述图片分组是否符合边框校验条件;

若是,针对所述图片分组执行截图处理,得到与所述图片分组相对应的截图图片,根据所述截图图片生成与所述原始页面相对应的排版页面。

B11.根据B10所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:

绘制与所述图片分组相对应的最小外接矩形,得到与所述图片分组相对应的外接矩形区域;

将所述最小外接矩形的四条边中的至少一条确定为所述外接矩形区域的区域边框线。

B12.根据B10或11所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:分别针对每条区域边框线,将图片边框线与该条区域边框线匹配的图片元素确定为与该区域边框线相对应的边框图片元素;

分别针对每条区域边框线,计算与该条区域边框线相对应的边框图片元素沿该条区域边框线方向的长度累积和,将所述长度累积和与该条区域边框线的长度之间的差值与预设差值阈值进行比较,得到与该条区域边框线相对应的比较结果;

根据与至少一条区域边框线相对应的比较结果,判断所述图片分组是否符合边框校验条件。

B13.根据B12所述的电子设备,其中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,所述可执行指令进一步使所述处理器执行以下操作:判断所述图片分组中的各个图片元素的面积累积和与所述外接矩形区域的区域总面积之间的比较结果是否符合面积校验条件;

当符合面积校验条件时,执行所述针对所述图片分组执行截图处理的步骤。

B14.根据B13所述的电子设备,其中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与四条区域边框线相对应的比较结果都符合边框校验条件;

并且,当不符合面积校验条件时,所述可执行指令进一步使所述处理器执行以下操作:判断所述外接矩形区域内部是否包含非图片区域;若是,剔除所述非图片区域后,执行所述针对所述图片分组执行截图处理的步骤。

B15.根据B12所述的电子设备,其中,当根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件之后,所述可执行指令进一步使所述处理器执行以下操作::

判断所述外接矩形区域内部是否包含文本区域;

当所述外接矩形区域内部未包含文本区域时,执行所述针对所述图片分组执行截图处理的步骤。

B16.根据B15所述的电子设备,其中,所述根据与至少一条区域边框线相对应的比较结果,判断出所述图片分组符合边框校验条件包括:与至少一条区域边框线相对应的比较结果符合边框校验条件,且与其余区域边框线相对应的比较结果不符合边框校验条件;

并且,当所述外接矩形区域内部包含文本区域时,所述可执行指令进一步使所述处理器执行以下操作:剔除所述文本区域后,执行所述针对所述图片分组执行截图处理的步骤。

B17.根据B10-16任一所述的电子设备,其中,所述可执行指令使所述处理器执行以下操作:

判断相邻的两个图片元素之间的间隔是否小于预设间隔阈值,若是,将所述相邻的两个图片元素合并至一个图片分组。

B18.根据B10-17任一所述的电子设备,其中,所述原始页面为版式页面,所述排版页面为流式页面。

C19.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-9任一所述的方法。

相关技术
  • 基于图片类电子书的排版方法、电子设备及存储介质
  • 基于电子书的排版方法、电子设备及计算机存储介质
技术分类

06120112965319