掌桥专利:专业的专利平台
掌桥专利
首页

一种电子点读读物制作方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 11:42:32


一种电子点读读物制作方法、装置、电子设备和存储介质

技术领域

本申请涉及计算机技术领域,具体而言,涉及一种电子点读读物制作方法、装置、电子设备和存储介质。

背景技术

目前市场上有大量的电子有声绘本和电子点读教材等电子点读读物,这些产品可以加载到智能手机或者平板电脑上,通过点读的形式播放语音。

在现有技术中,电子点读读物在制作过程中需要大量人工处理,如包括:图片扫描、音频切割、点读位置坐标测量、索引数据整理等,制作过程相对繁琐,从而导致人工工作量相对较大。

发明内容

有鉴于此,本申请实施例提供了一种电子点读读物制作方法、装置、电子设备和存储介质,以降低电子点读读物在制作过程中的人工工作量。

第一方面,本申请实施例提供了一种电子点读读物制作方法,包括:

在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;

对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;

根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;

根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。

可选地,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。

可选地,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。

可选地,所述确定该最小可读元素所在区域在所述电子文档中的坐标信息,包括:

确定该最小可读元素所覆盖的候选区域;

按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠;

根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。

可选地,所述根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间,包括:

对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间;

根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间;

确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将所述目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。

可选地,所述根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物,包括:

对于所述电子文档中的每个最小可读元素,生成该最小可读元素对应的音频数据的文件名称、该最小可读元素对应的坐标信息、该最小可读元素对应的发音起始时间、该最小可读元素对应的发音结束时间和该最小可读元素对应的索引信息之间的第二对应关系;

根据所述电子文档和所述第二对应关系,生成所述电子点读读物。

可选地,所述方法还包括:

根据待生成的数据包的数据包类型,对所述电子点读读物进行加密,得到加密数据,其中,所述数据包类型包括在线数据包和离线数据包;

将所述加密数据发送给云端服务器。

第二方面,本申请实施例提供了一种电子点读读物制作装置,包括:

输入单元,用于在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;

第一确定单元,用于对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;

第二确定单元,用于根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;

生成单元,用于根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。

可选地,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。

可选地,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。

可选地,所述第一确定单元在用于确定该最小可读元素所在区域在所述电子文档中的坐标信息时,包括:

确定该最小可读元素所覆盖的候选区域;

按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠;

根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。

可选地,所述第二确定单元在用于根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间时,包括:

对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间;

根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间;

确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将所述目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。

可选地,所述生成单元在用于根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物时,包括:

对于所述电子文档中的每个最小可读元素,生成该最小可读元素对应的音频数据的文件名称、该最小可读元素对应的坐标信息、该最小可读元素对应的发音起始时间、该最小可读元素对应的发音结束时间和该最小可读元素对应的索引信息之间的第二对应关系;

根据所述电子文档和所述第二对应关系,生成所述电子点读读物。

可选地,该装置还包括:

加密单元,用于根据待生成的数据包的数据包类型,对所述电子点读读物进行加密,得到加密数据,其中,所述数据包类型包括在线数据包和离线数据包;

发送单元,用于将所述加密数据发送给云端服务器。

第三方面,本申请实施例提供了一种电子设备,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器运行所述机器可读指令,以执行时执行如上述第一方面方法的步骤。

第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面方法的步骤。

本申请的实施例提供的技术方案可以包括以下有益效果:

在本申请中,在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,可以根据电子文档每页的最小可读元素得到电子文档中各最小可读元素的索引信息,由于音频数据是按照章节顺序输入的,因此可以根据得到的索引信息给音频数据进行重命名,使得以便可以根据音频数据的文件名称确定该音频数据对应的章节,同时,为了对各最小可读元素进行区分,需要确定各可读在电子文档中的坐标信息,并记录最小可读元素和坐标信息的第一对应关系,通过坐标信息可以确定出唯一的最小可读元素,并且,为了确定各最小可读元素对应的语音信息,需要利用各最小可读元素对应的目标音频数据中各字符的发音时间,确定各最小可读元素的发音起始时间和发音结束时间,在得到上述的索引信息、坐标信息、第一对应关系、发音起始时间、发音结束时间和文件名称后,可以根据上述确定某个最小可读元素在电子文档中的具体位置,以及该最小可读元素在音频数据中的具体时间段,因此可以通过上述信息和电子文档来生成电子点读读物,在上述方法中由于无需人工参与,因此有利于降低人工工作量,并且相对于人工处理的方式,本申请还有利于提高电子点读读物的制作效率,降低电子点读读物的制作时长。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例一提供的一种电子点读读物制作方法的流程示意图;

图2为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图;

图3为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图;

图4为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图;

图5为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图;

图6为本申请实施例二提供的一种电子点读读物制作装置的结构示意图;

图7为本申请实施例二提供的另一种电子点读读物制作装置的结构示意图;

图8为本申请实施例三提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

实施例一

图1为本申请实施例一提供的一种电子点读读物制作方法的流程示意图,如图1所示,该方法包括以下步骤:

步骤101、在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称。

步骤102、对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系。

步骤103、根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间。

步骤104、根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。

具体的,电子文档中的最小可读元素为电子文档中作为一个整体的最小单元,例如:电子文档中的一个段落、或者一个单词等,如果该段落或该单词可以作为一个最小整体,则该段落或该单词均可以作为最小可读单元。

在输入电子文档和该电子文档的音频数据时,可以先输入电子文档,该电子文档的格式可以是PDF(Portable Document Format,可携带文档格式)格式的,当然也可以是其他格式的,该电子文档中包括目录信息、每页的文字和图片信息等,在导入过程中可以将该电子文档的图书名称、章节、页码和最小可读元素ID等数据记录到索引信息中,并将该索引信息作为各最小可读元素的索引信息。

在输入完电子文档后,再输入音频数据,其中,每个音频数据为电子文档一个章节对应的音频数据,即:电子文档中的一个章节的音频数据都记录在一个音频数据中,该电子文档包括几个章节,那么该电子文档就对应多少个音频数据,为了确定每个音频数据所对应的章节,在输入音频数据时按照电子文档包括的章节的顺序依次输入音频数据,由于根据索引信息能够得到章节的先后顺序,因此可以根据索引信息顺序为各音频数据进行重命名,得到各音频数据的文件名称,例如:将章节1的名称作为第1个输入的音频数据的文件名称,将章节2的名称作为第2个输入的音频数据的文件名称,以此类推。

为了对各最小可读元素进行区分,需要确定各可读在电子文档中的坐标信息,并记录最小可读元素和坐标信息的第一对应关系,通过坐标信息可以确定出唯一的最小可读元素,并且,为了确定各最小可读元素对应的语音信息,需要利用各最小可读元素对应的目标音频数据中各字符的发音时间,确定各最小可读元素的发音起始时间和发音结束时间,通过最小可读元素的索引信息可以确定该最小可读元素对应的音频数据,通过发音起始时间和发音结束时间可以确定该音频数据中与该最小可读元素对应的音频数据,在得到上述的索引信息、坐标信息、第一对应关系、发音起始时间、发音结束时间和文件名称后,可以根据上述确定某个最小可读元素在电子文档中的具体位置,以及该最小可读元素在音频数据中的具体时间段,因此可以通过上述信息和电子文档来生成电子点读读物,在上述方法中由于无需人工参与,因此有利于降低人工工作量,并且相对于人工处理的方式,本申请还有利于提高电子点读读物的制作效率,降低电子点读读物的制作时长。

需要说明的是,当电子文档的格式为PDF格式时,在确定坐标信息时,可以基于PDF开发库iText的方法来确定坐标信息。

在一个可行的实施方案中,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。

具体的,当索引信息包括上述内容时,可以通过一个索引信息确定出唯一一个最小可读元素,从而有利于提高确定最小可读元素时的准确性。

在一个可行的实施方案中,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。

具体的,通过章节和页码可以确定某一最小可读元素,为了确定该最小可读元素在页面中的具体位置,以便在进行点读时可以获得准确的音频,需要确定该最小可读元素所在页面中所在的矩形区域,并且为了减少数据量,可以使用该矩形区域的两个对角的坐标作为坐标信息的一部分,如:矩形的左上角和右下角的坐标作为矩形的坐标,或者是矩形的右上角和左下角的坐标作为矩形的坐标。

在一个可行的实施方案中,图2为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图,如图2所示,在执行确定该最小可读元素所在区域在所述电子文档中的坐标信息这一步骤时,可以通过以下步骤实现:

步骤201、确定该最小可读元素所覆盖的候选区域。

步骤202、按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠。

步骤203、根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。

具体的,考虑到智能手机或平板电脑等电子设备的屏幕相对较小,如果某一最小可读元素所在区域也较小,那么会导致点读错误的情况发生,为了增加容错率,在确定出该最小可读元素所覆盖的候选区域后,可以按照预设扩大规则,对所述候选区域进行扩大处理,以将扩大后的区域作为该最小可读元素的所在区域,其中,扩大处理的原则是位于同一页面上的各最小可读元素对应的目标区域不交叠,然后根据得到的目标区域确定该最小可读元素所在区域在所述电子文档中的坐标信息,例如:在确定出最小可读元素所覆盖的候选区域后,可以对该候选区域增加一个偏移值,然后按照该偏移值对该候选区域所在的矩形区域进行扩大,从而得到目标区域,如:当确定出的最小可读元素所覆盖的候选区域的左上角坐标为(20,20),右下角坐标为(100,50),设定的偏移值为5像素偏移值,则得到的目标区域为左上角坐标为(15,15),右下角坐标为(105,55)的矩形区域。

需要说明的是,该偏移值可以是具体的数值,或者也可以是按照屏幕的尺寸设定的百分比,关于具体的偏移值可以根据实际需要进行设定,在此不做具体限定。

在一个可行的实施方案中,图3为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图,如图3所示,在执行步骤103时,可以通过以下步骤实现:

步骤301、对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间。

步骤302、根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间。

步骤303、确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将所述目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。

具体的,为了确定最小可读元素对应的语音在目标音频数据中的发音起始时间和发音结束时间,可以对目标音频数据进行语音识别,得到该目标音频数据的文本信息,同时根据目标音频数据中各字符的发音时间,对文本信息中的各字符的发音起始时间和发音结束时间进行标记,由于一个最小可读元素的发音在目标音频数据中作为一个整体存在,即:目标音频数据中包括多段发音,因此每个目标音频数据对应的文本信息包括多个文本段落,每个文本段落对应一个最小可读元素,因此可以确定文本信息中包括的各文本段落中和该最小可读元素相似度,其中,相似度最高的文本段落为该最小可读元素对应的目标文本段落,由于文本信息中的每个字符的发音都标记有发音起始时间和发音结束时间,因此可以将目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间,通过上述方法可以准确地确定出该最小可读元素在目标音频数据中的发音时间。

由于语音识别技术还存在识别转换误差,所以为了确定出最小可读元素在目标音频数据中对应的音频,还需要通过误差率来确定最小可读元素与文本段落的对应关系,例如:某页中的一个最小可读元素的文本为“Good morning,Candy”,通过语音识别后转换的文本段落为“Good morning,Cindy”,对比原文本和识别后的文本16个字符错了1个字符,错误率6.25%;再将该页其他最小可读元素的文本与识别出来的文本段落进行对比,如果错误率均大于6.25%,则将该最小可读元素的文本与文本段落为“Good morning,Cindy”建立对应关系,即:不一定识别率为100%的文本段落才是该最小可读元素对应的文本段落,然后将该文本段落中的首字符的发音起始时间作为该最小可读元素的发音起始时间,将该文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。通过该方法循环匹配该页中每个最小可读元素对应的文本段落后,再循环匹配其他页,即可得到电子文档中每个最小可读元素对应的文本段落。

在一个可行的实施方案中,图4为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图,如图4所示,在执行步骤104时,可以通过以下步骤实现:

步骤401、对于所述电子文档中的每个最小可读元素,生成该最小可读元素对应的音频数据的文件名称、该最小可读元素对应的坐标信息、该最小可读元素对应的发音起始时间、该最小可读元素对应的发音结束时间和该最小可读元素对应的索引信息之间的第二对应关系。

步骤402、根据所述电子文档和所述第二对应关系,生成所述电子点读读物。

具体的,在得到上述的坐标信息、第一对应关系、发音起始时间、发音结束时间、文件名称后,对于每个最小可读元素而言,可以通过用户点读的位置确定出坐标信息,然后根据坐标信息可以确定出对应的最小可读元素,然后通过最小可读元素的索引信息可以确定出该最小可读元素对应的音频数据的文件名称和发音时间,通过文件名称可以找到该最小可读元素对应的音频数据,然后根据发音起始时间从该最小可读元素对应的音频数据某时间点开始读取音频,到发音结束时间结束播放,从而可以准确地找到音频数据的播放时间段,进而可以根据上述的第二对应关系和电子文档生成电子点读读物。

需要说明的是,每个最小可读元素的第二对应关系可以制作成链接,在确定出具体的最小可读元素后,可以通过链接读取到对应的音频数据。

在一个可行的实施方案中,图5为本申请实施例一提供的另一种电子点读读物制作方法的流程示意图,如图5所示,在得到电子点读读物后,该方法还包括以下步骤:

步骤501、根据待生成的数据包的数据包类型,对所述电子点读读物进行加密,得到加密数据,其中,所述数据包类型包括在线数据包和离线数据包。

步骤502、将所述加密数据发送给云端服务器。

具体的,为了防止侵权行为,可在生成数据包过程中对电子文档、音频数据等信息进行数据加密。在线数据存储在服务器云端,使用时通过接口调用;离线数据将各数据文件打包成一个压缩文件,供用户下载解压后离线使用,解密的秘钥存放在服务器中,以供用户进行离线数据的校验。

需要说明的是,在生成电子点读读物之前,还需要对之前得到的信息进行人工校对,校对工作主要分为坐标信息的校对和发音时间点的校对:

1、坐标信息的校对:系统需要提供可视化预览界面显示电子文档及标记出的点读框,校对者通过逐页查看点读框位置,对位置有偏差的点读框进行微调,从而确定出更准确的坐标信息。具体操作是通过可视化界面,通过鼠标拖拽可以调整点读框在该页书本中的位置,或通过拖动点读框边线或边角区域可以调整点读框大小。同时在系统编辑界面中有可编辑文本框供校对者对点读框坐标数值进行查看和微调,对坐标信息进行直接修改后预览页面中的点读框的大小和位置也会同步改变。类似word调整图片大小可以鼠标拖动也可以在文本框中调整图片的高度和宽度数值。在调整完毕后点击保存即可更新坐标信息。

2、发音时间点的校对:校对者通过逐页点击点读框,播放该点读框对应音频,系统同时展示对应的可视化的音频波形图并定位到该点读框的音频段,校对者如果听到该点读框播放音频时间点有偏差,则只需鼠标点击调整定位该波形起始帧或结束帧即可。因为一句点读音频前后会有大量的静音无波形的帧,所以通过图形化显示音频波形可以进行精确定位。同时在系统编辑界面中有可编辑文本框供校对者对点读框开始和结束时间进行查看和微调,在文本框中修改时间点后波形图上的标注也会同步改变。在调整完毕后点击保存,即可更新书本索引表中的发音时间点数据。校对界面也提供连续播放的功能,可以连续播放每一页的音频,并根据点读框时间点依次高亮标记正在播放的点读框,供校对者连续快速的检测。

在电子点读读物的使用阶段,用户进入电子点读读物后先读取电子文档并显示电子文档的图书页面,然后根据书本索引数据表中保存的点读框数据在该页生成点读框对象图层,该图层可以是透明的也可以是有边框底色的,可根据用户设置“是否显示点读框”渲染显示。

在点读阶段,用户点击该页任意位置后,获得该点击位置的坐标值,如用户在页面上点击时有位移滑动,则比较开始点击屏幕的坐标和离开屏幕的坐标位置,如两个坐标的X坐标值之差非常小(比如小于页面宽度的1%),则判断用户仍为点击操作,可能是点击时有抖动,记录用户点击屏幕时的坐标值;如两个坐标的X坐标值之差有一定距离,则判断为滑动操作,根据向左滑动和向右滑动的判断进行书本向左翻页和向右翻页的动作。如果是点读操作,将用户点读时记录的坐标值与该页各点读框坐标范围进行比较,如果用户点击坐标命中在某个点读框范围内,对命中的点读框进行高亮显示,加载该点读框对应书本章节的音频数据,并根据索引数据表中该点读框的音频开始时间跳转到对应秒进行音频播放,根据该点读框音频结束时间减去开始时间计算出播放时长,在播放时长达到后停止播放。例如:点读框开始时间是3.12秒,结束时间是6.47秒,播放时长就是3.35秒,用户点击该点读框后加载该章对应的音频数据,并跳转到3.12秒开始播放,持续播放3.35秒后停止。

除了单句点读播放模式以外,系统也可以提供连续播放、复读循环播放等功能,用户可以切换播放模式。如选择为连续播放则在一个点读框播放完毕后自动播放下一个点读框,如下一个点读框在下一页则自动翻页。如选择为单句复读循环播放,则在点读框播放完后重新播放该点读框,直到用户点击停止播放。此外也可以提供A-B循环播放,可以设置起始点读框A和结束点读框B,在这两个点读框包含的N个点读框范围内循环播放,即从A点读框开始播放,一直播放到B点读框结束后再开始播放点读框A,以此往复,直到用户点击停止播放。

实施例二

图6为本申请实施例二提供的一种电子点读读物制作装置的结构示意图,如图6所示,该装置包括:

输入单元61,用于在获取到待生成的电子点读读物的电子文档,以及按照所述电子文档中的章节顺序依次输入的所述电子文档包含的各章节对应的音频数据后,根据所述电子文档每页的最小可读元素,生成所述电子文档包括的各最小可读元素的索引信息;以及根据所述索引信息,按照所述音频数据的输入顺序为各所述音频数据进行重命名,以得到各所述音频数据的文件名称;

第一确定单元62,用于对于所述电子文档中的每个最小可读元素,确定该最小可读元素所在区域在所述电子文档中的坐标信息,并记录该最小可读元素和所述坐标信息的第一对应关系;

第二确定单元63,用于根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间;

生成单元64,用于根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物。

在一个可行的实施方案中,所述索引信息包括:所述电子文档的图书名称、所述最小可读元素所在章节的章节信息、所述最小可读元素所在页码的页码信息和所述最小可读元素的标识。

在一个可行的实施方案中,所述坐标信息包括:该最小可读元素所在的目标章节、该最小可读元素所在的目标页码和该最小可读元素在所述目标页码对应的目标页面中所在矩形区域的两个对角定点的坐标。

在一个可行的实施方案中,所述第一确定单元62在用于确定该最小可读元素所在区域在所述电子文档中的坐标信息时,包括:

确定该最小可读元素所覆盖的候选区域;

按照预设扩大规则,对所述候选区域进行扩大处理,得到目标区域,以将所述目标区域作为该最小可读元素的所在区域,其中,位于同一页面上的各最小可读元素对应的目标区域不交叠;

根据所述目标区域,确定该最小可读元素所在区域在所述电子文档中的坐标信息。

在一个可行的实施方案中,所述第二确定单元63在用于根据该最小可读元素对应的目标音频数据中各字符的发音时间,确定该最小可读元素的发音起始时间和发音结束时间时,包括:

对所述目标音频数据进行语音识别,得到所述目标音频数据的文本信息,以及所述目标音频数据中各字符的发音时间;

根据所述目标音频数据中各字符的发音时间,确定所述文本信息中的各字符的发音起始时间和发音结束时间;

确定所述文本信息中包括的各文本段落中和该最小可读元素相似度最高的目标文本段落,以将所述目标文本段落的首字符的发音起始时间作为该最小可读元素的发音起始时间,将所述目标文本段落的尾字符的发音结束时间作为该最小可读元素的发音结束时间。

在一个可行的实施方案中,所述生成单元64在用于根据所述索引信息、所述坐标信息、所述第一对应关系、所述发音起始时间、所述发音结束时间、所述文件名称和所述电子文档,生成所述电子点读读物时,包括:

对于所述电子文档中的每个最小可读元素,生成该最小可读元素对应的音频数据的文件名称、该最小可读元素对应的坐标信息、该最小可读元素对应的发音起始时间、该最小可读元素对应的发音结束时间和该最小可读元素对应的索引信息之间的第二对应关系;

根据所述电子文档和所述第二对应关系,生成所述电子点读读物。

在一个可行的实施方案中,图7为本申请实施例二提供的另一种电子点读读物制作装置的结构示意图,如图7所示,该装置还包括:

加密单元65,用于根据待生成的数据包的数据包类型,对所述电子点读读物进行加密,得到加密数据,其中,所述数据包类型包括在线数据包和离线数据包;

发送单元66,用于将所述加密数据发送给云端服务器。

关于实施例二的原理说明可参考实施例一的详细介绍,在此不再一一赘述。

实施例三

图8为本申请实施例三提供的一种电子设备的结构示意图,包括:处理器801、存储介质802和总线803,所述存储介质802存储有所述处理器801可执行的机器可读指令,当电子设备运行上述的电子点读读物制作方法时,所述处理器801与所述存储介质802之间通过总线803通信,所述处理器801执行所述机器可读指令,以执行实施例一中所述的方法步骤。

实施例四

本申请实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一中所述的方法步骤。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种电子点读读物制作方法、装置、电子设备和存储介质
  • 一种点读内容定位方法、装置、电子设备及存储介质
技术分类

06120113022680