掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及语音搜索技术领域,具体为无网络条件下离线语音检索产品的方法。

背景技术

语音搜索指的是允许通过对着手机或电脑说话使用手机和电脑进行搜索,即通过设备上传说出的内容,经过服务器进行识别,然后根据识别的结果搜索信息,语音搜索技术已经成为日程生活中较为重要的一部分,能够使用户随时随地进行语音操控,给人们的生活带来较大的便利;

但是目前在离线状态下的语音搜索技术不够成熟,语音识别在断网状态下的使用较为麻烦,离线状态下的搜索范围有限,对于数据的处理速度较慢,从而导致搜索结果的准确度较低,对搜索造成一定的影响,无法满足搜索的需要。

发明内容

本发明提供无网络条件下离线语音检索产品的方法,可以有效解决上述背景技术中提出目前在离线状态下的语音搜索技术不够成熟,语音识别在断网状态下的使用较为麻烦,离线状态下的搜索范围有限,对于数据的处理速度较慢,从而导致搜索结果的准确度较低,对搜索造成一定的影响,无法满足搜索的需要的问题。

为实现上述目的,本发明提供如下技术方案:无网络条件下离线语音检索产品的方法,包括如下搜索步骤:

S1、首先,使用安卓SDK开发集成离线数据库,并在数据库中下载可供识别使用的语音、文字和专用场景知识图谱,对离线数据库进行分类;

S2、用户通过语音接收装置接收语音,并将语音与离线的数据库进行匹配,对语音进行识别转换,并根据文字匹配专用场景的知识图谱;

S3、根据专用场景的知识图谱和纠错系统,对识别转换的文字进行纠错;

S4、在纠错后对文字进行标记和替换,并进行显示;

S5、在纠错完成后,利用专用场景知识图谱,对文字标记标签,将识别的文字进行分类;

S6、标签标记完成后,通过识别标签即可查找对应的全部文字和语音内容;

S7、后期输入语音后,直接打开对应的标签,能够查看对应标签的内容。

根据上述技术方案,所述S1中,在数据库中设置需要的专用场景知识图谱,然后在每个对应的专用场景知识图谱中下载对应的语音和文字,根据专用场景设置分类数据库,在识别到文字后对应的专用场景知识谱图打开,查阅对应的语音和文字,在识别语音转换成文字时识别其对应的专用场景知识谱图。

根据上述技术方案,所述S2中,用户说出需要搜索的相关内容,语音接收装置接收用户语音后,先对语音进行转换,然后先将文字与离线数据库中的文字进行匹配,查找到匹配的文字内容,进而查找该文字对应的专用场景知识图谱,然后将对应场景的内容呈现在显示装置上。

用户通过语音接收装置接收语音,并将语音与离线的数据库进行匹配,对语音进行识别转换,并根据语音匹配专用场景的知识图谱。

根据上述技术方案,所述S2中,在语音转换成为文字后,在对应的专用场景知识图谱中搜索出对应的内容,根据搜索结果从高到低将对应场景的知识图谱进行排序,并呈现在显示装置上。

根据上述技术方案,所述S3-S4中,在对语音进行识别时,利用纠错系统对难以识别的语音内容、错误的文字搭配进行查找;

对于难识别的语音,根据前后识别出语音的语境、语音长度和读音,对难识别的语音进行推断,给出适合语境的推断结果;

对于错误的文字,根据语义内容给出正确的文字内容,并在初次识别后的文字上进行修改。

根据上述技术方案,所述难以识别的语音,推断结果通过蓝色字体进行显示,正常识别出的文字通过黑色字体进行显示;

错误文字进行修改时,将初次识别的错误文字外部添加方框进行框选,并将修改后的文字加粗,显示在方框的下方位置。

根据上述技术方案,所述S5中,在纠错完成后,将对应的知识图谱显示,通过知识图谱为每个专用场景标记标签,使标签、文字、专用场景和知识图谱一一对应,识别其中的任一项即可打开全部内容进行查看,并将分类数据库用标签进行命名。

根据上述技术方案,所述标签由2-8位汉字组成,标签本身可作为识别的关键字进行匹配,在识别过程中,优先识别标签和文字,然后确定专用场景知识图谱,确定专用场景知识图谱后,优先在该专用场景知识图谱下进行识别。

根据上述技术方案,所述S6中,在标签标记完成后,选择一个标签,自动排除其他标签内容的干扰,打开该标签对应的分类数据库,根据数据库中的知识谱图,搜索到对应的内容,从而快速查找需要的文字内容。

根据上述技术方案,所述S7中,再次输入分类数据库中对应的语音数据,语音与该数据的标签匹配,直接打开对应的数据库,对后续输入的语音内容进行识别,通过语音输入搜索需要的内容。

与现有技术相比,本发明的有益效果:

1、通过安卓SKD设备设置离线的分类数据库,在数据库中下载对应的内容,对不同场景下的数据进行单独存储,语音识别时,先将语音转换成文字,然后对转换后的内容进行分类,在对应的分类数据库进行内容的搜索,使离线版的语音识别分类清晰,在识别时,快速的定位需要搜索的范围,从而使范围选择更加快速。

2、在进行数据库分类和语音识别搜索时,均进行专用场景知识图谱的加载,通过专用场景知识图谱的加载,能够在特定的场景和图谱中进行搜索,使搜索的思路更加清晰,适用性更强,从而能够对不同的场景进行搜索,呈现出不同的搜索结果,是当前搜索操作中不具备的,使搜索的结果更加贴合用户的搜索需要,使用户使用起来更加灵活。

3、通过对语音转换中难以识别和识别错误的位置进行分析,根据场景内容,对难以识别的内容进行推断,对识别错误的内容进行修改,并通过不同颜色进行显示,能够对用户语音识别的效率更高,对于语音中简单的错误进行处理,从而提高识别效率,减少语音重复输入的次数,识别的能力更强。

4、通过对专用场景的知识图谱进行标签标记,在纠错完成后,将对应的知识图谱显示,通过知识图谱为每个专用场景标记标签,使标签、文字、专用场景和知识图谱一一对应,识别其中的任一项即可打开全部内容进行查看,并将分类数据库用标签进行命名,在识别对应场景时,能够通过标签进行识别,自动排除其他标签内容的干扰,打开该标签对应的分类数据库,识别的数字较少,方便识别。

5、通过知识图谱,对较多数据的数据库内的内容进行梳理,方便在识别时打开该标签对应的分类数据库,根据分类数据库的知识图谱进行对应内容的搜索,搜索时步骤更加具有条理性,能够在复杂的数据中快速找到对应的数据。

综上所述,通过对数据库进行分类,确定数据范围,利用知识图谱对数据库中的数据进行搜索,从而一步步细化需要的数据,能够使数据更具有条理性,搜索时间缩短,并根据专用场景对难以识别的内容进行推断,对错误识别的内容进行修改,提高语音转换效率,通过标记标签,对不同的知识图谱进行标记,可以通过标签识别对应的专用场景知识图谱,增加知识图谱的识别效率。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。

在附图中:

图1是本发明搜索方法的步骤流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

实施例:如图1所示,本发明提供一种技术方案,无网络条件下离线语音检索产品的方法,包括如下搜索步骤:

S1、首先,使用安卓SDK开发集成离线数据库,并在数据库中下载可供识别使用的语音、文字和专用场景知识图谱,对离线数据库进行分类;

S2、用户通过语音接收装置接收语音,并将语音与离线的数据库进行匹配,对语音进行识别转换,并根据文字匹配专用场景的知识图谱;

S3、根据专用场景的知识图谱和纠错系统,对识别转换的文字进行纠错;

S4、在纠错后对文字进行标记和替换,并进行显示;

S5、在纠错完成后,利用专用场景知识图谱,对文字标记标签,将识别的文字进行分类;

S6、标签标记完成后,通过识别标签即可查找对应的全部文字和语音内容;

S7、后期输入语音后,直接打开对应的标签,能够查看对应标签的内容。

根据上述技术方案,S1中,在数据库中设置需要的专用场景知识图谱,然后在每个对应的专用场景知识图谱中下载对应的语音和文字,根据专用场景设置分类数据库,在识别到文字后对应的专用场景知识谱图打开,查阅对应的语音和文字,在识别语音转换成文字时识别其对应的专用场景知识谱图。

根据上述技术方案,S2中,用户说出需要搜索的相关内容,语音接收装置接收用户语音后,先对语音进行转换,然后先将文字与离线数据库中的文字进行匹配,查找到匹配的文字内容,进而查找该文字对应的专用场景知识图谱,然后将对应场景的内容呈现在显示装置上。

用户通过语音接收装置接收语音,并将语音与离线的数据库进行匹配,对语音进行识别转换,并根据语音匹配专用场景的知识图谱。

根据上述技术方案,S2中,在语音转换成为文字后,在对应的专用场景知识图谱中搜索出对应的内容,根据搜索结果从高到低将对应场景的知识图谱进行排序,并呈现在显示装置上。

根据上述技术方案,S3-S4中,在对语音进行识别时,利用纠错系统对难以识别的语音内容、错误的文字搭配进行查找;

对于难识别的语音,根据前后识别出语音的语境、语音长度和读音,对难识别的语音进行推断,给出适合语境的推断结果;

对于错误的文字,根据语义内容给出正确的文字内容,并在初次识别后的文字上进行修改。

根据上述技术方案,难以识别的语音,推断结果通过蓝色字体进行显示,正常识别出的文字通过黑色字体进行显示;

错误文字进行修改时,将初次识别的错误文字外部添加方框进行框选,并将修改后的文字加粗,显示在方框的下方位置。

根据上述技术方案,S5中,在纠错完成后,将对应的知识图谱显示,通过知识图谱为每个专用场景标记标签,使标签、文字、专用场景和知识图谱一一对应,识别其中的任一项即可打开全部内容进行查看,并将分类数据库用标签进行命名。

根据上述技术方案,标签由2-8位汉字组成,标签本身可作为识别的关键字进行匹配,在识别过程中,优先识别标签和文字,然后确定专用场景知识图谱,确定专用场景知识图谱后,优先在该专用场景知识图谱下进行识别。

根据上述技术方案,S6中,在标签标记完成后,选择一个标签,自动排除其他标签内容的干扰,打开该标签对应的分类数据库,根据数据库中的知识谱图,搜索到对应的内容,从而快速查找需要的文字内容。

根据上述技术方案,S7中,再次输入分类数据库中对应的语音数据,语音与该数据的标签匹配,直接打开对应的数据库,对后续输入的语音内容进行识别,通过语音输入搜索需要的内容。

最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 无网络条件下离线语音检索产品的方法
  • 解决语音检索多条件下的冲突方法
技术分类

06120113177925