掌桥专利:专业的专利平台
掌桥专利
首页

语音识别系统、指令产生系统及其语音识别方法

文献发布时间:2023-06-19 09:32:16


语音识别系统、指令产生系统及其语音识别方法

技术领域

本发明有关于一种语音识别技术,且特别有关于一种语音识别系统、指令产生系统及其语音识别方法。

背景技术

随着语音识别技术的演进,各种应用系统都开始尝试搭载有语音识别功能,以提升应用系统的操作便利性。特别是,对于虚拟实境(Virtual Reality,VR)系统或扩增实境(Augmented Reality,AR)系统而言,若能提供语音识别功能将可大幅提升虚拟实境系统或扩增实境系统的操作便利性以及使用者体验。然而,由于语音识别往往需要花费大量的系统资源,因此将会导致系统的建置成本增加,甚至影响系统运行速度。

另一个问题是,由于传统的语音识别是通过自动语音辨识文法(AutomaticSpeech Recognition grammar,ASR grammar)的编译来实现语音识别功能,因此使用者需将语音选择的所有说法与内容都编译至自动语音辨识文法当中,并且只有完全符合自动语音辨识文法的文字才能够被匹配。也就是说,传统的语音识别方法对于系统开发者来说需要花费大量的工作量,并且语音识别的使用上也不够灵活。甚至,若需要在虚拟实境系统或扩增实境系统中实现语音识别功能,可能还需要搭配更改应用系统的内部系统设定,而导致系统的设置复杂度以及设置成本的增加。

发明内容

本发明提供一种语音识别系统、指令产生系统及其语音识别方法,可提供便捷的语音识别功能。

本发明的语音识别系统适于与应用系统进行通信。应用系统用以接收语音输入。语音识别系统包括语音辨识模块、自然语音理解系统以及指令产生系统。语音辨识模块用以接收由应用系统提供的语音输入,并且辨识语音输入,以产生语音信息。自然语音理解系统耦接语音辨识模块,并且用以理解语音信息,以产生语意分析结果。指令产生系统耦接自然语音理解系统,并且用以利用该语意分析结果来比较在一当前使用者界面的一界面内容中的一选择项目,并且依据一比较结果来输出控制指令至应用系统。

在本发明的一实施例中,上述的指令产生系统包括比较模块以及指令确认模块。比较模块用以接收语意分析结果,并且利用语意分析结果来比较在当前使用者界面的界面内容中的选择项目,以产生比较结果。指令确认模块耦接比较模块,并且用以依据指令格式来转换比较结果,而输出控制指令。

在本发明的一实施例中,上述的应用系统用以显示当前使用者界面。当应用系统接收到由语音识别系统所输出的控制指令后,应用系统依据控制指令来选择当前使用者界面的界面内容中的选择项目,并更换以显示下一使用者界面或执行特定操作。

在本发明的一实施例中,上述的自然语音理解系统包括自然语言处理器、知识辅助理解模块、检索系统以及分析结果输出模块。自然语言处理器耦接语音辨识模块,并且用以接收语音信息,以产生可能意图语法数据。知识辅助理解模块耦接自然语言处理器,并且用储存可能意图语法数据的意图数据。检索系统耦接知识辅助理解模块,并且用以接收知识辅助理解模块提供的可能意图语法数据的关键字,以依据关键字来产生响应结果至知识辅助理解模块,以使知识辅助理解模块依据响应结果来产生确定意图语法数据。分析结果输出模块耦接知识辅助理解模块以及指令产生系统,并且用以依据确定意图语法数据来输出语意分析结果。

本发明的指令产生系统适于与应用系统进行通信。应用系统用以接收语音输入。指令产生系统包括比较模块以及指令确认模块。比较模块用以接收对应于语音输入的语意分析结果,并且利用语意分析结果来比较在当前使用者界面的界面内容中的选择项目,以产生比较结果。指令确认模块耦接比较模块,以依据指令格式来转换比较结果,而输出控制指令至应用系统。

本发明的语音识别方法适于语音识别系统。语音识别系统与应用系统进行通信,并且应用系统用以接收语音输入。语音识别方法包括以下步骤。接收由应用系统提供的语音输入。辨识语音输入,以产生语音信息。理解语音信息,以产生语意分析结果。比较语意分析结果,以输出控制指令至应用系统。

本发明的语音识别方法适于指令产生系统。指令产生系统适于与应用系统进行通信,并且应用系统用以接收语音输入。语音识别方法包括以下步骤。接收对应于语音输入的语意分析结果。利用语意分析结果来比较在当前使用者界面的界面内容中的选择项目,以产生比较结果。依据指令格式来确认比较结果,而输出控制指令至应用系统。

基于上述,本发明的语音识别系统、指令产生系统及其语音识别方法可辨识由应用系统提供的语音输入,并且回传对应的控制指令至应用系统,而使应用系统可依据控制指令来执行相对应的操作。因此,本发明的语音识别系统、指令产生系统及其语音识别方法除了可提供便捷的语音识别功能,还可降低在应用系统中对于语音识别所需要的系统资源。

为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图式作详细说明如下。

附图说明

图1是依照本发明的一实施例的语音识别系统的示意图。

图2是依照本发明的一实施例的语音识别方法的流程图。

图3是依照本发明的一实施例指令产生系统的示意图。

图4是依照本发明的另一实施例的语音识别方法的流程图。

图5是依照本发明的一实施例的应用系统的使用者界面示意图。

图6是依照本发明的一实施例的自然语音理解系统的示意图。

其中,附图中符号的简单说明如下:

100:语音识别系统;101:语音输入;102:语音信息;103:语意分析结果;104:界面内容;105:控制指令;110:语音辨识模块;120、620:自然语言理解系统;130:指令产生系统;131:比较模块;132:指令确认模块;133:暂存装置;134:存取模块;135:项目获取模块;140:储存装置;200:应用系统;210:语音接收模块;220:指令执行模块;301:界面编号;302、307:指令格式;303:界面内容;304:选择项目;305:比较结果;306:控制指令;511、521、531:界面名称;512~514、522~524、532~534:选择项目;603:可能意图语法数据;604:关键字;605:响应结果;606:确定意图语法数据;621:自然语言处理器;622:知识辅助理解模块;623:意图数据;624:检索系统;625:结构化数据库;626:搜寻引擎;627:指示数据储存装置;628:检索界面单元;629:分析结果输出模块;S210~S240、S410~S450:步骤。

具体实施方式

为了使本发明的内容可以被更容易明了,以下特举实施例作为本发明确实能够据以实施的范例。另外,凡可能之处,在图式及实施方式中使用相同标号的元件/构件/步骤,代表相同或类似部件。

图1是依照本发明的一实施例的语音识别系统的示意图。参考图1,语音识别系统100适于与应用系统200进行通信,并且语音识别系统100与应用系统200之间可以有线或无线的方式进行通信。在本实施例中,应用系统200包括语音接收模块210以及指令执行模块220。应用系统200通过语音接收模块210接收由使用者所提供的语音输入101,并且传输语音输入101至语音识别系统100。在本实施例中,语音识别系统100可对由应用系统200提供的语音输入101进行语音识别,以产生对应的指令,并且语音输入101将所述指令回传至应用系统200的指令执行模块220,以使指令执行模块220执行应用系统200的相关操作。换言之,本实施例的语音识别系统100可搭配任意的应用系统,并且提供语音识别功能。

在本实施例中,应用系统200可例如是一种运行或搭载在虚拟实境(VirtualReality,VR)设备或扩增实境(Augmented Reality,AR)设备上的游戏程序或应用程序,并且使用者可通过语音的方式来控制游戏程序中的相关操作。虚拟实境设备或扩增实境设备可包括处理电路、存储器及语音感测装置等硬件电路,以通过处理电路执行或存取存储器内的相关模块或程序,而可至少实现本发明的语音接收功能、指令执行功能以及应用程序执行功能。在本实施例中,语音识别系统100可例如是建置在云端服务器或本地主机设备中,以提供语音的相关识别及处理功能。语音识别系统100亦可包括另一处理电路及另一存储器,以通过另一处理电路执行或存取另一存储器内的相关模块或程序,而可至少实现本发明的语音识别功能。

在本实施例中,语音识别系统100包括语音辨识模块110、自然语言理解系统120、指令产生系统130以及储存装置140。语音辨识模块110耦接应用系统200的语音接收模块210以及自然语言理解系统120。指令产生系统130耦接自然语言理解系统120以及储存装置140。图2是依照本发明的一实施例的语音识别方法的流程图。搭配图2的语音识别方法,图1的语音识别系统100可执行如图2的步骤S210~S240,以实现语音识别功能。在步骤S210中,语音识别系统100的语音辨识模块110接收由应用系统200提供的语音输入101。在步骤S220中,语音辨识模块110辨识语音输入101,以产生语音信息102。在本实施例中,语音辨识模块110可将语音输入101的信号转换为计算机可处理及分析的语音信息102(或称数据)。

在步骤S230中,自然语言理解系统120接收由语音辨识模块110输出的语音信息102,并且理解语音信息102,以产生语意分析结果103。在步骤S240中,指令产生系统130接收由自然语言理解系统120输出的语意分析结果103,并且比较语意分析结果103,以输出控制指令105至应用系统200。在本实施例中,储存装置140可提供当前应用系统200所显示的使用者界面的界面内容104至指令产生系统130,以使指令产生系统130可比较语意分析结果103以及当前使用者界面的界面内容104,而产生控制指令105至应用系统200的指令执行模块220。在本实施例中,指令执行模块220可依据控制指令105来使应用系统200显示下一使用者界面或执行特定操作。储存装置140可以是服务器或计算机系统内的任何类型的存储器,例如动态随机存储器(DRAM),静态随机存储器(SRAM)、快闪存储器(Flash memory)、只读存储器(ROM)等,本发明对此并不加以限制,本领域的技术人员可以依据实际需求进行选用。

在本实施例中,自然语言理解系统120可例如将语音信息102转换为文本信息(Text Information),并且将文本信息进行规范化,而产生具有意图对象的语意分析结果103。并且,指令产生系统130可产生对应于意图对象的控制指令105,并提供至应用系统200,以使应用系统200可执行控制指令105而显示下一使用者界面或执行特定操作。因此,本实施例的语音识别方法可使应用系统200无需花费额外的系统资源来执行语音识别,而可有效地节省应用系统200执行识别使用者的语音输入的功能所需的系统资源。

值得注意的是,自然语言理解系统120所输出的语意分析结果103可包括一个或一个以上的可能语意数据,并且语意数据可包括关键字及意图数据。换言之,使用者能够通过口语化方式来表达选择意图,例如选择项目的全名、简称或别名等,即可通过本实施例的语音识别系统100来产生相对应的控制指令,而不需要念出完整的特定名称。对此,关于自然语言理解系统120产生语意分析结果103的方式,以下将以图6实施例来举例说明之。

图3是依照本发明的一实施例指令产生系统的示意图。图4是依照本发明的另一实施例的语音识别方法的流程图。参考图1、图3以及图4,图1的指令产生系统130为一种应用系统界面(Interface),使用者可通过编辑指令产生系统130,来使语音识别系统100可适用于对应的应用系统200。指令产生系统130可包括如图3所示的系统架构。在本实施例中,指令产生系统130包括比较模块131、指令确认模块132、暂存装置133、存取模块134以及项目获取模块135。比较模块131耦接指令确认模块132以及项目获取模块135。暂存装置133耦接指令确认模块132以及存取模块134。存取模块134耦接项目获取模块135以及储存装置140。在本实施例中,暂存装置133可例如是动态随机存储器(DRAM)、静态随机存储器(SRAM)、快闪存储器(Flash memory)、只读存储器(ROM)等,本发明对此并不加以限制,本领域的技术人员可以依据实际需求进行选用。

搭配图4的语音识别方法,图3的指令产生系统130可执行如图4的步骤S410~S450,以实现语音识别以及指令产生功能。在步骤S410中,暂存装置133接收由应用系统200提供的当前使用者界面的界面编号301。在步骤S420中,存取模块134依据界面编号301来产生当前使用者界面的界面内容303。在本实施例中,存取模块134可依据界面编号301来存取预先载入在储存装置140中的界面数据,以取得应用系统200所显示的当前使用者界面的界面内容303。

在步骤S430中,项目获取模块135接收由存取模块134提供的当前使用者界面的界面内容303,并且项目获取模块135从当前使用者界面的界面内容303中获取选择项目304,以输出选择项目304至比较模块131。在步骤S440中,比较模块131利用语意分析结果103来比较当前使用者界面的选择项目304,以产生比较结果305。值得注意的是,选择项目304可包括项目名称以及对应于项目名称的多个参考关键字。也就是说,项目获取模块135可从当前使用者界面的界面内容303提取出选择项目304的项目名称以及对应于项目名称的所述多个参考关键字。并且,比较模块131可比较语意分析结果103是否与项目名称以及所述多个参考关键字的其中之一匹配,以产生比较结果305。换言之,使用者所说出的语音输入经由自然语言理解系统120理解后所产生的语意分析结果103只要与项目名称以及所述多个参考关键字的其中之一匹配,则比较模块131可例如输出对应的项目编号的比较结果305。所述多个参考关键字可例如是项目名称的简称或别名。

在步骤S450中,指令确认模块132依据指令格式307来转换比较结果305,而输出例如具有对应的项目编号的控制指令306。在本实施例中,指令格式307是指应用系统100所能接收的指令形式,并且指令确认模块132是通过暂存装置133来输出控制指令306至应用系统200。因此,当应用系统200显示当前使用者界面时,若应用系统200接收到由语音识别系统100所输出的控制指令306后,应用系统200可依据控制指令306来选择当前使用者界面的界面内容303中的选择项目,以使应用系统200可例如依据上述获得的项目编号来更换显示下一使用者界面或执行特定操作。据此,本实施例的语音识别方法可使指令产生系统130可有效地识别使用者的语音输入,而产生对应的控制指令。

另外,由于语音识别系统100可应用于各种应用系统,因此使用者仅需对语音识别系统100进行相关编辑,而无需更动应用系统。举例而言,语音识别系统100可先操作在编辑模式(或通过语音辨识系统的软件开发套件(SDK,Software Development Kit)进行编辑),以将应用系统200所显示的使用者界面的界面内容104以及指令格式302可预先通过暂存装置133以及存取模块134来写入储存装置140。因此,当语音识别系统100操作在工作模式时,指令产生系统130可通过暂存装置133来接收当前使用者界面的界面编号301,并且存取模块134可依据界面编号301来读取储存装置140以取得对应的当前使用者界面的界面内容303。指令确认模块132可通过存取模块134来取得指令格式307。也就是说,本实施例的语音识别系统100可适于搭配各种应用系统,来提供有效的语音识别及语音选择功能。

图5是依照本发明的一实施例的应用系统的使用者界面示意图。图5为图1的应用系统200所可能显示的使用者界面的范例。参考图1、图3以及图5,应用系统200可例如执行虚拟实境的游戏程序。对此,以游戏程序为例,需先说明的是,游戏开发者可先依据在游戏中可能会显示的每个使用者界面都建立对应的一个或多个数据集,其中每个使用者界面可各自包括一个或多个项目名称。对此,游戏开发者可对于每一个项目名称都建立包括项目标号、项目名称位于界面上的列数及行数,以及对应于项目名称的多个参考关键字的数据集。因此,当语音识别系统100与游戏程序连接时,游戏程序可将建立的多个数据集输入至指令产生系统130的暂存装置133,并储存在暂存装置133中。存取模块134可接着读取暂存装置133,并且将所述多个数据集储存至语音识别系统100的储存装置140中。

接着,假设应用系统200先显示如图5的使用者界面510。使用者界面510的界面内容包括有界面名称511(首页)以及多个选择项目512~514。存取模块134所存取储存装置140的界面内容303可例如包括所述多个选择项目512~514的数据。值得注意的是,项目获取模块135可从使用者界面510的界面内容提取出选择项目512~514的多个项目名称以及对应于项目名称的多个参考关键字,以输出多个项目名称及其对应的所述多个参考关键字至比较模块131进行比较。在此例中,比较模块131可从项目获取模块135取得如以下的数据内容:

{id=0;column=0;line=0;title=“使用说明”;alias=“使用”,“第一”,“倒数第三”,“一”,“用”,“操作”,…}

{id=1;column=0;line=1;title=“角色选择”;alias=“选角”,“第二”,“倒数第二”,“角色”,“人物”,…}

{id=2;column=0;line=2;title=“关卡选择”;alias=“关卡”,“第三”,“倒数第一”,“战斗”,“打仗”,…}

其中“id”为项目标号、“column”为列数、“line”为行数、“title”为项目名称、“alias”为参考关键字。在此例中,当使用者想选取的是选择项目513时,可例如说出对应于选择项目513的全名“角色选择”、简称“选角”或项数“第二”、“倒数第二”,等,皆可使比较模块131可比较选择项目513,并且输出对应的比较结果305至指令确认模块132,以接着产生相对应的控制指令306至应用系统200的指令执行模块220。因此,应用系统200可接着更换以显示下一使用者界面520。

接着,当显示系统200显示的使用者界面520时,使用者界面520的界面内容包括有界面名称521(角色选择)以及多个选择项目522~524。在此例中,比较模块131可从项目获取模块135取得如以下的数据内容:

{id=3;column=0;line=0;title=“赵云”;alias=“赵子龙”,“第一”,“倒数第三”,“一”,“赵”,“子龙”,…}

{id=4;column=0;line=1;title=“关羽”;alias=“关云长”,“第二”,“倒数第二”,“关”,“云长”,…}

{id=5;column=0;line=2;title=“曹操”;alias=“曹孟德”,“第三”,“倒数第一”,“三”,“曹”,“孟德”,…}

在此例中,使用者可例如说出对应于选择项目522的全名“赵云”、简称“赵”、别名“赵子龙”或项数“第一”、“倒数第三”等,皆可使比较模块131可比较到使用者所选的是选择项目522,并且输出对应的比较结果305至指令确认模块132,以接着产生相对应的控制指令306至应用系统200的指令执行模块220。因此,应用系统200可接着更换以显示下一使用者界面530。

接着,当显示系统200显示的使用者界面530时,使用者界面530的界面内容包括有界面名称531(武器选择)以及多个选择项目532~534。在此例中,比较模块131可从项目获取模块135取得如以下的数据内容:

{id=6;column=0;line=0;title=“青虹剑”;alias=“剑”,“青虹”,“第一”,“倒数第三”,“一”,…}

{id=7;column=0;line=1;title=“长枪”;alias=“枪”,“第二”,“倒数第二”,“二”,…}

{id=8;column=0;line=2;title=“大刀”;alias=“刀”,“第三”,“倒数第一”,“三”…}

在此例中,使用者可例如说出对应于选择项目532的全名“青虹剑”、简称“青虹”或项数“第一”等,皆可使比较模块131可比较到使用者所选的是选择项目532,并且输出对应的比较结果305至指令确认模块132,以接着产生相对应的控制指令306至应用系统200的指令执行模块220。因此,应用系统200可接着执行在游戏程序中的接续的相关特定操作。

然而,使用者所提供的语音输入不限于上述的全名、简称、别名或项数的形式。在一实施例中,比较模块131也可以是直接从语意分析结果103中提取关于当前使用者界面的多个选择项目的项数信息(可包括顺序的项数信息或反序的项数信息)、直接从语意分析结果103中提取关于当前使用者界面的多个选择项目的行号或列号,或是直接依据语意分析结果103进行拼音匹配,以查找项目名称的开头、结尾或字符串可符合的选择项目等。并且,比较模块131还可以输出对应于多个匹配成功的多个选择项目的比较结果305,以使应用系统200也可同时或依序执行多个控制指令。

图6是依照本发明的一实施例的自然语音理解系统的示意图。应注意的是,在本发明的一些实施例中,本发明的自然语言理解系统可例如是应用如中国发明专利(公告号为CN103761242B)当中的自然语言理解系统的架构,但本发明并不限于此。在本发明的另一些实施例中,本发明的自然语言理解系统亦可采用其他可产生本发明各实施所述的语意分析结果的系统架构。参考图1以及图6,图6的自然语言理解系统620为图1的自然语言理解系统120的一个实施范例,但本发明的自然语言理解系统不限于此。在本实施例中。自然语言理解系统620包括自然语言处理器621、知识辅助理解模块622、检索系统624以及分析结果输出模块629。知识辅助理解模块622耦接自然语言处理器621以及检索系统624。知识辅助理解模块622包括意图数据623。检索系统624包括结构化数据库625、搜寻引擎626、指示数据储存装置627以及检索界面单元628,其中搜寻引擎626耦接结构化数据库625、指示数据储存装置627以及检索界面单元628。

在本实施例中,搭配参考以下表1,当自然语言理解系统620接收由图1的语音辨识模块110所提供的语音信息102时(例如当使用者于显示图5的使用者界面520时,用口头输入“我要子龙”)的请求信息,自然语言处理器621可分析语音信息102,以产生可能意图语法数据603。自然语言处理器621可将可能意图语法数据603送往知识辅助理解模块622,其中可能意图语法数据603包含关键字604与意图数据623。对此,由于意图语法数据603中的关键字604(例如“子龙”)可能属于不同的领域(例如角色选择()以及电影()两个领域),所以一个语音信息102可分析成多个可能意图语法数据603(例如是“,=子龙”或“,=子龙”),因此需要通过知识辅助理解模块622做进一步分析,来确认用户的意图。在本实施例中,知识辅助理解模块622可取出可能意图语法数据603中的关键字604(例如“子龙”)并送往检索系统624的检索界面单元628可通过搜寻引擎626来搜寻结构化数据库625,以确认是否有“子龙”这个角色名子或影片名称。并且,自然语言处理器621将意图数据623储存在知识辅助理解模块622内部。

表1

换言之,在本实施例中,自然语言理解系统620能先撷取可能意图语法数据603中的关键字604,并通过结构化数据库625的全文检索结果来判别关键字604的领域属性,随后再进一步分析并确认使用者的明确意图。因此使用者能够很轻松地以口语化方式来表达出其意图或信息,而不需要特别熟记特定用语,例如现有作法中关于固定词列表的特定用语。

在本实施例中,检索系统624中的结构化数据库625可例如储存的多个记录。检索系统624中的搜寻引擎626将依据关键字604对结构化数据库625进行全文检索,并且确认用户的意图后,再将全文检索的响应结果605(假设结构化数据库625储存有某项记录,其标题字段内部有“rolenameguid:赵子龙”的记录,并且没有任何记录的标题字段储存“filmnameduid:赵子龙”的信息,因此响应结果605将是“rolenameguid”)回传至知识辅助理解模块622。

在本实施例中,检索界面单元628可通过搜寻引擎626从指示数据储存装置627而取得指示数据,并且检索界面单元628依序输出匹配关键字604的完全匹配记录及部分匹配记录中的指示数据作为响应结果605送往知识辅助理解系统622,其中完全匹配记录的优先顺序大于部分匹配记录的优先顺序。接着,知识辅助理解模块622可依据响应结果605对所储存的意图数据623进行比较,并将所求得的确定意图语法数据606(例如将响应结果605与可能意图语法数据603比较后,确定使用者的意图应是“,=赵子龙”)送往分析结果输出模块629。

然而,在本发明的另一实施例中,搭配参考以下表2,结构化数据库220所储存的每个记录还可例如包括有热度栏位、喜好栏位或厌恶栏位等信息。对此,假设意图语法数据603可能包含两笔数据(例如是“,=子龙”或“,=紫龙”)。并且,当检索系统624的搜寻引擎626进行全文检索后,若判断有两笔记录符合检索结果(假设结构化数据库625储存有两笔记录,其标题栏位中的标题字段内部分别有“rolenameguid:赵子龙”以及“rolenameguid:紫龙”的记录),则检索系统624的搜寻引擎626可进一步判断此两笔记录中的热度栏位、喜好栏位以及厌恶栏位。对此,检索系统624的搜寻引擎626可例如进一步依据热度栏位的数值来决定语意分析结果103(例如对应于“赵子龙”的热度数值(8)较高,且对应于“紫龙”的热度数值(2)较低,则搜寻引擎626以“赵子龙”作为语意分析结果103)。或者,检索系统624的搜寻引擎626可进一步例如依据喜好栏位的数值来决定语意分析结果103(例如对应于“赵子龙”的喜好数值(20)较高,且对应于“紫龙”的喜好数值(5)较低,则搜寻引擎626以“赵子龙”作为语意分析结果103)。又或者,检索系统624的搜寻引擎626可进一步例如依据厌恶栏位的数值来决定语意分析结果103(例如对应于“赵子龙”的厌恶数值(1)较低,且对应于“紫龙”的厌恶数值(20)较高,则搜寻引擎626以“赵子龙”作为语意分析结果103)。并且,在本发明的又一实施例中,检索系统624的搜寻引擎626亦可合并参考上述热度栏位、喜好栏位以及厌恶栏位的至少其中之一,而不限于上述单一判断准则(例如若“赵子龙”及“紫龙”的热度数值相同,则搜寻引擎626进一步比较喜好数值,或者将热度栏位以及喜好栏位的数值相加后进行比较)。

表2

因此,分析结果输出模块629可依据确定意图语法数据606,输出具有具体的意图对象的语意分析结果103。对此,由于自然语言理解系统620可实现对关键字604进行全文检索后的完全匹配以及部分匹配的判断,而输出适当的语意分析结果103(例如依据所接收的确定意图语法数据606“,=赵子龙”而确认使用者想选择赵云,因此输出“赵云”的语意分析结果103并送往指令产生系统105),因此,在本发明的某些实施例中,使用者可提供更为口语或灵活变化的语音输入形式,并且具有本实施例的自然语言理解系统620的语音识别系统可有效且准确地回馈相对应的控制指令至应用系统,而提供有效的语音选择功能。

综上所述,本发明的语音识别系统、指令产生系统及其语音识别方法可通过外设在应用系统外的另一系统来提供语音辨识功能,而回传对应的控制指令至应用系统。并且,本发明的语音识别系统、指令产生系统及其语音识别方法还可对使用者提供的口语化的语音输入来进行有效的语音识别。因此,本发明的语音识别系统、指令产生系统及其语音识别方法可有效地降低在应用系统中对于语音识别所需要的系统资源,并且可实现便捷且灵活的语音选择功能。

以上所述仅为本发明较佳实施例,然其并非用以限定本发明的范围,任何熟悉本项技术的人员,在不脱离本发明的精神和范围内,可在此基础上做进一步的改进和变化,因此本发明的保护范围当以本申请的权利要求书所界定的范围为准。

相关技术
  • 语音识别系统、指令产生系统及其语音识别方法
  • 语音识别方法、语音评分方法、语音识别系统及语音评分系统
技术分类

06120112202555