导航：首页> 电通信技术>客户端语音输入表单的方法

客户端语音输入表单的方法

文献发布时间：2023-06-19 12:22:51

技术领域

本申请涉及语音输入方法，具体而言，涉及一种客户端语音输入表单的方法。

背景技术

当前移动客户端已全面普及，然而客户端的使用通常借助于手动的点击交互，对不便与使用手动操作的用户来说极不友好。

例如：无法正常使用双手的残障人士；不擅长使用智能手机的老年人等；尤其是遇到一些长表单的录入时，用户的完成信息录入的难度和成本很高。

另外，目前市面上已经有较为成熟的ASR（自动语音识别技术）工具，例如：科大讯飞和腾讯提供的语音转文字功能，其语音识别文字的技术和数据库已经较为成熟，并且具有较高识别率。并且部分ASR服务已支持多种方言的识别，例如：粤语等。

发明内容

为了解决现有技术的不足之处，本申请提供了一种客户端语音输入表单的方法，包括如下步骤：采集用户的语音数据；将所述语音数据识别为文字内容数据；将所述文字内容数据分类为文本框内容或选择项内容匹配至表单。

进一步地，所述客户端语音输入表单的方法还包括如下步骤：提供表单界面以及语音录入操作界面。

进一步地，所述客户端语音输入表单的方法还包括如下步骤：读取表单界面要求输入的字段类型。

进一步地，所述客户端语音输入表单的方法还包括如下步骤：判断读取表单界面要求输入的字段类型为文本框内容还是选择项内容，如果读取表单界面要求输入的字段类型为文本框内容则转入文本框匹配判断步骤，如果读取表单界面要求输入的字段类型为选择项内容则转入选择项内容匹配判断步骤。

进一步地，所述文本框匹配判断步骤包括如下步骤：判断所述文字内容数据是否符合预设格式和字段长度要求；如果满足预设格式和字段长度要求，则系统语音提示后台校验文字内容数据。

进一步地，所述客户端语音输入表单的方法还包括如下步骤：所述选择项内容匹配判断步骤包括如下步骤：将文字内容数据与预存的字典值进行模糊匹配获得匹配字典值。

进一步地，所述选择项内容匹配判断步骤还包括如下步骤：向用户提示所述匹配字典值。

进一步地，所述选择项内容匹配判断步骤还包括如下步骤：采集用户对所述匹配字典值的反馈数据。

进一步地，所述选择项内容匹配判断步骤还包括如下步骤：根据所述反馈数据判断所述匹配字典值是否准确；如果所述匹配字典值准确则匹配字典值录入至所述表单界面。

进一步地，所述反馈数据为语音数据。

本申请的有益之处在于：提供了一种免除了手工录入同时提高录入效率的客户端语音输入表单的方法。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请一种实施例的客户端语音输入表单的方法的总体流程图；

图2是根据本申请一种实施例的用户语音录入流程图；

图3是根据本申请一种实施例的识别录入项并语音识别流程图；

图4是根据本申请一种实施例的登录界面示意图；

图5是根据本申请一种实施例的选择语言界面示意图；

图6是根据本申请一种实施例的语言录入结果确认界面示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

参照图1至图6所示，本申请的客户端语音输入表单的方法，包括如下步骤：采集用户的语音数据；将所述语音数据识别为文字内容数据；将所述文字内容数据分类为文本框内容或选择项内容匹配至表单。

具体而言，所述客户端语音输入表单的方法还包括如下步骤：提供表单界面以及语音录入操作界面。

具体而言，所述客户端语音输入表单的方法还包括如下步骤：读取表单界面要求输入的字段类型。

具体而言，所述客户端语音输入表单的方法还包括如下步骤：判断读取表单界面要求输入的字段类型为文本框内容还是选择项内容，如果读取表单界面要求输入的字段类型为文本框内容则转入文本框匹配判断步骤，如果读取表单界面要求输入的字段类型为选择项内容则转入选择项内容匹配判断步骤。

具体而言，所述文本框匹配判断步骤包括如下步骤：判断所述文字内容数据是否符合预设格式和字段长度要求；如果满足预设格式和字段长度要求，则系统语音提示后台校验文字内容数据。

具体而言，所述客户端语音输入表单的方法还包括如下步骤：所述选择项内容匹配判断步骤包括如下步骤：将文字内容数据与预存的字典值进行模糊匹配获得匹配字典值。

具体而言，所述选择项内容匹配判断步骤还包括如下步骤：向用户提示所述匹配字典值。

具体而言，所述选择项内容匹配判断步骤还包括如下步骤：采集用户对所述匹配字典值的反馈数据。

具体而言，所述选择项内容匹配判断步骤还包括如下步骤：根据所述反馈数据判断所述匹配字典值是否准确；如果所述匹配字典值准确则匹配字典值录入至所述表单界面。

具体而言，所述反馈数据为语音数据。

概括而言，如图1所示，本申请的方法主要包括：

1.1：用户打开目标页面

1.2：选择语音录入方式

1.3：用户语音方式录入文字

1.4：系统将文字内容转化为文本内容或者选择项

作为具体方案，如图2至图3所示，具体流程包括：

2.1：识别录入项并语音识别；

2.1.1：系统读取要求录入的字段内容。包含要求录入的文本框，选择项（单选/多选）；

2.1.2：系统语音询问用户要求录入的字段内容；

2.1.3：用户语音表达要输入的内容；

2.1.4：系统判断是否识别到语音内容；是，则进行下一步；

2.1.5：系统语音转文字；使用现成的ASR技术服务。

将2.1.1～2.1.5定义为流程c，2.1.4～2.1.5定义为流程d

2.1.6:系统判断要录入的字段类型：文本框或选择项（单选/多选）

若是选择项：则系统文字模糊匹配字段值，确认目标值后，系统语音确认是否为该匹配字典值。

判断：用户语音回复判断是否匹配正确；

匹配有误，则系统语音提示用户重新语音输入；并继续路程c；

匹配无误，则系统选择该字段，并进入下一流程2.1.8。

若是文本框：则系统录入识别的文字内容；并判定录入的内容的格式、长度是否符合客户端的要求，文字内为字符串格式，整数类型数字为INT型数字，小数类型数字为FLOAT型数字，且要求录入文字与数字的总长度小于N，其中N表示预先设置的录入长度阈值。

若符合：则进入下一流程2.1.7；若不符合：则系统语音提示前端校验的内容文案；并继续流程d。

2.1.7：确认是否还有表单字段内容需要录入若是：则进入流程c；若否：则结束全部流程。

步骤1.2提供了各个地方的方言俚语，扩宽了服务的客群范围，尽可能让所有用户均能使用语音录入；步骤1.3使用语音录入代替传统的手工录入，为不便与使用手动输入的用户也带来了良好的操作体验，例如：无法正常使用双手的残障人士、不擅长使用智能手机的老年人等；步骤1.4与2.1.1在语音录入与识别过程中将其分为文本框与选择项，细化了用户语言表述的类型，进而提升了之后录入与反馈的准确性。步骤1.1至1.4与步骤2.1为一整套完整的客户端语音输入表单的方式，可以在免除了手工录入的同时提高了录入效率。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：周波;叶敏;郭能;蔡浴泓;余勇辉;
专利申请人：浙江惠瀜网络科技有限公司;