一种处理文本单元的方法及系统

文献发布时间：2023-06-19 12:02:28

技术领域

本发明涉及语音交互技术领域，具体涉及一种处理文本单元的方法及系统。

背景技术

随着语音识别技术的发展，语音交互的应用场景也越来越广泛。在语音交互过程中，经常会遇到同音字或同音词的错误识别，用户需要以手动操作的方式对错误识别的同音字或同音词进行修改。但是，对于视障人群来说，修改错误识别的同音字或同音词存在较大难处，因此目前亟需一种能辅助视障人群准确输入同音字或同音词的方法。

发明内容

有鉴于此，本发明实施例提供一种处理文本单元的方法及系统，以辅助视障人群准确输入同音字或同音词。

为实现上述目的，本发明实施例提供如下技术方案：

本发明实施例第一方面公开一种处理文本单元的方法，所述方法包括：

利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到待分析文本和意图分类结果，所述意图分类结果为文本输入意图、替换意图、插入意图或删除意图；

基于所述待分析文本中的内容，确定所述待分析文本的格式是否为同音文本单元组词的格式；

若所述待分析文本的格式为同音文本单元组词的格式，提取所述待分析文本中的最后一个文本单元并将其作为待处理文本单元，所述文本单元包括至少一个连续的汉字；

根据所述意图分类结果和所述待处理文本单元，对所述目标文本进行编辑。

优选的，所述利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到待分析文本和意图分类结果，包括：

利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到意图分类结果；

若所述意图分类结果为文本输入意图，将所述语音内容作为待分析文本；

若所述意图分类结果为替换意图、插入意图或删除意图，利用所述语义识别模型提取所述语音内容中的关键信息，将所述关键信息作为待分析文本。

优选的，所述若所述意图分类结果为替换意图、插入意图或删除意图，利用所述语义识别模型提取所述语音内容中的关键信息，将所述关键信息作为待分析文本，包括：

若所述意图分类结果为替换意图，利用所述语义识别模型提取所述语音内容中的替换文本单元和被替换文本单元，将所述语音内容中包含所述替换文本单元的短语作为第一待分析文本，将所述语音内容中包含所述被替换文本单元的短语作为第二待分析文本；

若所述意图分类结果为插入意图，利用所述语义识别模型提取所述语音内容中的定位文本单元和待插入文本单元，将所述语音内容中包含所述定位文本单元和所述待插入文本单元的短语作为第三待分析文本；

若所述意图分类结果为删除意图，利用所述语义识别模型提取所述语音内容中的待删除文本单元，将所述语音内容中包含所述待删除文本单元的短语作为第四待分析文本。

优选的，所述根据所述意图分类结果和所述待处理文本单元，对所述目标文本进行编辑，包括：

若所述意图分类结果为文本输入意图，将所述待处理文本单元输入所述目标文本中；

若所述意图分类结果为替换意图，将所述目标文本中的所述被替换文本单元替换为所述替换文本单元，其中，所述第一待分析文本的所述待处理文本单元为所述替换文本单元，所述第二待分析文本的所述待处理文本单元为所述被替换文本单元；

若所述意图分类结果为插入意图，在所述目标文本中的所述定位文本单元处插入所述待插入文本单元，其中，所述第三待分析文本的所述待处理文本单元为所述待插入文本单元；

若所述意图分类结果为删除意图，将所述目标文本中的所述待删除文本单元删除，其中，所述第四待分析文本的所述待处理文本单元为所述待删除文本单元。

优选的，所述基于所述待分析文本中的内容，确定所述待分析文本的格式是否为同音文本单元组词的格式，包括：

确定所述待分析文本中的倒数第二个字符是否为指定字符；

若所述待分析文本中的倒数第二个字符为指定字符，判断所述待分析文本中的倒数第二个字符之前的文本单元是否为词语，所述文本单元包括至少一个连续的汉字；

若所述倒数第二个字符之前的文本单元为词语，判断所述倒数第二个字符之前的文本单元是否包含所述待分析文本中的最后一个文本单元；

若所述倒数第二个字符之前的文本单元包含所述待分析文本中的最后一个文本单元，确定所述待分析文本的格式为同音文本单元组词的格式。

优选的，还包括：

若所述待分析文本的格式不是同音文本单元组词的格式，根据所述意图分类结果和所述待分析文本，对所述目标文本进行编辑。

本发明实施例第二方面公开一种处理文本单元的系统，所述系统包括：

分类单元，用于利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到待分析文本和意图分类结果，所述意图分类结果为文本输入意图、替换意图、插入意图或删除意图；

确定单元，用于基于所述待分析文本中的内容，确定所述待分析文本的格式是否为同音文本单元组词的格式；

提取单元，用于若所述待分析文本的格式为同音文本单元组词的格式，提取所述待分析文本中的最后一个文本单元并将其作为待处理文本单元，所述文本单元包括至少一个连续的汉字；

处理单元，用于根据所述意图分类结果和所述待处理文本单元，对所述目标文本进行编辑。

优选的，所述分类单元包括：

分类模块，用于利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到意图分类结果；

第一处理模块，用于若所述意图分类结果为文本输入意图，将所述语音内容作为待分析文本；

第二处理模块，用于若所述意图分类结果为替换意图、插入意图或删除意图，利用所述语义识别模型提取所述语音内容中的关键信息，将所述关键信息作为待分析文本。

优选的，所述第二处理模块具体用于：若所述意图分类结果为替换意图，利用所述语义识别模型提取所述语音内容中的替换文本单元和被替换文本单元，将所述语音内容中包含所述替换文本单元的短语作为第一待分析文本，将所述语音内容中包含所述被替换文本单元的短语作为第二待分析文本；

优选的，用于根据所述意图分类结果和所述待处理文本单元对所述目标文本进行编辑的所述处理单元，具体用于：若所述意图分类结果为文本输入意图，将所述待处理文本单元输入所述目标文本中；

基于上述本发明实施例提供的一种处理文本单元的方法及系统，该方法为：利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到待分析文本和意图分类结果；基于待分析文本中的内容，确定待分析文本的格式是否为同音文本单元组词的格式；若待分析文本的格式为同音文本单元组词的格式，提取待分析文本中的最后一个文本单元并将其作为待处理文本单元；根据意图分类结果和待处理文本单元，对目标文本进行编辑。本方案中，利用语义识别模型对用户的语音输入内容进行意图分类得到相应的待分析文本和意图分类结果。若确定待分析文本的格式为同音文本单元组词的格式，则提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，该待处理文本单元即为需要进行处理的同音文本单元。根据意图分类结果和待处理文本单元，对目标文本进行编辑，以实现辅助视障人群准确的输入同音文本单元，提高用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种处理文本单元的方法的流程图；

图2为本发明实施例提供的确定待分析文本的格式的流程图；

图3为本发明实施例提供的一种处理文本单元的系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

由背景技术可知，在进行语音交互时，经常出现错误识别同音字或同音词的情况，对于视障人群来说，修改错误识别的同音字或同音词存在较大难处，因此目前亟需一种能辅助视障人群准确输入同音字或同音词的方法。

故本发明实施例提供一种处理文本单元的方法及系统，利用语义识别模型对用户的语音输入内容进行意图分类得到相应的待分析文本和意图分类结果。若确定待分析文本的格式为同音文本单元组词的格式，则提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，该待处理文本单元即为需要进行处理的同音文本单元。根据意图分类结果和待处理文本单元，对目标文本进行编辑，以实现辅助视障人群准确的输入同音文本单元，进而提高用户体验。

可以理解的是，视障人群在进行语音交互时，当设置以字符为单位进行朗读操作时，会对字符进行组词后朗读出来，使视障人群获悉该字符具体是哪个字符，例如：当朗读“阴”字时，以“阴，阴天”方式朗读出来，使视障人群获悉“阴”字为“阴天”的“阴”。

需要说明的是，本发明实施例中所提供的处理文本单元的方法，具体应用于对同音字或同音词的处理，同理，也可将该处理文本单元的方法应用于对谐音字或谐音词的处理，该处理文本单元的方法的详细内容参见以下实施例的说明。

参见图1，示出了本发明实施例提供的一种处理文本单元的方法的流程图，该方法包括：

步骤S101：利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到待分析文本和意图分类结果。

需要说明的是，意图分类结果为文本输入意图、替换意图、插入意图或删除意图。

在具体实现步骤S101，用户在通过语音对目标文本进行编辑时，获取用户的语音内容。利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到意图分类结果。

也就是说，该语义识别模型可用于对语音内容进行意图识别，并对识别结果进行分类，得到该语音内容对应的意图分类结果。

可以理解的是，用户的语音内容对应的意图分类结果为文本输入意图、替换意图、插入意图(可划分为前向插入和后向插入)或删除意图。其中，文本输入意图是指：将语音内容输入目标文本中；替换意图是指：将语音内容中的某个文本单元(即字或词)替换目标文本中的某个文本单元；插入意图是指：将语音内容中的某个文本单元插入目标文本中的某个位置；删除意图是指：利用语音内容删除目标文本中的某些文本单元。

可以理解的是，用户通过语音内容编辑目标文本时，其目的通常分为两种，一种目的是将语音内容输入到目标文本中；另一种目的是利用语音内容修改目标文本(此时的语音内容可视为修改指令)，例如：语音内容为“把晴天修改为阴天”，此时将目标文本中的“晴天”替换为“阴天”。

在获取用户用于编辑目标文本的语音内容的意图分类结果后，若该意图分类结果为文本输入意图，将语音内容作为待分析文本。

若该意图分类结果为替换意图、插入意图或删除意图，利用语义识别模型提取语音内容中的关键信息，将所提取的关键信息作为待分析文本。

可以理解的是，在利用语义识别模型提取语音内容中的关键信息的过程中，先利用序列标注算法对该语音内容中的各部分信息进行标注(标注相应的标签)，再利用语音内容的各部分信息的标签结合意图分类结果，提取语音内容中的关键信息。

例如：当语音内容的意图分类结果为删除意图时，所提取的关键信息为删除的对象(该对象的标签为删除标签)；当语音内容的意图分类结果为替换意图，所提取的关键信息为被替换对象(标签为被替换标签)和替换对象(标签为替换标签)，即利用替换对象替换目标文本中的被替换对象；当语音内容的意图分类结果为插入意图，所提取的关键信息为用作参照的定位词语(标签为定位标签)和需要插入的目标词语(标签为插入标签)。

结合上述示例，在一些具体实施例中，前述所提及的“将所提取的关键信息作为待分析文本”主要包括三种情况。

第一种情况：若用户用于编辑目标文本的语音内容的意图分类结果为替换意图，利用语义识别模型提取该语音内容中的替换文本单元和被替换文本单元，将语音内容中包含替换文本单元的短语作为第一待分析文本，将语音内容中包含被替换文本单元的短语作为第二待分析文本。

例如：假设语音内容为“把阴天的阴改为音乐的音”，所提取的替换文本单元为“音”，被替换文本单元为“阴”，此时将“音乐的音”这一短语作为第一待分析文本，将“阴天的阴”这一短语作为第二待分析文本。

需要说明的是，文本单元包括至少一个连续的汉字，也就是说，文本单元具体可以用于表示字或词。

第二种情况：若用户用于编辑目标文本的语音内容的意图分类结果为插入意图，利用语义识别模型提取语音内容中的定位文本单元和待插入文本单元，将该语音内容中包含定位文本单元和待插入文本单元的短语作为第三待分析文本。

第三种情况：若用户用于编辑目标文本的语音内容的意图分类结果为删除意图，利用语义识别模型提取语音内容中的待删除文本单元，将该语音内容中包含待删除文本单元的短语作为第四待分析文本。

步骤S102：基于待分析文本中的内容，确定待分析文本的格式是否为同音文本单元组词的格式。若待分析文本的格式为同音文本单元组词的格式，执行步骤S103，若待分析文本的格式不是同音文本单元组词的格式，执行步骤S105。

需要说明的是，同音文本单元组词的格式具体构成内容为：“同音文本单元组词”+“的”+“同音文本单元”。

通过同音文本单元组词的格式，可判断某一短语是否为同音文本单元组词的格式，例如：“阴天的阴”这一短语即为同音文本单元组词的格式。

在具体实现步骤S102的过程中，将待分析文本中的倒数第二个字符与指定字符(该指定字符可以为“的”字)进行比对。若该待分析文本中的倒数第二个字符为该指定字符，则通过待分析文本中的倒数第二个字符之前的文本单元和待分析文本中的最后一个文本单元，判断待分析文本的格式是否为同音文本单元组词的格式。

如果确定待分析文本的格式为同音文本单元组词的格式，则执行步骤S103，如果确定待分析文本的格式不是同音文本单元组词的格式，则执行步骤S105。

需要说明的是，根据上述步骤S101中的内容可知，在确定待分析文本时，用户用于编辑目标文本的语音内容的意图分类结果的不同，所确定的待分析文本也有所不同，故在判断待分析文本的格式时也有所不同。

若该意图分类结果为文本输入意图，则判断待分析文本(也就是语音内容)的格式是否为同音文本单元组词的格式。

若该意图分类结果为替换意图，则判断第一待分析文本和第二待分析文本的格式是否为同音文本单元组词的格式。

若该意图分类结果为插入意图，则判断第三待分析文本的格式是否为同音文本单元组词的格式。

若该意图分类结果为删除意图，则判断第四待分析文本的格式是否为同音文本单元组词的格式。

步骤S103：提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，执行步骤S104。

需要说明的是，文本单元包括至少一个连续的汉字。

在具体实现步骤S103的过程中，若确定待分析文本的格式为同音文本单元组词的格式，则提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，该待处理文本单元即为用于编辑目标文本的同音文本单元，执行步骤S104。

可以理解的是，根据上述步骤S101中的内容可知，在确定待分析文本时，用户用于编辑目标文本的语音内容的意图分类结果的不同，所确定的待分析文本也有所不同，详细内容如下：

若该意图分类结果为文本输入意图，将语音内容作为待分析文本，此时提取该待分析文本中的最后一个文本单元并将其作为待处理文本单元。

可以理解的是，在确定待分析文本的格式为同音文本单元组词的格式的情况下，待分析文本的最后一个文本单元即为待输入文本单元(需要输入目标文本的文本单元)。例如：对于“智能手机的手机”这一语音内容(即待分析文本)，该待分析文本中的最后一个文本单元即为待输入文本单元“手机”这一词。

若该意图分类结果为替换意图，则将语音内容中包含替换文本单元的短语作为第一待分析文本，将语音内容中包含被替换文本单元的短语作为第二待分析文本，此时提取第一待分析文本中的最后一个文本单元并将其作为待处理文本单元，及提取第二待分析文本中的最后一个文本单元并将其作为待处理文本单元。

可以理解的是，在确定待分析文本的格式为同音文本单元组词的格式的情况下，第一待分析文本中的最后一个文本单元即为该替换文本单元，第二待分析文本中的最后一个文本单元即为该被替换文本单元。例如：对于“把阴天的阴改为音乐的音”这一语音内容，第一待分析文本为“音乐的音”，第二待分析文本为“阴天的音”，第一待分析文本中的最后一个文本单元即为替换文本单元“音”这一字，第二待分析文本中的最后一个文本单元即为被替换文本单元“阴”这一字。

若该意图分类结果为插入意图，则将语音内容中包含定位文本单元和待插入文本单元的短语作为第三待分析文本，此时提取第三待分析文本中的最后一个文本单元并将其作为待处理文本单元。

可以理解的是，在确定待分析文本的格式为同音文本单元组词的格式的情况下，第三待分析文本中的最后一个文本单元即为该待插入文本单元，例如：对于“在我们后面插入明天的明”这一第三待分析文本，该第三待分析文本中的最后一个文本单元即为待插入文本单元“明”这一字。

若该意图分类结果为删除意图，则语音内容中包含待删除文本单元的短语作为第四待分析文本，此时提取第四待分析文本中的最后一个文本单元并将其作为待处理文本单元。

可以理解的是，在确定待分析文本的格式为同音文本单元组词的格式的情况下，第四待分析文本中的最后一个文本单元即为待删除文本单元，例如：对于“删除苹果的苹”这一第四待分析文本，该第四待分析文本中的最后一个文本单元即为待删除文本单元“苹”这一字。

步骤S104：根据意图分类结果和待处理文本单元，对目标文本进行编辑。

在具体实现步骤S104的过程中，若确定待分析文本的格式为同音文本单元组词的格式且提取到待处理文本单元后，按照用户用于编辑目标文本的语音内容的意图分类结果，结合所提取的待处理文本单元，对目标文本进行编辑。按照意图分类结果的不同，对目标文本进行编辑的具体方式主要分为以下四种编辑方式，详见以下说明。

第一种编辑方式：若该意图分类结果为文本输入意图，由上述内容可知，将语音内容作为待分析文本，将该待分析文本的待处理文本单元输入目标文本中。也就是说，如果语音内容的意图分类结果为文本输入意图，将所确定的待分析文本中的最后一个文本单元(即待处理文本单元)输入目标文本中。

需要说明的是，上述步骤也可以认为是：将待处理文本单元替换待分析文本，并将待处理文本单元输入目标文本中。

例如：若该意图分类结果为文本输入意图，语音内容(此时也就是待分析文本)为“音乐的音”，此时待处理文本单元为“音”这一字，则将“音”输入目标文本中。

第二种编辑方式：若该意图分类结果为替换意图，由上述内容可知，可确定得到第一待分析文本和第二待分析文本，第一待分析文本的待处理文本单元(也就是最后一个文本单元)为替换文本单元，第二待分析文本的待处理文本单元为被替换文本单元(也就是最后一个文本单元)，将目标文本中的被替换文本单元替换为替换文本单元。

例如：若该意图分类结果为替换意图，语音内容为“把阴天的阴修改为音乐的音”，所确定的第一待分析文本为“音乐的音”，第二待分析文本为“阴天的阴”，第一待分析文本的待处理文本单元为“音”字(替换文本单元)，第二待分析文本的待处理文本单元为“阴”字(被替换文本单元)，则将目标文本中的“阴”字修改为“音”字。

第三种编辑方式：若该意图分类结果为插入意图，由上述内容可知，可确定得到第三待分析文本，第三待分析文本的待处理文本单元为待插入文本单元(也就是最后一个文本单元)，在目标文本中的定位文本单元处插入该待插入文本单元。

例如：若意图分类结果为插入意图，第三待分析文本为“在我们后插入教师的教”，此时第三待分析文本的待处理文本单元为“教”字(待插入文本单元)，定位文本单元为“我们”一词，在将目标文本中的“我们”后面插入“教”字。

第四种编辑方式：若该意图分类结果为删除意图，由上述内容可知，可确定得到第四待分析文本，第四待分析文本的待处理文本单元为待删除文本单元(也就是最后一个文本单元)，将目标文本中的该待删除文本单元删除。

例如：若意图分类结果为删除意图，第四待分析文本为“删除阴天的阴”，此时第四待分析文本的待处理文本单元为“阴”(待删除文本单元)，在目标文本中将“阴”字删除。

需要说明的是，上述四种编辑方式中的示例内容，是以文本单元为字作为例子进行举例说明的是，同理，文本单元也可以是词，当文本单元为词时，对目标文本进行编辑的方式可参见上述内容，在此不再赘述。

步骤S105：根据意图分类结果和待分析文本，对目标文本进行编辑。

在具体实现步骤S105的过程中，若确定待分析文本的格式不是同音文本单元组词的格式，则用户用于编辑目标文本的语音内容的意图分类结果，结合待分析文本，对目标文本进行编辑。

若该意图分类结果为文本输入意图，将待分析文本(此时也就是语音内容)输入目标文本中。

若该意图分类结果为替换意图，由上述内容可知，可确定得到第一待分析文本和第二待分析文本，以及确定第一待分析文本中的替换文本单元和第二待分析文本中的被替换文本单元，将目标文本中的被替换文本单元替换为替换文本单元。

若该意图分类结果为插入意图，由上述内容可知，可确定得到第三待分析文本，以及确定第三待分析文本中的定位文本单元和待插入文本单元，在目标文本中的定位文本单元处插入该待插入文本单元。

若该意图分类结果为删除意图，由上述内容可知，可确定得到第四待分析文本，以及确定第四待分析文本中的待删除文本单元，将目标文本中的该待删除文本单元删除。

在本发明实施例中，利用语义识别模型对用户的语音输入内容进行意图分类得到相应的待分析文本和意图分类结果。若确定待分析文本的格式为同音文本单元组词的格式，则提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，该待处理文本单元即为需要进行处理的同音文本单元。根据意图分类结果和待处理文本单元，对目标文本进行编辑，辅助视障人群准确的输入同音文本单元，进而提高用户体验。

上述本发明实施例图1步骤S102中涉及的确定待分析文本的格式的过程，参见图2，示出了本发明实施例提供的确定待分析文本的格式的流程图，包括：

步骤S201：确定待分析文本中的倒数第二个字符是否为指定字符。若待分析文本中的倒数第二个字符为指定字符，执行步骤S202，若待分析文本中的倒数第二个字符不是指定字符，执行步骤S205。

在具体实现步骤S201的过程中，确定待分析文本中的倒数第二个字符是否为指定字符，如果确定该倒数第二个字符为该指定字符，则执行步骤S202继续进行后续判断，如果确定该倒数第二个字符不是该指定字符，则执行步骤S205确定待分析文本的格式不是同音文本单元组词的格式。

例如：确定待分析文本中的倒数第二个字符是否为“的”字，“的”字即为指定字符，如果确定该倒数第二个字符为“的”字，执行步骤S202，如果确定该倒数第二个字符不是“的”字，执行步骤S205。

步骤S202：判断待分析文本中的倒数第二个字符之前的文本单元是否为词语。若待分析文本中的倒数第二个字符之前的文本单元为词语，执行步骤S203，若待分析文本中的倒数第二个字符之前的文本单元不是词语，执行步骤S205。

在具体执行步骤S202的过程中，在确定待分析文本中的倒数第二个字符为指定字符之后，利用预先构建的汉语词库，判断待分析文本中的倒数第二个字符之前的文本单元是否为词语。如果待分析文本中的倒数第二个字符之前的文本单元为词语，则执行步骤S203继续进行后续判断，如果待分析文本中的倒数第二个字符之前的文本单元不是词语，则执行步骤S205确定待分析文本的格式不是同音文本单元组词的格式。

步骤S203：判断待分析文本中的倒数第二个字符之前的文本单元是否包含待分析文本中的最后一个文本单元。若该倒数第二个字符之前的文本单元包含待分析文本中的最后一个文本单元，执行步骤S204，若该倒数第二个字符之前的文本单元不包含待分析文本中的最后一个文本单元，执行步骤S205。

在具体实现步骤S203的过程在，在确定待分析文本中的倒数第二个字符之前的文本单元为词语之后，判断待分析文本中的倒数第二个字符之前的文本单元是否包含待分析文本中的最后一个文本单元，例如：判断待分析文本中的倒数第二个字符之前的词语是否包含待分析文本中的最后一个字。

如果该倒数第二个字符之前的文本单元包含待分析文本中的最后一个文本单元，则执行步骤S204确定待分析文本的格式为同音文本单元组词的格式，如果该倒数第二个字符之前的文本单元不包含待分析文本中的最后一个文本单元，则执行步骤S205确定待分析文本的格式不是同音文本单元组词的格式。

步骤S204：确定待分析文本的格式为同音文本单元组词的格式。

步骤S205：确定待分析文本的格式不是同音文本单元组词的格式。

在本发明实施例中，将待分析文本中的倒数第二个字符与指定字符(进行比对，并结合待分析文本中的倒数第二个字符之前的文本单元和待分析文本中的最后一个文本单元，判断待分析文本的格式是否为同音文本单元组词的格式。若确定待分析文本的格式为同音文本单元组词的格式，则根据意图分类结果和待处理文本单元，对目标文本进行编辑，辅助视障人群准确的输入同音文本单元，进而提高用户体验。

与上述本发明实施例提供的一种处理文本单元的方法相对应，参见图3，本发明实施例还提供了一种处理文本单元的系统的结构框图，该系统包括：分类单元301、确定单元302、提取单元303和处理单元304；

分类单元301，用于利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到待分析文本和意图分类结果，意图分类结果为文本输入意图、替换意图、插入意图或删除意图。

确定单元302，用于基于待分析文本中的内容，确定待分析文本的格式是否为同音文本单元组词的格式。

提取单元303，用于若待分析文本的格式为同音文本单元组词的格式，提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，文本单元包括至少一个连续的汉字。

处理单元304，用于根据意图分类结果和待处理文本单元，对目标文本进行编辑。

优选的，处理单元304还用于：若待分析文本的格式不是同音文本单元组词的格式，根据意图分类结果和所述待分析文本，对目标文本进行编辑。

优选的，结合图3示出的内容，分类单元301包括：分类模块、第一处理模块和第二处理模块，各个模块的执行原理如下：

分类模块，用于利用预先训练得到的语义识别模型，对用户用于编辑目标文本的语音内容进行意图分类，得到意图分类结果。

第一处理模块，用于若意图分类结果为文本输入意图，将语音内容作为待分析文本。

第二处理模块，用于若意图分类结果为替换意图、插入意图或删除意图，利用语义识别模型提取语音内容中的关键信息，将关键信息作为待分析文本。

在具体实现中，第二处理模块具体用于：若意图分类结果为替换意图，利用语义识别模型提取语音内容中的替换文本单元和被替换文本单元，将语音内容中包含替换文本单元的短语作为第一待分析文本，将语音内容中包含被替换文本单元的短语作为第二待分析文本；若意图分类结果为插入意图，利用语义识别模型提取语音内容中的定位文本单元和待插入文本单元，将语音内容中包含定位文本单元和待插入文本单元的短语作为第三待分析文本；若意图分类结果为删除意图，利用语义识别模型提取语音内容中的待删除文本单元，将语音内容中包含待删除文本单元的短语作为第四待分析文本。

相应的，用于根据意图分类结果和待处理文本单元对目标文本进行编辑的处理单元304，具体用于：若意图分类结果为文本输入意图，将待处理文本单元输入目标文本中；若意图分类结果为替换意图，将目标文本中的被替换文本单元替换为替换文本单元，其中，第一待分析文本的待处理文本单元为替换文本单元，第二待分析文本的待处理文本单元为被替换文本单元；若意图分类结果为插入意图，在目标文本中的定位文本单元处插入待插入文本单元，其中，第三待分析文本的待处理文本单元为待插入文本单元；若意图分类结果为删除意图，将目标文本中的待删除文本单元删除，其中，第四待分析文本的待处理文本单元为待删除文本单元。

优选的，结合图3示出的内容，确定单元302包括：第一确定模块、第一判断模块、第二判断模块和第二确定模块，各个模块的执行原理如下：

第一确定模块，用于确定待分析文本中的倒数第二个字符是否为指定字符。

第一判断模块，用于若待分析文本中的倒数第二个字符为指定字符，判断待分析文本中的倒数第二个字符之前的文本单元是否为词语，文本单元包括至少一个连续的汉字。

第二判断模块，用于若倒数第二个字符之前的文本单元为词语，判断倒数第二个字符之前的文本单元是否包含待分析文本中的最后一个文本单元。

第二确定模块，用于若倒数第二个字符之前的文本单元包含待分析文本中的最后一个文本单元，确定待分析文本的格式为同音文本单元组词的格式。

综上所述，本发明实施例提供一种处理文本单元的方法及系统，利用语义识别模型对用户的语音输入内容进行意图分类得到相应的待分析文本和意图分类结果。若确定待分析文本的格式为同音文本单元组词的格式，则提取待分析文本中的最后一个文本单元并将其作为待处理文本单元，该待处理文本单元即为需要进行处理的同音文本单元。根据意图分类结果和待处理文本单元，对目标文本进行编辑，辅助视障人群准确的输入同音文本单元，进而提高用户体验。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：史元春;喻纯;杨欢;
专利申请人：清华大学;交互未来(北京)科技有限公司;

上一篇：一种基于运输船体的水域生态污染治理装置
下一篇：一种具有收集结构的钢化玻璃切割装置