一种语言智慧互通的数字机器人及其运行方法

文献发布时间：2024-04-18 19:58:30

技术领域

本发明属于景区导览语言交互技术领域，具体是一种语言智慧互通的数字机器人及其运行方法。

背景技术

专利公开号为CN114141179A的发明公开了基于智能语音交互的公园导览与景区介绍系统，包括语音输入模块，屏端设备模块，语音识别模块和内容服务调取模块。该基于智能语音交互的公园导览与景区介绍系统，基于智能语音交互的公园导览与景区介绍系统，能够融合语音交互模式和触控交互模式，为游客提供更有效率的信息交互方式，帮助游客直接确定想要的信息，提升信息获取效率与成效；同时为园区导览扩展更多业务场景，从导览实现向导航、导游、导购的转变。

基于上述的发明，在景区使用服务型数字机器人进行智慧语音互通时，由于景区所处的位置的周边环境较为嘈杂，会导致数字机器人在对语音进行识别时，其识别的效率和识别的准确率都不高，从而降低景区中的服务型机器人的工作质量。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一；为此，本发明提出了一种语言智慧互通的数字机器人及其运行方法，用于解决上述所提出的技术问题。

为实现上述目的，根据本发明的第一方面的实施例提出一种语言智慧互通的数字机器人，包括：

信号控制模块，用于对数字机器人的运行状态进行控制，运行状态包括启动状态和休眠状态，当数字机器人为启动状态时，同时将启动信号传输至语言采集模块；

语言采集模块，用于接收启动信号，之后对样本环境音进行采集，并传输至音色提取模块，样本环境音指数字机器人周围的声音；

音色提取模块，用于对样本环境音进行分析，通过识别关键词以及对应的音色，将所获取的音色标记为指定音色，并将指定音色所对应的语音标记为目标语音，之后音色提取模块将目标语音传输至语音处理模块；

语音处理模块，用于对目标语音进行处理，通过获取到目标语音中响度与时间的关系，得到响度变化状态，当响度变化状态为平稳状态时，将其对应的目标语音标记为识别语音，并传输至语义分析模块；

语义分析模块，用于对识别语音中的内容进行分析，通过对识别语音中的关键词进行提取，并将所提取的关键词进行重组，得到重组信息，将重组信息进行处理，得到分析结果，之后语义分析模块将分析结果传输至结果输出模块；

结果输出模块，用于将分析结果进行显示。

作为本发明的进一步方案，目标语音获取的具体过程为：

S1：先对样本环境音中的关键词进行获取，即根据数据存储模块中所存储的关键词信息，对样本环境音中的关键词进行捕捉；

S2：当捕捉到关键词时，先识别关键词所对应的音色，并将其标记为指定音色，之后重新对样本环境音进行识别，获取到指定音色的所有语音，并将其标记为目标语音。

作为本发明的进一步方案，响度变化状态指上升状态、下降状态、平稳状态和峰值状态。

作为本发明的进一步方案，对响度变化状态判断的方法为：

根据目标语音中响度的变化，以时间为横坐标，响度为纵坐标，得到响度与时间之间的线性关系，若线性关系为一次函数x＝at+b时，当a＞0时，为上升状态，当a＝0时，为平稳状态，当a＜0时，为下降状态，若线性关系为多次函数时，此时为峰值状态，其中t表示时间，x表示响度，a、b分别为对应的系数。

作为本发明的进一步方案，分析结果的获取方法为：

ST1：先将识别语音中的内容转换成文字形式，同时提取转换后文字中所有关键词的信息；

ST2：将所提取的关键词重新进行组合得到重组信息，之后将重组信息在数据存储模块中进行匹配，得到匹配结果；

ST3：同时根据数字机器人所在的位置，将数字机器人所在位置的周边信息与匹配结果进行结合，得到分析结果。

作为本发明的进一步方案，还包括数据存储模块，用于对相关信息进行存储，其中相关信息包括景区信息和关键词信息，景区信息指景区内路线分布等信息，关键词信息指与景区信息有关的词汇。

作为本发明的进一步方案，当音色提取模块获取到指定音色时，将指定音色传输至语音采集模块，之后语音采集模块对指定音色的停顿时间进行检测，当检测到指定音色的停顿时间超过阈值T1时，语音采集模块将生成休眠信号，并将其传输至信号控制模块，当信号控制模块接收到休眠信号时，信号控制模块将数字机器人切换至休眠状态。

一种语言智慧互通的数字机器人的运行方法，该方法具体包括以下步骤：

步骤一：先获取到启动信号，将数字机器人的状态切换至启动状态，同时对样本环境音进行采集；

步骤二：对样本环境音中的关键词进行捕捉，根据关键词的指定音色获取到目标语音；

步骤三：对目标语音中响度变化状态进行判断，同时获取到平稳状态的目标语音，并将其标记为识别语音；

步骤四：对识别语音中的具体内容进行分析，得到重组信息，并将重组信息在数据存储模块中进行检索，得到匹配结果；

步骤五：将匹配结果与数字机器人所在的位置的周边信息进行结合，得到分析结果，之后将分析结果传输至目标游客。

与现有技术相比，本发明的有益效果是：通过对样本环境音中的指定音色进行识别，获取到目标语音，对目标语音中响度变化状态进行判断，得到识别语音，使数字机器人在对语音采集后，对周边的无关声音进行删除，从而提高了语音识别的准确率，同时降低了数字机器人对无关信息的处理量，提高工作效率；

之后对识别语音中的具体内容进行分析，得到重组信息，并将重组信息在数据存储模块中进行检索，得到匹配结果，将匹配结果与数字机器人所在的位置的周边信息进行结合，得到分析结果，之后将分析结果传输至目标游客，使目标游客对分析结果进行查看，从而提高数字机器人对目标游客的服务质量。

附图说明

图1为本发明系统框架原理图；

图2为本发明流程框架原理图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1和图2，本申请提供了一种语言智慧互通的数字机器人，包括信号控制模块、语言采集模块、音色提取模块、语音处理模块、语义分析模块、结果输出模块和数据存储模块；

实施例一：

信号控制模块用于根据集成信号对数字机器人的运行状态进行控制，其中运行状态包括启动状态和休眠状态，当信号控制模块接收到启动信号时，信号控制模块将数字机器人切换至启动状态，同时将其启动信号传输至语言采集模块，在本实施例中，其中启动信号由人为进行控制；

数据存储模块用于对相关信息进行存储，其中相关信息包括景区信息和关键词信息，景区信息指景区内路线分布等信息，关键词信息指与景区信息有关的词汇，例如路线推荐、景点分布等，其具体的关键词由相关的管理人员进行设置，之后数据存储模块分别与音色提取模块和语义分析模块之间双向电性连接；

语言采集模块用于接收启动信号，当接收到启动信号时，语言采集模块对周围环境声音进行采集，同时将所采集的声音标记为样本环境音，并将其传输至音色提取模块；

音色提取模块用于对样本环境音进行分析，提取到目标游客的音色，其中目标游客指与数字机器人进行语音交互的游客，对样本环境音进行分析的具体过程为：

S1：先对样本环境音中的关键词进行获取，即根据数据存储模块中所存储的关键词信息，对样本环境音中的关键词进行捕捉；

S2：当捕捉到关键词时，先识别关键词所对应的音色，并将其标记为指定音色，之后重新对样本环境音进行识别，获取到指定音色的所有语音，并将其标记为目标语音，例如，当音色提取模块先捕捉到关键词时，根据捕捉的语音，获取到对应的音色，并将其标记为指定音色，之后根据指定音色的特点在样本环境音中进行识别，获取到样本环境音中所有的指定音色，将样本环境音中指定音色的全部内容标记为目标语音；

S3：之后音色提取模块将得到的目标语音传输至语音处理模块；

语音处理模块用于对目标语音进行处理，即按照时间顺序，获取到目标语音中响度的变化状态，响度的变化状态包括上升状态、下降状态、平稳状态和峰值状态，具体的对响度变化状态的判定方法为：

根据目标语音中响度的变化，以时间为横坐标，响度为纵坐标，得到响度与时间之间的线性关系，若线性关系为一次函数x＝at+b时，当a＞0时，为上升状态，当a＝0时，为平稳状态，当a＜0时，为下降状态，若线性关系为多次函数时，此时为峰值状态，其中t表示时间，x表示响度，a、b分别为对应的系数；

之后语音处理模块将平稳状态下的目标语音标记为识别语音，并传输至语义分析模块，语义分析模块用于将识别语音中的内容进行分析，具体的分析过程为：

ST1：先将识别语音中的内容转换成文字形式，同时提取转换后文字中所有关键词的信息，其中将语音内容转换为文字形式为现有技术，此处就不再进行赘述；

ST2：将所提取的关键词重新进行组合得到重组信息，之后将重组信息在数据存储模块中进行匹配，得到匹配结果；

ST3：同时根据数字机器人所在的位置，将数字机器人所在位置的周边信息与匹配结果进行结合，得到分析结果；

ST4：之后语义分析模块将分析结果传输至结果输出模块；

结果输出模块用于将分析结果进行显示，使目标游客对其进行查看，从而完成数字机器人的语言智慧交互。

实施例二：

在实施例一的基础上，当音色提取模块获取到指定音色时，将指定音色传输至语音采集模块，之后语音采集模块对指定音色的停顿时间进行检测，当检测到指定音色的停顿时间超过阈值T1时，语音采集模块将生成休眠信号，并将其传输至信号控制模块，当信号控制模块接收到休眠信号时，信号控制模块将数字机器人切换至休眠状态；

实施例三：

一种语言智慧互通的数字机器人的运行方法，该方法具体包括以下步骤：

步骤一：先获取到启动信号，将数字机器人的状态切换至启动状态，同时对样本环境音进行采集；

步骤二：对样本环境音中的关键词进行捕捉，根据关键词的指定音色获取到目标语音；

步骤三：对目标语音中响度变化状态进行判断，同时获取到平稳状态的目标语音，并将其标记为识别语音；

步骤四：对识别语音中的具体内容进行分析，得到重组信息，并将重组信息在数据存储模块中进行检索，得到匹配结果；

步骤五：将匹配结果与数字机器人所在的位置的周边信息进行结合，得到分析结果，之后将分析结果传输至目标游客。

上述公式中的部分数据均是去除量纲取其数值计算，公式是由采集的大量数据经过软件模拟得到最接近真实情况的一个公式；公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者通过大量数据模拟获得。

本发明的工作原理：先通过信号控制模块获取到启动信号，将数字机器人的状态切换至启动状态，之后通过语言采集模块对样本环境音进行采集，音色提取模块捕捉样本环境音中的关键词，根据关键词的指定音色获取到目标语音，语音处理模块对目标语音中响度变化状态进行判断，同时获取到平稳状态的目标语音，并将其标记为识别语音，之后语义分析模块对识别语音中的具体内容进行分析，得到重组信息，并将重组信息在数据存储模块中进行检索，得到匹配结果，将匹配结果与数字机器人所在的位置的周边信息进行结合，得到分析结果，之后结果分析模块将分析结果传输至目标游客。

以上实施例仅用以说明本发明的技术方法而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方法进行修改或等同替换，而不脱离本发明技术方法的精神和范围。

完整全部详细技术资料下载