掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据服务的信息采集设备及信息采集方法

文献发布时间:2024-04-18 19:58:53


一种基于大数据服务的信息采集设备及信息采集方法

技术领域

本发明涉及大数据服务技术领域,更具体地说,它涉及一种基于大数据服务的信息采集设备及信息采集方法。

背景技术

虚拟机器人是基于自然语言处理的智能会话系统,它是融合了多元人工技术的智能机器人,虚拟机器人可以理解并回答交流者的问题,虚拟机器人基于自然语言以及神经网络相关技术对交流者的咨询问题进行回答,在交流者与机器人进行语音讲话时,可能交流者周围的环境也有其他噪音,然而现有基于大数据服务的信息采集设备不能对交流者与机器人进行语言交流时的音质信息进行识别,即不能通过对音质识别后捕捉追踪交流者所要咨询问题的语言内容,从而机器人不能很好的为交流者提供相关服务。

发明内容

针对现有技术存在的不足,本发明的目的在于提供一种基于大数据服务的信息采集设备及信息采集方法。

为实现上述目的,本发明提供了如下技术方案:

一种基于大数据服务的信息采集设备,包括。

数据采集模块,所述数据采集模块包括第一数据采集单元和第二数据采集单元。

所述第一数据采集单元用于采集交流者正在与机器人进行语言交流时的基本信息;其中,所述基本信息包括语种信息、音质信息和语言情感信息。

所述第二数据采集单元用于采集正在与机器人进行语言交流时所处环境的其他语言信息;其中,所述语言信息包括语言音质信息、语言音质种类信息和语言音量信息。

划分归类模块,所述划分归类模块将交流者正在与机器人进行语言交流时音质信息进行处理分析后划分归类为有效交流语言;将正在与机器人进行语言交流时所处环境的其他语言音质信息划分归类为无效交流语言。

追踪采集模块,所述追踪采集模块将与有效交流语言相同的语言音质信息进行追踪采集实时获取交流者的语言内容,机器人根据交流者的语言内容为交流者提供相关服务。

推送模块,所述推送模块将交流者正在与机器人进行语言交流时的语言情感信息进行处理分析得到状态值,将正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息进行处理分析得到环境值,将状态值和环境值进行联合处理分析得到推送值,机器人根据推送值向交流者推广选择服务。

优选地,机器人根据交流者的语言内容为交流者提供相关服务,具体为:

识别交流者正在与机器人进行语言交流时的语种信息。

机器人根据交流者的语言内容选择相同的语种为交流者提供相关服务。

需要说明的是,交流者向机器人通过语音讲话的方式咨询问题时,机器人接收到交流者的语音咨询问题,机器人在数据库中匹配与交流者咨询问题相关的答案,由于交流者向机器人提问的语种不同,如果交流者向机器人提问的语言为汉语,则机器人选择用汉语回答交流者的问题,如果交流者向机器人提问的语言为英语,则机器人选择用英语回答交流者的问题。

优选地,将交流者正在与机器人进行语言交流时的语言情感信息进行取值和标记得到状态值ZTZ。

需要注意的是,通过对交流者的语言进行分析可以判断交流者的心情状态,比如,交流者对机器人讲话时语句中包括“您好”、“你好”和“请问”之类的词语时,则说明交流者的心情状态比较好;如果交流者对机器人讲话时语句中包括“哎”之类的词语时,则说明交流者的心情状态不好。

如果交流者对机器人讲话时语句中包括“您好”、“你好”和“请问”之类的词语时,则状态值ZTZ的取值为1;如果交流者对机器人讲话时语句中包括“哎”之类的词语时,则状态值ZTZ的取值为5。

将状态值ZTZ与预设的状态阈值P进行比较。

如果状态值ZTZ≤预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较好。

如果状态值ZTZ>预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较差。

这里将预设的状态阈值P设定为3,在状态值ZTZ的取值为5时,由于状态值ZTZ>预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较差;在状态值ZTZ的取值为1时,由于状态值ZTZ<预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较好。

优选地,将正在与机器人进行语言交流时所处环境的其他语言音质种类信息进行标记和取值得到其他语言音质种类值YYZ。

需要注意的是,由于交流者在与机器人进行语言交流时,由于每个人讲话的音质特点都不一样,如果交流者周围有两个人讲话,则正在与机器人进行语言交流时所处环境的其他语言音质种类有两个种类,即此时其他语言音质种类值YYZ取值为2;如果交流者周围有五个人讲话,则正在与机器人进行语言交流时所处环境的其他语言音质种类有五个种类,即此时其他语言音质种类值YYZ取值为5。

将正在与机器人进行语言交流时所处环境的其他音量信息进行标记和取值得到其他语言音量值YLZ。

优选地,通过处理函数HJZ=a1×YYZ+a2×YLZ计算得到环境值HJZ;其中,a1和a2为影响因子且大于零。

优选地,将环境值HJZ与预设的环境阈值Q进行比较。

如果环境值HJZ≤预设的环境阈值Q,则说明正在与机器人进行语言交流时所处环境噪音小。

如果环境值HJZ>预设的环境阈值Q,则说明正在与机器人进行语言交流时所处环境噪音大。

优选地,通过联合函数

优选地,将推送值TGZ与预设的推送阈值A进行比较。

如果推送值TGZ≤预设的推送阈值A,则不需要机器人向交流者推广选择服务。

如果推送值TGZ>预设的推送阈值A,则需要机器人向交流者推广选择服务。

一种基于大数据服务的信息采集方法,该方法包括以下步骤。

采集交流者正在与机器人进行语言交流时的基本信息;其中,所述基本信息包括语种信息、音质信息和语言情感信息。

采集正在与机器人进行语言交流时所处环境的其他语言信息;其中,所述语言信息包括语言音质信息、语言音质种类信息和语言音量信息。

将交流者正在与机器人进行语言交流时音质信息进行处理分析后划分归类为有效交流语言;将正在与机器人进行语言交流时所处环境的其他语言音质信息划分归类为无效交流语言。

将与有效交流语言相同的语言音质信息进行追踪采集实时获取交流者的语言内容,机器人根据交流者的语言内容为交流者提供相关服务。

将交流者正在与机器人进行语言交流时的语言情感信息进行处理分析得到状态值,将正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息进行处理分析得到环境值,将状态值和环境值进行联合处理分析得到推送值,机器人根据推送值向交流者推广选择服务。

与现有技术相比,本发明具备以下有益效果:

由于交流者在向机器人语音讲话时,可能交流者周围的环境也有其他噪音,本申请通过对交流者正在与机器人进行语言交流时的音质信息进行识别,通过对交流者的音质追踪后识别交流者的语言内容,从而机器人根据交流者的语言内容提供相关服务。

同时,本申请将交流者正在与机器人进行语言交流时的语言情感信息、正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息进行处理分析得到推送值,即通过对交流者正在与机器人进行语言交流时的语言情感信息进行分析可以判断交流者的心情状态,同时根据正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息判断交流者所处环境是否烦杂,从而根据实际情况通过机器人向交流者推广选择服务。

附图说明

图1为本发明提出一种基于大数据服务的信息采集设备的模块示意图;

图2为本发明提出一种基于大数据服务的信息采集方法的流程示意图;

图3为本发明提出一种基于大数据服务的信息采集方法中计算环境值的流程示意图。

具体实施方式

参照图1至图3所示。

实施例一对本发明提出的一种基于大数据服务的信息采集设备及信息采集方法做进一步说明。

一种基于大数据服务的信息采集设备,包括。

数据采集模块,数据采集模块包括第一数据采集单元和第二数据采集单元。

第一数据采集单元用于采集交流者正在与机器人进行语言交流时的基本信息;其中,基本信息包括语种信息、音质信息和语言情感信息。

第二数据采集单元用于采集正在与机器人进行语言交流时所处环境的其他语言信息;其中,语言信息包括语言音质信息、语言音质种类信息和语言音量信息。

划分归类模块,划分归类模块将交流者正在与机器人进行语言交流时音质信息进行处理分析后划分归类为有效交流语言;将正在与机器人进行语言交流时所处环境的其他语言音质信息划分归类为无效交流语言。

追踪采集模块,追踪采集模块将与有效交流语言相同的语言音质信息进行追踪采集实时获取交流者的语言内容,机器人根据交流者的语言内容为交流者提供相关服务。

推送模块,推送模块将交流者正在与机器人进行语言交流时的语言情感信息进行处理分析得到状态值,将正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息进行处理分析得到环境值,将状态值和环境值进行联合处理分析得到推送值,机器人根据推送值向交流者推广选择服务。

由于交流者在向机器人语音讲话时,可能交流者周围的环境也有其他噪音,本申请通过对交流者正在与机器人进行语言交流时的音质信息进行识别,通过对交流者的音质追踪后识别交流者的语言内容,从而机器人根据交流者的语言内容提供相关服务。

同时,本申请将交流者正在与机器人进行语言交流时的语言情感信息、正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息进行处理分析得到推送值,即通过对交流者正在与机器人进行语言交流时的语言情感信息进行分析可以判断交流者的心情状态,同时根据正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息判断交流者所处环境是否烦杂,从而根据实际情况通过机器人向交流者推广选择服务。

机器人根据交流者的语言内容为交流者提供相关服务,具体为:

识别交流者正在与机器人进行语言交流时的语种信息。

机器人根据交流者的语言内容选择相同的语种为交流者提供相关服务。

需要说明的是,交流者向机器人通过语音讲话的方式咨询问题时,机器人接收到交流者的语音咨询问题,机器人在数据库中匹配与交流者咨询问题相关的答案,由于交流者向机器人提问的语种不同,如果交流者向机器人提问的语言为汉语,则机器人选择用汉语回答交流者的问题,如果交流者向机器人提问的语言为英语,则机器人选择用英语回答交流者的问题。

将交流者正在与机器人进行语言交流时的语言情感信息进行取值和标记得到状态值ZTZ。

需要注意的是,通过对交流者的语言进行分析可以判断交流者的心情状态,比如,交流者对机器人讲话时语句中包括“您好”、“你好”和“请问”之类的词语时,则说明交流者的心情状态比较好;如果交流者对机器人讲话时语句中包括“哎”之类的词语时,则说明交流者的心情状态不好。

如果交流者对机器人讲话时语句中包括“您好”、“你好”和“请问”之类的词语时,则状态值ZTZ的取值为1;如果交流者对机器人讲话时语句中包括“哎”之类的词语时,则状态值ZTZ的取值为5。

将状态值ZTZ与预设的状态阈值P进行比较。

如果状态值ZTZ≤预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较好。

如果状态值ZTZ>预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较差。

这里将预设的状态阈值P设定为3,在状态值ZTZ的取值为5时,由于状态值ZTZ>预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较差;在状态值ZTZ的取值为1时,由于状态值ZTZ<预设的状态阈值P,则说明交流者正在与机器人进行语言交流时的状态较好。

将正在与机器人进行语言交流时所处环境的其他语言音质种类信息进行标记和取值得到其他语言音质种类值YYZ。

需要注意的是,由于交流者在与机器人进行语言交流时,由于每个人讲话的音质特点都不一样,如果交流者周围有两个人讲话,则正在与机器人进行语言交流时所处环境的其他语言音质种类有两个种类,即此时其他语言音质种类值YYZ取值为2;如果交流者周围有五个人讲话,则正在与机器人进行语言交流时所处环境的其他语言音质种类有五个种类,即此时其他语言音质种类值YYZ取值为5。

将正在与机器人进行语言交流时所处环境的其他音量信息进行标记和取值得到其他语言音量值YLZ。

需要注意的是,如果正在与机器人进行语言交流时所处环境其他音量的分贝为50分贝,则其他语言音量值YLZ取值为50,如果正在与机器人进行语言交流时所处环境其他音量的分贝为65分贝,则其他语言音量值YLZ取值为65。

通过处理函数HJZ=a1×YYZ+a2×YLZ计算得到环境值HJZ;其中,a1和a2为影响因子且大于零。

需要注意的是,这里a1和a2的取值均设定为1,在其他语言音质种类值YYZ取值为2、其他语言音量值YLZ取值为50的情况下,通过处理函数HJZ=a1×YYZ+a2×YLZ计算得到环境值HJZ取值为52;在其他语言音质种类值YYZ取值为5、其他语言音量值YLZ取值为65的情况下,通过处理函数HJZ=a1×YYZ+a2×YLZ计算得到环境值HJZ取值为70。

将环境值HJZ与预设的环境阈值Q进行比较。

如果环境值HJZ≤预设的环境阈值Q,则说明正在与机器人进行语言交流时所处环境噪音小。

如果环境值HJZ>预设的环境阈值Q,则说明正在与机器人进行语言交流时所处环境噪音大。

这里将预设的环境阈值Q设定为60,在环境值HJZ取值为52的情况下,由于环境值HJZ<预设的环境阈值Q,则说明正在与机器人进行语言交流时所处环境噪音小;在环境值HJZ取值为70的情况下,由于环境值HJZ>预设的环境阈值Q,则说明正在与机器人进行语言交流时所处环境噪音大。

通过联合函数

需要注意的是,这里将b1的取值设定为1,将b2的取值设定为100,在状态值ZTZ的取值为1、环境值HJZ取值为50的情况下,通过联合函数

将推送值TGZ与预设的推送阈值A进行比较。

如果推送值TGZ≤预设的推送阈值A,则不需要机器人向交流者推广选择服务。

如果推送值TGZ>预设的推送阈值A,则需要机器人向交流者推广选择服务。

需要注意的是,这里将预设的推送阈值A设定为4,在推送值TGZ为3的情况下,由于推送值TGZ<预设的推送阈值A,则不需要机器人向交流者推广选择服务,说明此时交流者的心情状态比较好,并且环境比较热闹,因此不需要机器人向交流者提供听音乐、看电影的选择服务;在推送值TGZ为6的情况下,由于推送值TGZ>预设的推送阈值A,则需要机器人向交流者推广选择服务,即此时交流者的心情状态比较差,并且环境比较安静,因此需要机器人向交流者提供听音乐、看电影的选择服务。

实施例二

在实施例一的基础上增加如下技术特征:

一种基于大数据服务的信息采集方法,该方法包括以下步骤。

采集交流者正在与机器人进行语言交流时的基本信息;其中,基本信息包括语种信息、音质信息和语言情感信息。

采集正在与机器人进行语言交流时所处环境的其他语言信息;其中,语言信息包括语言音质信息、语言音质种类信息和语言音量信息。

将交流者正在与机器人进行语言交流时音质信息进行处理分析后划分归类为有效交流语言;将正在与机器人进行语言交流时所处环境的其他语言音质信息划分归类为无效交流语言。

将与有效交流语言相同的语言音质信息进行追踪采集实时获取交流者的语言内容,机器人根据交流者的语言内容为交流者提供相关服务。

将交流者正在与机器人进行语言交流时的语言情感信息进行处理分析得到状态值,将正在与机器人进行语言交流时所处环境的其他语言音质种类信息和语言音量信息进行处理分析得到环境值,将状态值和环境值进行联合处理分析得到推送值,机器人根据推送值向交流者推广选择服务。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 一种用于大数据的信息采集设备
  • 一种轨道交通用设备信息采集评估系统及方法
  • 一种用电信息采集及设备诊断评估仿真装置及实现方法
  • 一种音频设备的语音信息采集上报控制方法及系统
  • 基于数字化的大数据用户信息采集方法及大数据服务器
  • 一种信息采集装置及基于大数据的信息采集方法
技术分类

06120116514675