掌桥专利:专业的专利平台
掌桥专利
首页

一种车辆语音控制方法

文献发布时间:2023-06-19 11:21:00


一种车辆语音控制方法

技术领域

本发明属于车辆的语音控制技术领域,特别涉及一种车辆语音控制方法。

背景技术

随着车辆技术的发展,越来越多的车辆配备有语音控制功能,使得驾驶员在行车时能够通过语音来控制车辆,可以在保障驾驶安全的同时,提升车辆的智能化程度,还可以提升驾驶乐趣。

为了实现对车辆的语音控制,制造商一般会在车辆的驾驶区安装麦克风,使得车辆能够根据麦克风接收到的音频信号来执行相应操作。但在实际使用中,因为麦克风仅安装于驾驶区,当副驾驶员或后排乘客想要进行语音控制时,由于距离太远,导致音频信号无法准确地被麦克风接收,可能出现语音无法识别或出现识别错误等情况。因此,这种车辆语音控制方法只能准确的执行驾驶员的发出的音频信号,而对于副驾驶和后排乘客的发出的音频信号执行效果不佳。

为了提升副驾驶和后排乘客对车辆的语音控制效果,一些车辆会分别在副驾驶区和后排乘客区加装麦克风,通过三个麦克风来接收驾驶舱内的音频信号,并根据接收到的音频信号执行相应操作,从而使得驾驶员、副驾驶员和后排乘客都能通过发出的音频信号准确控制车辆各个功能。

但是通过加装麦克风的方法提升车辆的语音控制效果,仅能做到更准确的接收驾驶舱内的音频信号,而不能区分车内驾驶员与其他乘客的区别。在人性化与智能方面稍显不足。如果副驾驶或后排乘客在车辆行驶过程中发出了影响车辆行驶的指令,例如副驾驶或后排乘客不当的发出调节倒车镜或控制雨刷摆动等控制指令时,车辆执行这种控制指令后,就会对行车安全造成危害。

而且目前的语音控制系统都是在车辆启动后全程运行,而在车辆行驶过程中难免遇到一些特殊情况,导致车辆驾驶的安全性短暂降低,如果此时后排乘客或副驾驶区乘客对车辆进行语音控制,进行一些提升舒适性或娱乐性的活动,可能会影响驾驶员的正常驾驶,导致危险状况的发生。

发明内容

本发明的目的之一是提供一种车辆语音控制方法,能够根据音频信号的发出区域、音频发出区域的乘客属性及该区域的指令权限,确定是否执行该指令;能够在实现车辆语音控制的同时,保障车辆的驾驶安全性。

本发明的目的之二是能够根据车辆的行驶状态指数,确定车辆的行驶状态是否满足全区域控制状态,并且在车辆运行状态不满足全区域控制状态时,忽略副驾驶区和后排乘客区发出的控制指令,以进一步提高车辆的驾驶安全性。

本发明提供的技术方案为:

一种车辆语音控制方法,包括:

步骤一、确定发出音频信号的区域;

步骤二、对所述音频信号进行识别,判断发出所述音频信号的乘客属性,及判断所述音频信号对应的控制指令;

步骤三、根据发出音频的区域、发出所述音频信号的乘客属性和所述音频信号对应的控制指令,判断所述控制指令是否为可执行指令;

步骤四、当所述控制指令为可执行指令时,控制车辆执行所述控制指令。

优选的是,所述发出音频信号的区域包括主驾驶区、副驾驶区和后排乘客区。

优选的是,所述乘客属性信息包括乘客的性别和年龄。

优选的是,在所述步骤三之前还包括设定所述发出音频信号的区域对应的指令权限;当所述发出音频信号的区域发出的控制指令在其对应的指令权限内范围时,进行步骤三;否则,忽略所述控制指令。

优选的是,所述主驾驶区对应的指令权限为整车控制权限;

所述副驾驶区对应的指令权限至少包括:视频/音频播放权限、导航权限或副驾驶座椅调整权限;

所述后排乘客区对应的指令权限至少包括:视频/音频播放权限和后排音响控制权限。

优选的是,在所述步骤四中,还包括:

判断当前车辆的行驶状态是否满足全区域控制状态;

其中,当所述控制指令为可执行指令,并且所述车辆运行状态满足全区域控制状态时,控制车辆执行所述控制指令;否则,忽略副驾驶区和后排乘客区发出的控制指令。

优选的是,根据车辆的行驶状态指数确定车辆的行驶状态是否满足全区域控制状态;

其中,所述车辆的行驶状态指数为:

式中,δ表示车辆质心偏角,V表示车速、V

其中,当Rs>0.6时,车辆的行驶状态满足全区域控制状态;

当Rs≤0.6时,车辆的形式状态不满足全区域控制状态。

优选的是,当|δ|<8时,η的取值范围为1.15~1.10;

当|δ|≥8时,η的取值范围为0.85~0.9。

优选的是,所述驾驶环境系数为:

式中,λ

优选的是,当路面为冰雪路面时,λ

当路面为非冰雪路面时,λ

本发明的有益效果是:

本发明提供的车辆语音控制方法,能够根据音频信号的发出区域、音频发出区域的乘客属性及该区域的指令权限,确定是否执行该指令;能够在实现车辆语音控制的同时,保障车辆的驾驶安全性。

本发明提供的车辆语音控制方法,能够根据车辆的行驶状态指数,确定车辆的行驶状态是否满足全区域控制状态,并且在车辆运行状态不满足全区域控制状态时,忽略副驾驶区和后排乘客区发出的控制指令,以进一步提高车辆的驾驶安全性。

附图说明

图1为本发明所述的车辆语音控制系统的示意图。

具体实施方式

下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。

本发明提供了一种车辆语音控制方法,该控制方法基于车辆语音控制系统实现的。

如图1所示,所述的车辆语音控制系统包括:主麦克风102、副麦克风102、后麦克风103、延迟处理模块104、位置判定模块105、音频降噪模块106、音频执行模块107、软件处理模块108、音质区分模块109和应用执行模块110。

其中,主麦克风102设置于主驾驶区,用于录入乘车人员的音频信号和行车噪音。副麦克风102设置于副驾驶区,用于录入乘车人员的音频信号和行车噪音。后麦克风103设置于后排乘客区,用于录入乘车人员的音频信号和行车噪音。

延迟处理模块104用于对录入的三组音频信号进行相位处理,纠正三组音频信号的相位延迟,将三组音频信号的相位整合成相同相位。由于三个麦克风与发出音频信号的乘车人员间的距离不同,所以三个麦克风在录入音频信号时会产生先后顺序,导致录入的三组音频信号间出现相位差,产生相位延迟,所以需要延迟处理模块进行相位处理。

同时延迟处理模块104还用于将三组音频信号的相位差发送给位置判定模块105,并将整理后的三组相同相位的音频信号发送给音频降噪模块106。

位置判定模块105用于接收三组音频信号的相位差,根据相位差判断发出音频信号的乘客所在的区域,并根据判断出的区域生成区域信息,将区域信息发送至音频执行模块107。

音频降噪模块106用于接收相同相位的三组音频信号,对接收到的三组音频信号进行降噪处理,得到纯净音频信号,并将得到的纯净音频信号发送至音频执行模块107。

音频执行模块107用于接收区域信息和纯净音频信号,并将接收到的区域信息和纯净音频信号发送至软件处理模块108,同时根据区域信息判断是否需要对纯净音频信号进行检测,如果需要进行检测则将纯净音频信号发送至音质区分模块109。

软件处理模块108用于接收纯净音频信号和区域信息,将接收到的纯净音频信号转换成车辆可识别的控制指令。并将位置信息和控制指令发送至应用执行模块110。

音质区分模块109用于接收并分析纯净音频信号,获取发声乘客的属性信息,将获取的属性信息发送至应用执行模块110。

应用执行模块110用于接收区域信息、控制指令和发声乘客的属性信息。根据区域信息和控制指令,判断该区域的控制权限中是否包括指定权限,其中,指定权限为执行上述控制指令的权限。若包括指定权限,则对发声乘客的属性信息和控制指令进行综合分析,并将分析结果发送至车辆相应的各执行模块,车辆执行模块包括车载音响娱乐单元和座椅调节单元等本发明实施例对此不进行具体限定,其中车载音响娱乐单元用于根据控制指令搜索并播放音乐等,本发明实施例对此同样不进行具体限定。

其中,音频信号为人发出的语音指令的信号,是一种电信号,它通过频率,幅度和相位表达了人发出的语音指令的音色、音强和音调。

在本发明实施例中,车辆通过三个麦克风同时采集乘客发出的音频信号。通过三个麦克风采集音频信号,加大了接收音频信号的范围,达到三个不同区域乘客都能对车辆进行语音控制的目的。

三组麦克风采集到乘客发出的音频信号后,将采集到的音频信号发送至延迟处理模块。

车辆根据接收到的音频信号,确定发出音频信号的乘客所在区域。

车辆可以根据三组音频信号的相位差,判断出最先接收到音频信号的为哪个麦克风,并可以根据麦克风所在区域,确定发出音频信号的乘客所在区域。由于麦克风的设置区域不同,因此,对音频信号的来源区域进行区别,可以达到车内驾驶员与其他乘客进行区别的目的,乘客发出的音频信号会最先被距离最近的麦克风采集到,因此导致车辆接收到的三组音频信号会出现相位差,所以可以基于音频信号之间的相位差来确定区域。

在本发明实施例中,延迟处理模块接收到三组麦克风采集的音频信号后,将接收到的三组音频信号的相位差发送至位置判定模块,位置判定模块根据接收到相位差判断出发该音频信号的乘客所在区域,并根据判断出的区域生成区域信息,将区域信息发送至音频执行模块。

进一步的,由于在麦克风在采集音频信号的同时,还会采集到车辆的行车噪音,所以为了提升车辆对音频信号的识别效果,还需对采集到的音频信号进行降噪处理,上述降噪处理的过程为:

延迟处理模块接收到三组麦克风采集的音频信号后,通过相位处理,得到三组相同相位的音频信号。延迟处理模块将得到三组相同相位的音频信号发送至音频降噪模块。音频降噪模块接收到三组相同相位的音频信号后,对三组音频信号进行叠加处理,得到一组音频信号,并对叠加后的一组音频信号,通过增大信噪比的方式,进行降噪处理,从而达到降噪效果,得到纯净音频信号。

在实际场景中,为了更好的区分车内驾驶员与其他乘客的区别,车辆根据发出音频信号的乘客所在的区域不同,会出现两种不同的执行方式,当发出音频信号的乘客所在的区域为副驾驶区或后排乘客区时,具体包括下述步骤:

当车辆确定发出音频信号的区域为副驾驶区或后排乘客区时,对音频信号进行检测,得到发出该音频信号的乘客的属性信息。

其中,属性信息至少包括性别和年龄。

根据音频信号的相位、频率和强度,确定乘客声音的音色、音强和音调等至少一项能够用于区分性别或年龄的信息,从而根据音色、音强和音调可以获取乘客的属性信息。获取属性信息是为了当乘客发出的音频信号为某一类指令而没有具体执行内容时,如,播放音乐,导航景点等,本发明实施例不对其进行具体限定。车辆能够根据乘客的年龄和性别分析其兴趣爱好,执行其兴趣爱好范围内的相应操作。例如,当乘客发出“播放音乐”的音频信号时,车辆能够根据获取的属性信息播放乘客兴趣范围内的歌曲,如,车辆获取乘客的属性信息为5-10岁女性,相应的执行播放歌曲指令时优先播放儿歌。使得车辆的语音控制功能更加智能化。

在本发明实施例中,音频执行模块接收到区域信息和纯净音频信号后,当接收到的区域信息显示发出该音频信号的乘客所在的区域为副驾驶区或后排乘客区时,音频执行模块将接收到的纯净音频信号发送至音质判断模块,音质判断模块根据接收到纯净音频信号,判断出发出该音频信号的副驾驶或后排乘客的属性信息。音质判断模块判断出属性信息后,将属性信息发送至应用执行模块。

由于麦克风采集到的音频信号,不能被车辆的各执行模块识别,所以车辆需要将采集到的音频信号转换成各执行模块可识别的控制指令,使得车辆的各执行模块可以根据控制指令执行相应操作,从而实现车辆的语音控制功能。其中,控制指令可以为文字信号或程序代码,本发明实施例对此不进行具体限定。将音频信号转换成可识别的控制指令的过程为:

音频执行模块将接收到的区域信息和纯净音频信号发送至软件处理模块。软件处理模块接收到纯净音频信号和区域信息后,对纯净音频信号进行分析,将音频信号转换为控制指令,进而软件处理模块将接收到的区域信息和转换得到的控制指令发送至应用执行模块。

当车辆确定该副驾驶区或后排乘客区的控制权限中包括指定权限时,根据音频信号对应的控制指令对车辆进行控制,其中,指定权限为执行控制指令的权限。

在本发明实施例中,车辆语音控制系统会对不同区域的乘客设置不同的控制权限,控制权限内的权限为该区域乘客的独有权限,控制权限外的权限为该区域乘客的禁止权限,根据设置的控制权限对控制指令进行有选择的执行,从而更加有效的又对车内驾驶员与其他乘客进行了区分,保障了行车安全,在人性化与智能方面具有明显提升。

其中,副驾驶区的独有权限包括:视频/音频播放权限、导航权限或副驾驶座椅调整权限等,本发明实施例对此不进行具体限定。

副驾驶区的禁止权限包括:主驾驶座椅控制权限、车窗和后视镜等影响行车安全的控制权限、涉及车辆信息和车主信息等驾驶员隐私的相关控制权限或后排音响等相关功能控制权限等,本发明实施例对此不进行具体限定。

后排乘客区的控制权限有:视频/音频播放权限以及后排音响功能控制权限等,本发明实施例对此同样不进行具体限定。

后排乘客区的禁止权限包括:拨打蓝牙电话权限、导航权限、主驾驶和副驾驶座椅控制权限、车窗和后视镜等影响行车安全的控制权限或涉及车辆信息和车主信息等驾驶员隐私的相关控制权限等,本发明实施例对此同样不进行具体限定。

当车辆判断乘客发出的音频信号对应的控制指令的权限属于该区域的独有权限时,执行该控制指令,上述确定和执行的具体过程为:

应用执行模块中预先存储有各区域的独有权限和禁止权限,当接收音质判断模块发送的属性信息和软件处理模块发送的区域信息和控制指令后,根据接收到的控制指令指令和区域信息进行判断,当该控制指令的权限在该区域的独有权限内时,应用执行模块对接收到的属性信息、区域信息和控制指令指令进行综合分析,并根据分析结果对车辆进行相应控制。

进一步的,当需要进行信息提示时,如果区域信息显示为副驾驶区发出的音频信号时,则在车载显示屏上采用文字显示的方式进行提示,使得副驾驶能够通过车载显示屏准确的获取提示信息;如果区域信息显示为后排乘客区发出的音频信号时,则采用车载音响语音播报和车载显示屏文字显示两种方式进行提示。其中,车辆进行信息提示的过程为:车辆生成提示文字后,当需要对副驾驶展示提示信息时,获取全部提示文字,并在车载显示屏上进行全部显示,当需要对后排乘客展示提示信息时,提取提示文字中的关键字,并在车载显示屏上进行关键字显示。进一步地,在显示时还可以将关键字转换成音频信号,通过车载音响进行语音播报。

当车辆确定该副驾驶区或后排乘客区的控制权限中不包括指定权限时,忽略该音频信号对应的控制指令。

当车辆判断乘客发出的音频信号对应的控制指令的权限不属于该区域的控制权限时,表示该音频信号的控制指令的权限为该区域的禁止权限,则忽略该控制指令,上述确定的具体过程为:

应用执行模块中预先存储有副驾驶区和后排乘客区的禁止权限,当接收到音质判断模块发送的属性信息和软件处理模块发送的区域信息和控制指令后,根据接收到的控制指令和区域信息进行判断,当该控制指令的权限在该区域的禁止权限内时,应用执行模块不再进行相应的控制指令的操作。

进一步的,当车辆判定该控制指令的权限属于禁止权限时,根据禁止权限生成相应的禁止原因,并通过车载显示屏和/或车载音响等进行禁止原因的提示。

当车辆确定该区域为主驾驶区时,执行根据该音频信号对应的控制指令对该车辆进行控制的步骤。

主驾驶具有整车控制权,主驾驶的控制权限包括:视频/音频播放权限、导航权限、主驾驶和副驾驶座椅调整权限、车窗和后视镜等影响行车安全的控制权限、涉及车辆信息和车主信息等驾驶员隐私的相关控制权限或前排和后排音响等相关功能控制权限等,本发明实施例对此不进行具体限定。

在另一个实施例中,音频执行模块接收到区域信息和纯净音频信号后,当接收到的区域信息显示发出音频信号的乘客所在的区域为主驾驶区时,音频执行模块将接收到的两个信息发送至软件处理模块。软件处理模块接收到纯净音频信号和区域信息后,对纯净音频信号进行分析,将音频信号转换为应用执行模块可识别的控制指令,进而软件处理模块将接收到的区域信息和转换得到的控制指令发送至应用执行模块。因为主驾驶具有整车控制权限,所以应用执行模块根据接收到控制指令直接对车辆进行控制。

车辆中三个麦克风采集到驾驶舱内的音频信号后,根据三组音频信号确定发声乘客所在区域以及该区域的控制权限,若该音频信号对应的控制指令在其控制权限内,则执行该控制指令,若不在其控制权限内,则不执行该控制指令。通过对车辆进行区域划分并对不同的区域设置不同的控制权限,从而实现对控制指令进行有选择的执行,在提升车辆的语音控制效果的同时,又对车内驾驶员与其他乘客进行了有效区分,保障了行车安全,在人性化与智能方面具有明显提升。

进一步的,当接收到的主驾驶的音频信号为某一类指令而没有具体执行内容时,应用执行模块会根据预存的主驾驶的兴趣爱好,执行相应操作。

再进一步的,当需要进行信息提示时,如果该区域为主驾驶,则采用语音播放的方式进行提示,其中,对主驾驶的提示为获取全部提示文字,将全部提示文字转换成音频信号,并通过车载音响进行语音播报。

作为进一步的优选,在本发明的一种实施例,还包车辆状态监测及处理模块,其通过在车辆上安装传感器或通过车辆CAN总线获取车辆的行驶状态新信息和车辆的驾驶环境信息,包括:车辆质心偏角,车速、光线强度、环境温度和路面状况等,所述车辆状态监测及处理模块与应用执行模块110电联,应用执行模块110综合车辆状态信息和发出音频的区域信息、控制指令和发声乘客的属性信息进行综合判断,并执行对车辆的语音控制。具体方法如下:

根据车辆状态,判断当前车辆的行驶状态是否满足全区域控制状态;其中,当根据发出音频的区域信息、控制指令和发声乘客的属性信息确定音音频指令可以执行,并且所述车辆运行状态满足全区域控制状态时,控制车辆执行所述音频控制指令;否则,忽略副驾驶区和后排乘客区发出的控制指令,只能单独执行主驾驶区发出的控制指令。

在本发明的一种实施例中,根据车辆的行驶状态指数确定车辆的行驶状态是否满足全区域控制状态;

其中,所述车辆的行驶状态指数为:

式中,δ表示车辆质心偏角,单位为°;V表示车速、V

其中,当Rs>0.6时,车辆的行驶状态满足全区域控制状态;当Rs≤0.6时,车辆的形式状态不满足全区域控制状态。

车轮滑转率的计算方法为:

式中,v′为理论车速,v为实际速度,v′=rw,r为车辆驱动轮的半径,w为驱动轮的角速度。

当|δ|<8时,η的取值范围为1.15~1.10;作为优选,设定η=1.15。

当|δ|≥8时,η的取值范围为0.85~0.9;作为优选,设定η=0.85。

其中,所述驾驶环境系数为:

式中,λ

其中,当路面为冰雪路面时,λ

其中,在另一实施例中,路面是否为冰雪路面可通过摄像头采集路面图像后,基于大数据识别得到。

综上所述,本发明提供的车辆语音控制方法,能够根据音频信号的发出区域、音频发出区域的乘客属性及该区域的指令权限,确定是否执行该指令;能够在实现车辆语音控制的同时,保障车辆的驾驶安全性。本发明还能够根据车辆的行驶状态指数,确定车辆的行驶状态是否满足全区域控制状态,并且在车辆运行状态不满足全区域控制状态时,忽略副驾驶区和后排乘客区发出的控制指令,以进一步提高车辆的驾驶安全性。

尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

相关技术
  • 语音识别装置、具有语音识别装置的车辆及其控制方法
  • 语音控制方法、语音控制系统、车辆、服务器和存储介质
技术分类

06120112898387