一种车载智能交互方法、装置、设备及存储介质

文献发布时间：2024-04-18 19:58:21

技术领域

本发明涉及车辆人机交互技术领域，尤其涉及一种车载智能交互方法、装置、设备及存储介质

背景技术

随着商用车向智能化、舒适化、新能源化的方向发展，人们对汽车驾驶体验的要求不断提升，多种多样的车载智能交互装置应运而生。用户可以通过语音与车载智能系统进行交互，实现导航、播放音乐、拨打电话等功能。车载智能交互系统的意义在于提高驾驶安全性，提高驾驶体验，以及增强用户与汽车的互动。

现有的车载智能交互系统对单一用户交互指令可以及时响应，但交互指令数量较多且类型复杂时，缺乏有效的响应逻辑，智能程度不够，从而影响用户体验。

发明内容

本发明提供了一种车载智能交互方法、装置、设备及存储介质，以提高复杂交互指令时的智能化程度。

根据本发明的一方面，提供了一种车载智能交互方法，包括：

获取车内用户的至少两个多模态交互指令，并确定各多模态交互指令的交互类型；

根据车辆当前的运行模式确定当前各交互类型的响应优先级；

根据各多模态交互指令的交互类型和响应优先级，对所述各多模态交互指令进行响应。

根据本发明的另一方面，提供了一种车载智能交互装置，包括：

交互类型确定模块，用于获取车内用户的至少两个多模态交互指令，并确定各多模态交互指令的交互类型；

响应优先级确定模块，用于根据车辆当前的运行模式确定当前各交互类型的响应优先级；

交互指令响应模块，用于根据各多模态交互指令的交互类型和响应优先级，对所述各多模态交互指令进行响应。

根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的车载智能交互方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的车载智能交互方法。

本发明实施例通过为车辆的不同运行模式设置不同的指令响应优先级，对于各种场景下，均能做到对该场景交互指令的智能响应，通过有效的响应策略和逻辑，提高响应交互指令的智能程度和用户体验

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1A是根据本发明一实施例提供的一种车载智能交互方法的流程图；

图1B是根据本发明一实施例提供的一种车载智能交互装置的功能划分示意图；

图2A是根据本发明又一实施例提供的一种车载智能交互方法的流程图；

图2B是根据本发明一实施例提供的一种人机交互流程的示意图；

图3是根据本发明又一实施例提供的一种车载智能交互装置的结构示意图；

图4是实现本发明实施例的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1A为本发明一实施例提供的一种车载智能交互方法的流程图，本实施例可适用于短时间内同时出现多个待响应的交互指令，需要智能交互系统确定各交互指令的响应优先级，并依次响应的情况，该方法可以由车载智能交互装置来执行，该装置可以采用硬件和/或软件的形式实现，该装置可配置于具备相应处理能力的电子设备中，例如车辆的智能交互系统。如图1A所示，该方法包括：

S110、获取车内用户的至少两个多模态交互指令，并确定各多模态交互指令的交互类型。

S120、根据车辆当前的运行模式确定当前各交互类型的响应优先级。

S130、根据各多模态交互指令的交互类型和响应优先级，对所述各多模态交互指令进行响应。

其中，交互类型包括车控车设交互、多媒体交互和驾驶辅助交互。运行模式包括行车模式和驻车模式。如图1B所示，智能交互系统按功能可以划分为车控车设模块、多媒体模块、多模态交互模块和驾驶辅助模块。车控车设交互涉及车辆基本功能的设置，包括：车窗、车门、空调、座椅、灯光等硬件设备；多媒体交互涉及本地音视频播放、第三方应用在线音视频播放；多模态交互涉及手势交互、语音交互；驾驶辅助交互涉及导航、电子后视镜/盲区检测，驾驶员疲劳检测等功能。

具体的，用户在车内通过语音、手势、按压按键等用户行为向智能交互系统发出交互意图，智能交互系统通过深度学习和神经网络对用户行为进行感知及交互意图解析，生成用户行为对应的多模态交互指令。对于生成的任一多模态交互指令，均根据指令的控制对象，确定其交互类型。在不同运行模式下，车辆对于交互指令的响应优先级有所不同，例如在行车模式下，为保车辆安全，应优先对驾驶辅助交互的交互指令进行响应；在驻车模式下，为保用户多媒体体验，应优先对多媒体交互的交互指令进行响应。为此，本申请为两种运行模式均设定对应的交互类型响应优先级。在确定待响应的多模态交互指令的交互类型和各交互类型在当前运行模式下的响应优先级后，优先响应高优先级的多模态交互指令，在高优先级的交互指令完成响应后，再对低优先级的交互指令进行响应，直至完成全部交互指令的响应。

本发明实施例为车辆的不同运行模式设置不同的指令响应优先级，对于各种场景下，均能做到对该场景交互指令的智能响应，通过有效的响应策略和逻辑，提高响应交互指令的智能程度和用户体验。

可选的，所述获取车内用户的至少两个多模态交互指令之后，还包括：

确定各多模态交互指令关联的多模态交互反馈；通过智能交互虚拟形象向所述车内用户展示所述多模态交互反馈。

具体的，确定多模态交互指令后，根据本地预存的多模态指令和多模态交互反馈之间的关联关系，确定多模态交互指令所关联的多模态交互反馈。车辆中控屏幕上显示有智能虚拟交互形象，通过智能虚拟交互形象展示声音、动作和表情上的多模态交互反馈。

可选的，所述根据各多模态交互指令的交互类型和响应优先级，对所述各多模态交互指令进行响应包括：

若存在交互类型相同的多模态交互指令，则依据各多模态交互指令的时序依次响应。

具体的，对于不同交互类型的交互指令依照交互类型上的优先级进行响应，对于同一类型的不同交互指令则依照时序先后进行响应。

图2A为本发明又一实施例提供的一种车载智能交互方法的流程图，本实施例在上述实施例的基础上进行了优化改进。如图2A所示，该方法包括：

S210、获取车内用户的至少两个多模态交互指令，并确定各多模态交互指令的交互类型。

S220、获取车辆当前的状态信息，并根据所述状态信息确定车辆当前的运行模式，所述运行模式包括行驶模式和；

S230、若所述运行模式为行驶模式，则确定当前各交互类型的响应优先级从高到低依次为驾驶辅助交互、车控车设交互、多媒体交互；若所述运行模式为驻车模式，则确定当前各交互类型的响应优先级从高到低依次为车控车设交互、多媒体交互、驾驶辅助交互。

其中，状态信息包括车速状态、整车电源状态、外部环境信息。

具体的，通过控制器采集的状态信息判断车辆当前的运行模式。当车辆处于行驶模式时，交互指令的响应优先级依次为驾驶辅助交互、车控车设交互、多媒体交互。当车辆处于驻车模式时，交互信息的优先级依次为车控车设交互、多媒体交互、驾驶辅助交互。

可选的，所述驾驶辅助交互包括行车驾驶辅助交互和驻车驾驶辅助交互；在车辆当前的运行模式为驻车模式时，不生成与行车驾驶辅助交互相关的多模态交互指令。

其中，行车驾驶辅助交互为行车时确保车辆安全的辅助驾驶交互；驻车驾驶辅助交互为驻车时确保车辆安全的辅助驾驶交互

具体的，在行车模式下，智能交互系统中驾驶辅助交互可通过采集的图像识别出车辆附近的障碍物、行人、其他车辆等，并在一定的安全距离范围内对车内人员进行行车驾驶辅助交互的报警提醒。在驻车模式下，智能交互系统优先处理车内人员的车控车设相关交互意图，驾驶辅助交互模块仅针对特殊情况进行驻车驾驶辅助交互的预警(如整车电源电压异常、故障报警等)。

可选的，所述多模态交互指令通过对车内用户的用户行为进行多模态行为感知和交互意图解析生成，或通过驾驶辅助功能生成，或通过环境参数满足设定触发条件时触发生成；所述用户行为包括下述至少一种：语音指令、动作指令或硬件操作指令。

可选的，多模态交互指令的来源可分为三种，一是用户主动在车内做出的用户行为，如用户发出语音控制指令“将空调风量调到最大”，作为多模态交互指令。二是辅助驾驶功能为保证车辆安全，而发出的调整或提醒，例如当车辆车速过快时且前方有障碍物时，驾驶辅助功能生成“前方有障碍物，请注意减速避让”的语音提醒，作为多模态交互指令；三是设置有设定触发条件的交互指令，例如预先设置在车外温度大于35°时，自动将空调风量调到最大，以后续在车外温度大于35°时，自动生成“将空调风量调到最大”的交互指令。

可选的，所述多模态交互指令包括自定义多模态交互指令和非自定义多模态交互指令；所述自定义多模态交互指令对应车内用户自定义的情景模式，基于预设关联关系被分解为关联的至少两个非自定义多模态交互指令。

可选的，本申请的智能交互系统为用户提供自定义情景模式模式，车内人员可通过简单的手势、语音指令来代替一组复杂的语音指令、手势操作和U I操作。对于自定义情景模式的实现，需要预先录制，智能交互系统逐一记录用户在录制期间中给出的多个非自定义多模态指令，并其与用户设定的自定义情景模式的开启动作进行绑定，该开启动作即为非自定义多模态交互指令。在录制完成后，若检测到用户发出非自定义多模态交互指令，将该非自定义多模态交互指令分解为对应录制期间中录制到的多个非自定义多模态动作，实现多个控制器的联动。

示例性的，图2B是根据本发明又一实施例提供的一种人机交互流程的示意图。其中，车载智能交互装置硬件上由三部分组成：探测识别模块、逻辑运算模块、信息显示模块。

探测识别模块包括至少两套麦克、一套驾驶室内摄像头、一组环视摄像头、总线信号收发装置；其中麦克用于声场定位和语音交互，驾驶室内摄像头用于手势识别和驾驶员疲劳监测，环视摄像头用于监测外部环境信息，总线信号收发装置用于接收其他控制器的状态信息并向其发送控制命令以实现车内人员的交互指令。

逻辑运算模块主要负责处理由探测识别模块采集的视频信息、音频信息、和硬件操作信息，并通过深度学习和神经网络来实现对车内人员的行为感知及交互意图解析。逻辑运算模块同时负责对不同交互指令的优先级判断：

首先逻辑运算模块通过探测识别模块接收的其他控制器信息来判断当前车辆的运行模式。当车辆处于行驶模式时，交互信息的优先级依次为驾驶辅助交互、车控车设交互、多媒体交互。在此状态下，智能交互系统可通过探测识别模块采集的图像识别出车辆附近的障碍物、行人、其他车辆等，并在一定的安全距离范围内对车内人员进行报警提醒。当车辆处于驻车模式时，交互信息的优先级依次为车控车设交互、多媒体交互、驾驶辅助交互。在此状态下，智能交互系统优先处理车内人员的车控车设相关交互意图，驾驶辅助交互模块仅针对特殊情况进行预警。

信息显示模块主要负责多媒体信息的展示、智能交互系统虚拟形象的展示。当逻辑运算模块确定交互指令后，信息显示模块根据该交互指令控制虚拟形象给出声音、动作、表情的交互反馈，使交互更加人性化。

用户可通过语音、手势等触发智能交互系统的自定义情景模式功能。逻辑运算模块识别并存储车内人员的开启动作，当车辆状态满足触发条件时，逻辑运算模块通过总线向相应的控制器发送命令，实现多个控制器的联动。另一方面，信息显示模块也会通过虚拟形象的表情、动作和语音来向车内人员反馈当前车辆所处的情景模式。

S240、根据各多模态交互指令的交互类型和响应优先级，对所述各多模态交互指令进行响应。

本发明实施例通过存储用户自定义的情景模式，实现多控制器联动，使得人机交互趋向于定制化和智能化。

图3为本发明又一实施例提供的一种车载智能交互装置的结构示意图。如图3所示，该装置包括：

交互类型确定模块310，用于获取车内用户的至少两个多模态交互指令，并确定各多模态交互指令的交互类型；

响应优先级确定模块320，用于根据车辆当前的运行模式确定当前各交互类型的响应优先级；

交互指令响应模块330，用于根据各多模态交互指令的交互类型和响应优先级，对所述各多模态交互指令进行响应。

本发明实施例所提供的车载智能交互装置可执行本发明任意实施例所提供的车载智能交互方法，具备执行方法相应的功能模块和有益效果。

可选的，所述交互类型包括车控车设交互、多媒体交互和驾驶辅助交互,响应优先级确定模块包括：

运行模式确定单元，获取车辆当前的状态信息，并根据所述状态信息确定车辆当前的运行模式，所述运行模式包括行驶模式和；

第一响应优先级确定单元，用于若所述运行模式为行驶模式，则确定当前各交互类型的响应优先级从高到低依次为驾驶辅助交互、车控车设交互、多媒体交互；

第二响应优先级确定单元，用于若所述运行模式为驻车模式，则确定当前各交互类型的响应优先级从高到低依次为车控车设交互、多媒体交互、驾驶辅助交互。

可选的，所述装置还包括：

多模态交互反馈确定模块，用于确定各多模态交互指令关联的多模态交互反馈；

多模态交互反馈展示模块，用于通过智能交互虚拟形象和/或多媒体信息向所述车内用户展示所述多模态交互反馈。

可选的，所述交互指令响应模块330包括：

时序响应单元，用于若存在交互类型相同的多模态交互指令，则依据各多模态交互指令的时序依次响应。

进一步说明的车载智能交互装置也可执行本发明任意实施例所提供的车载智能交互方法，具备执行方法相应的功能模块和有益效果。

图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图4所示，电子设备40包括至少一个处理器41，以及与至少一个处理器41通信连接的存储器，如只读存储器(ROM)42、随机访问存储器(RAM)43等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序，来执行各种适当的动作和处理。在RAM 43中，还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。

电子设备40中的多个部件连接至I/O接口45，包括：输入单元46，例如键盘、鼠标等；输出单元47，例如各种类型的显示器、扬声器等；存储单元48，例如磁盘、光盘等；以及通信单元49，例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理，例如车载智能交互方法。

在一些实施例中，车载智能交互方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元48。在一些实施例中，计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时，可以执行上文描述的车载智能交互方法的一个或多个步骤。备选地，在其他实施例中，处理器41可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行车载智能交互方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(AS IC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：一汽解放汽车有限公司;

上一篇：单电阻采样PWM逆变器的电流重构方法、装置、设备及介质
下一篇：一种基于LSTM的单端故障点反射波头识别方法