掌桥专利:专业的专利平台
掌桥专利
首页

车载语音启动方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 09:24:30


车载语音启动方法、装置、电子设备和存储介质

技术领域

本申请涉及数据处理技术领域,尤其涉及智能交通技术领域,具体涉及一种车载语音启动方法、装置、电子设备和存储介质。

背景技术

当下随着智能交通的兴起,在车机上搭载车载语音助手成为车机系统的标配。车载语音助手可以实现根据车内人员的语音指令完成相应的交互操作。但是由于车载语音助手与车内人员的交互过程中会涉及到车主的个人信息,因此需要保证车载语音助手开启的安全性,避免发生所有人员均可以对车载语音助手进行唤醒启动。

发明内容

本公开提供了一种用于车载语音启动方法、装置、电子设备以及存储介质。

根据本公开的一方面,提供了一种车载语音启动方法,包括:

通过图像采集装置采集车内人员的图像信息;

若根据所述车内人员的图像信息确定所述车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别;

若所述语音信息中包括语音唤醒指令,则启动车载语音助手,用于与所述车内人员进行语音交互。

根据本公开的一方面,提供了一种车载语音启动装置,包括:

图像采集模块,用于通过图像采集装置采集车内人员的图像信息;

语音识别模块,用于若根据所述车内人员的图像信息确定所述车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别;

语音启动模块,用于若所述语音信息中包括语音唤醒指令,则启动车载语音助手,用于与所述车内人员进行语音交互。

根据本公开的一方面,提供了一种电子设备,该电子设备包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例中任一项所述的车载语音启动方法。

根据本公开的一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例中任一项所述的车载语音启动方法。

根据本申请的技术能够提高车载语音启动的安全性。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1是根据本申请实施例提供的一种车载语音启动方法的流程示意图;

图2是根据本申请实施例提供的另一种车载语音启动方法的流程示意图;

图3是根据本申请实施例提供的又一种车载语音启动方法的流程示意图;

图4是根据本申请实施例提供的又一种车载语音启动方法的流程示意图;

图5是根据本申请实施例提供的一种车载语音启动装置的结构示意图;

图6是用来实现本申请实施例的车载语音启动方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本申请实施例提供的车载语音启动方法的流程示意图。本实施例可适用于安全启动车机上车载语音助手的情况。本实施例公开的车载语音启动方法可以由电子设备执行,具体可以由车载语音启动装置来执行,该装置可以由软件和/或硬件的方式实现,配置于车机系统中。参见图1,本实施例提供的车载语音启动方法包括:

S110、通过图像采集装置采集车内人员的图像信息。

其中,图像采集装置是指可以安装在车辆上的摄像头,例如在车辆上安装至少一个车载摄像头,摄像头的采集范围可以覆盖车辆上任一角落,实现对车辆上任一位置的车内人员进行图像采集。对车内人员采集的图像信息包括人脸图像或者人员的表情图像等,图像信息用于对车内人员的身份进行确定。

具体的,当车辆上的车机系统启动时,自动启动图像采集装置对车内人员进行图像信息采集,从而通过采集到的图像信息对车内人员进行身份识别。由于图像信息是在车机系统启动时默认采集的,实现对车内人员身份的自动识别,提高用户的使用体验感,避免过多的操作带来的繁琐步骤。可选的,在车机系统处于启动状态时,图像采集装置也保持开启状态,实现当车内人员发生变动时,随时对变动情况进行反应,提高车载语音启动判断的准确性和效率。

S120、若根据车内人员的图像信息确定车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别。

车主可以为车辆设置合法人员,例如将车主本人或者信任的人员设置为该车辆的合法人员,合法人员可以对车载语音助手进行启动。示例性的,在车机设置中心设置合法人员管理模块,车主可以凭管理密码进入合法人员管理模块中,添加或删除合法人员的图像信息。

具体的,将图像采集装置采集到的车内人员的图像信息与车主预先设置的合法人员的图像信息进行匹配,若存在任一车内人员的图像信息匹配成功,则确定该车辆内存在至少一个车主认可的合法人员,直接启动车载语音助手;若车内人员的图像信息均与车主预先设置的合法人员的图像信息匹配失败,表示车内人员均不是车主的认可人员,属于车辆的合法人员之外的其他人员,则对语音采集装置监听到的语音信息进行识别。

车主除了可以设置车载语音助手的合法使用人员外,还可以设置语音唤醒指令,通过对语音唤醒指令的预先设置实现可以通过多种方式对车载语音助手进行启动。示例性的,在车载摄像头出现故障,无法通过图像信息进行识别的情况下,或者在车主将车借给合法人员以外的其他人员使用的情况下,通过图像信息无法对车载语音助手进行启动,则启动语音识别方案对车载语音助手的启动时机进行确定。

在车机系统被启动后,通过采集到的图像信息进行车内人员身份识别,若身份识别失败,则转由通过语音信息进行识别,实现了多种功能配合启动车载语音助手,提高车载语音启动的安全性和效率。

S130、若语音信息中包括语音唤醒指令,则启动车载语音助手,用于与车内人员进行语音交互。

其中,语音唤醒指令是指通过预先设置的方式对车载语音助手进行触发指令。例如通过说出包含预先设置的唤醒词的语音唤醒指令,实现启动车载语音助手的功能。语音唤醒指令可以根据车主的实际设置触发机制进行确定。车载语音助手是指可以通过语音实现与车机的交互,从而通过语音控制车机完成一系列的功能操作。

具体的,在确定车内人员中均不是车辆的合法人员时,基于对监听到的语音信息的识别结果,确定语音信息中是否包括预先设置的语音唤醒指令,若包括语音唤醒指令,则启动车载语音助手,此时车内人员可以通过语音实现与车机的交互。

示例性的,当车主将车辆外借给非合法人员以外的其他人员时,可以将预先设置的语音唤醒指令告知其他人员,其他人员在进入车辆,启动车机系统时,图像采集装置自动确定该人员身份无法通过图像信息启动车载语音助手,则根据监听到的其他人员的语音信息进行确定,若接收到包括语音唤醒指令的语音信息,表示该其他人员也是车主认可的人员,启动车载语音助手。由此实现只有特定人员才能启动车载语音助手,并且该特定人员受车主设置,实现车载语音的安全性,避免无关人员启动车载语音助手,造成车主个人信息的泄露。

本申请实施例的技术方案,通过采集到的图像信息对车辆的车内人员进行身份识别,确定车内人员中是否均是车辆的合法人员以外的其他人员,若是则转由通过监听到的语音信息进行身份识别,实现了通过多种启动方式配合完成车载语音助手的启动,提高车载语音启动的安全性和效率。

图2是根据本申请实施例提供的另一种车载语音启动方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图2,本实施例提供的车载语音启动方法包括:

S210、通过图像采集装置采集车内人员的图像信息。

S220、若根据车内人员的图像信息确定车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别。

S230、若语音信息中包括语音唤醒密码,则确定监听的语音信息中包括语音唤醒指令。

其中,语音唤醒密码是指车主预先设置的特定语音片段,该特定语音片段中可以包括由词语、单词或者数字的任意组合。

具体的,对监听到的语音信息进行识别,从监听到的连续语流中检测到该特定语音片段,则表示语音信息中包括语音唤醒密码,即确定监听的语音信息中包括语音唤醒指令。示例性的,车机系统在开启后,开启语音监听功能,并保持语音监听功能,以应对车内人员随时说出的语音唤醒密码。

可选的,语音唤醒密码可以包括多个,且每个语音唤醒密码存在对应的有效时长,车主可以根据实际情况给其他人员不同的语音唤醒密码,以实现控制其他人员对车载语音助手的启动控制。示例性的,车主预先设置两个语音唤醒密码A和B,其中,密码A的有效时长为一天,密码B的有效时长为一周,则根据其他人员借车的时间或者车主的信任程度告知其他人员密码A或密码B。

S240、若语音信息中包括语音唤醒指令,则启动车载语音助手,用于与车内人员进行语音交互。

本申请实施例的技术方案,通过对语音信息中预先设置的语音唤醒密码的识别,确定是否接收到车内人员的语音唤醒指令,实现了车辆的合法人员以外的其他人员可以通过语音唤醒密码发起语音唤醒指令,从而启动车载语音助手,丰富了车载语音助手启动的方式,并且保证了车载语音助手启动的安全性,从而保护车主的个人信息。

图3是根据本申请实施例提供的又一种车载语音启动方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图3,本实施例提供的车载语音启动方法包括:

S310、通过图像采集装置采集车内人员的图像信息。

S320、若根据车内人员的图像信息确定车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别。

S330、若语音信息中包括语音唤醒词,则提示用户输入语音唤醒密码。

其中,语音唤醒词是指预先设置的特定语音片段,与语音唤醒密码不同,语音唤醒词可以是固定不变的,且具有简短便于记忆的特点。语音唤醒词用于对车内人员使用车载语音助手的需求进行表示,从而对车载语音的监听功能开启进行控制。车载语音在未接收到语音唤醒词时处于低功耗运行状态,自动过滤非语音唤醒词的所有语音片段,一旦接收到语音唤醒词则启动语音监听识别的正常状态,对所接收到的所有语音进行语义识别,进而提高语音监听的效率。

示例性的,车内人员均属于其他人员时,对监听到的语音信息进行识别,识别结果中包括语音唤醒词,则车机系统进行反馈,以提示用户需要输入语音唤醒密码。提示方式可以根据不同的需求进行确定,示例性的,在接收到语音唤醒词后,语音播报请输入语音唤醒密码;或者采用特定的声音表示监听功能已开启,车内人员可以进行输入密码。

可选的,监听到语音信息中包括语音唤醒词后,若在预定时间范围内未接收到车内人员输入的语音唤醒密码或者多次输入语音唤醒密码错误,则退出语音监听并反馈车内人员。示例性的,如果在接收到语音唤醒词后十秒内未接收到语音消息,或者连续三次接收到错误的语音唤醒密码,则语音播报反馈用户语音监听已退出。例如播报“小达先退下了,下次有需要继续叫我哦”。在车内人员第一次或者第二次输入错误的语音唤醒密码后,语音提示错误,提示车内人员重新输入。

S340、若检测到用户输入语音唤醒密码,则确定监听的语音信息中包括语音唤醒指令。

S350、若语音信息中包括语音唤醒指令,则启动车载语音助手,用于与车内人员进行语音交互。

本申请实施例的技术方案,通过语音唤醒词实现对语音监听功能的控制,在监听到语音唤醒词后启动正常语音监听功能,避免车机系统时刻保持语音监听功能造成对资源的浪费。并且本申请通过设置语音唤醒词以及语音唤醒密码为合法人员以外的其他人员提供一个使用车载语音助手的方式,同时该方式受车主控制,在保证车主个人信息安全性的同时,提高了车载语音助手启动的效率,保证用户的使用体验感。

图4是根据本申请实施例提供的又一种车载语音启动方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图4,本实施例提供的车载语音启动方法包括:

S410、通过图像采集装置采集车内人员的图像信息。

在一个可行的实施例中,包括:

根据监听到的语音信息确定声源方向;

通过图像采集装置采集位于声源方向的车内人员的图像信息。

在车机系统启动后,根据监听到的语音信息进行声源方向的判断,确定当前说话的人员所坐的位置,并对该位置上的车内人员进行图像信息的采集。示例性的,当车辆上有人员启动车机系统后,并且发出声音,则对发出声音的人员进行图像信息的采集。通过采集声源方向的车内人员的图像信息提高了对图像信息采集的精准度,尤其对于车内人员很多的情况下,避免过多的图像信息的采集造成车载语音启动判断效率低。

可选的,根据监听到的语音信息确定语音唤醒词的声源方向。示例性的,当车辆上有人员启动车机系统后,通过对监听到的语音信息进行识别,确定说出语音唤醒词的人员所处的位置为声源方向。从而避免了对无关人员图像信息的采集,提高身份确定的效率。

可选的,车机系统在启动后,通过图像采集装置采集车内所有人员的图像信息,从而根据车内人员的图像信息确定车内人员中是否存在车辆的合法人员。由于图像信息的采集不需要车内人员的特定唤醒词,因此可以实现当车内人员中存在合法人员时,则在用户无感知的情况下唤醒车载语音助手,提高合法人员对车载语音助手的使用效率和体验感。

可选的,车机系统在启动后,通过图像采集装置采集车内特定位置的车内人员的图像信息,如主驾驶位置或者副驾驶位置上的人员。避免对图像信息的过多采集造成身份识别效率低。

S420、根据车内人员的图像信息确定车内人员是否为车辆的合法人员之外的其他人员;若是,则顺序执行步骤430和440,否则,执行步骤450。

将获取到的车内人员的图像信息与合法人员的图像信息进行匹配,若车内人员的图像信息与合法人员的图像信息均不一致,则匹配失败,表示车内人员中均是车辆的合法人员之外的其他人员,则开通语音开启车载语音助手的功能,即执行步骤430和步骤440,通过对车内人员的语音信息进行识别,确定车内人员是否说出语音唤醒指令,若说出,则启动车载语音助手。

若车内任一人员的图像信息与合法人员的任一图像信息一致,则匹配成功,表示车内人员中存在至少一个车辆的合法人员,则执行步骤450,车辆中存在合法人员则可以直接启动车载语音,实现合法人员无需操作直接开启车载语音助手,即上车就可以直接与车载语音助手进行交互,提高合法人员的使用体验感。

在一个可行的实施例中,还包括:

若车内人员的图像信息中的人脸图像与车辆的白名单人员的人脸图像匹配失败,或者图像信息中的人脸表情与车辆的唤醒表情匹配失败,则确定车内人员为车辆的合法人员之外的其他人员。

其中,图像信息包括人脸图像和人脸表情。车辆的合法人员的确定需要同时依据人脸图像的匹配结果和人脸表情的匹配结果。

预先设置车辆的白名单人员的人脸图像以及唤醒表情。可选的,唤醒表情可以为一个,或者为白名单人员中不同的合法人员设置对应的唤醒表情,即每个合法人员对车载语音助手启动唤醒的表情不同,提高车载语音助手唤醒的安全性。

若车内人员的图像信息中的人脸信息与车辆的白名单人员中任一人脸图像匹配成功,且该匹配成功的车内人员的人脸表情与该白名单人员的唤醒表情匹配成功,则确定车内人员存在车辆的合法人员。

若车内人员的图像信息中的人脸信息与车辆的白名单人员的人脸图像均不匹配;或者车内人员的图像信息中的人脸信息与车辆的白名单人员中任一人脸图像匹配成功,但是该匹配成功的车内人员的人脸表情与该白名单人员的唤醒表情匹配失败,则确定车内人员为车辆的合法人员之外的其他人员。

此外,对于车辆的白名单人员可以由车主进行自行设置,包括增加、删除以及更新。示例性的,车主可以通过车载摄像头实现合法人员的多个维度的脸部信息采集,并且将信息存储云端,同时车主可以删除已录入的脸部信息或者重新录入。

结合人脸图像和人脸表情同时对车内人员是否是车辆的合法人员进行判断,提高了对合法人员判断的准确性,并且结合人脸图像和人脸表情的识别结果避免了假体图像的恶意攻击,例如其他人员拿着车主的照片对车载语音助手进行恶意攻击。

S430、对监听到的语音信息进行识别。

S440、若语音信息中包括语音唤醒指令,则启动车载语音助手,用于与车内人员进行语音交互。

S450、启动车载语音助手。

根据车内人员的图像信息确定车内人员中存在任一车辆的合法人员时可以直接启动车载语音助手,实现合法人员无需操作直接启动车载语音助手,即上车就可以直接与车载语音助手进行交互,提高合法人员对车载语音助手的使用体验感。

在一个可行的实施例中,若通过车内人员的图像信息启动车载语音助手,则确定车载语音助手的有效时长为第一时长;

若通过语音信息启动车载语音助手,则确定车载语音助手的有效时长为第二时长;

其中,第一时长大于第二时长。

其中,有效时长用于对车载语音助手的开启持续时长进行控制。

具体的,为通过车内人员的图像信息方式启动车载语音助手,设置车载语音助手的开启持续时长为第一时长,若通过车内人员的图像信息方式启动车载语音助手的已开启时长超过第一时长则自动关闭车载语音助手。

为通过车内人员的语音信息方式启动车载语音助手,设置车载语音助手的开启持续时长为第二时长,若通过车内人员的语音信息方式启动车载语音助手的已开启时长超过第二时长则自动关闭车载语音助手。

并且,由于通过车内人员的图像信息启动车载语音助手表示车内存在车主认可的合法人员,而通过车内人员的语音信息启动车载语音助手表示车内均不是合法人员,且车内人员只是被车主临时授权的人员,因此第一时长大于第二时长。

示例性的,设置第一时长为永久,第二时长为一天或者一周等,用于区分通过不同方式启动车载语音助手,保证通过语音信息启动车载语音助手的临时授权性,避免发生知道语音唤醒密码的其他人员多次通过同一个语音唤醒信息启动车载语音助手,给车主的个人信息安全性带来威胁。

本申请实施例的技术方案,通过采集到的图像信息对车辆的车内人员进行身份识别,确定车内人员中是否均是车辆的合法人员以外的其他人员,若否则直接启动车载语音助手,实现合法人员对车载语音助手的无感知触发,提高合法人员的使用体验感;若是则转由通过监听到的语音信息进行身份识别,实现了通过多种启动方式配合完成车载语音助手的启动,在不影响用户体验感的同时提高车载语音启动的安全性和效率。

图5是根据本申请实施例提供的车载语音启动装置的结构示意图。参见图5,本申请实施例公开了车载语音启动装置500,该装置500可以包括:

图像采集模块501,用于通过图像采集装置采集车内人员的图像信息;

语音识别模块502,用于若根据所述车内人员的图像信息确定所述车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别;

语音启动模块503,用于若所述语音信息中包括语音唤醒指令,则启动车载语音助手,用于与所述车内人员进行语音交互。

可选的,所述装置还包括:

图像启动模块,用于若根据所述车内人员的图像信息确定所述车内人员为车辆的合法人员,则启动车载语音助手。

可选的,所述装置还包括:

合法人员判断模块,用于若所述车内人员的图像信息中的人脸图像与所述车辆的白名单人员的人脸图像匹配失败,或者所述图像信息中的人脸表情与所述车辆的唤醒表情匹配失败,则确定所述车内人员为车辆的合法人员之外的其他人员。

可选的,所述装置还包括:

指令第一识别模块,用于若所述语音信息中包括语音唤醒密码,则确定监听的语音信息中包括语音唤醒指令。

可选的,还包括指令第二识别模块,用于

若所述语音信息中包括语音唤醒词,则提示用户输入语音唤醒密码;

若检测到用户输入所述语音唤醒密码,则确定监听的语音信息中包括语音唤醒指令。

可选的,还包括有效时长确定模块,用于:

若通过所述车内人员的图像信息启动车载语音助手,则确定所述车载语音助手的有效时长为第一时长;

若通过所述语音信息启动车载语音助手,则确定所述车载语音助手的有效时长为第二时长;

其中,所述第一时长大于所述第二时长。

可选的,所述图像采集模块具体用于:

根据监听到的语音信息确定声源方向;

通过图像采集装置采集位于所述声源方向的车内人员的图像信息。

本申请实施例所提供的车载语音启动装置可执行本申请任意实施例所提供的车载语音启动方法,具备执行车载语音启动方法相应的功能模块和有益效果。

根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。

如图6所示,是根据本申请实施例的车载语音启动的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的车载语音启动的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的车载语音启动的方法。

存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的车载语音启动的方法对应的程序指令/模块(例如,附图5所示的图像采集模块501、语音识别模块502以及语音启动模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及车载语音启动,即实现上述方法实施例中的车载语音启动的方法。

存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据车载语音启动的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存储存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至车载语音启动的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

车载语音启动的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息,以及产生与车载语音启动的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

本申请实施例的技术方案,通过采集到的图像信息对车辆的车内人员进行身份识别,确定车内人员中是否均是车辆的合法人员以外的其他人员,若是则转由通过监听到的语音信息进行身份识别,实现了通过多种启动方式配合完成车载语音助手的启动,提高车载语音启动的安全性和效率。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

相关技术
  • 车载语音启动方法、装置、电子设备和存储介质
  • 车载语音设备的测试方法、装置、电子设备和存储介质
技术分类

06120112149562