一种基于现有车辆的语音控制方法、装置、设备及车辆

文献发布时间：2024-07-23 01:35:12

技术领域

本发明涉及车辆技术领域，特别涉及一种基于现有车辆的语音控制方法、装置、设备及车辆。

背景技术

随着车辆的智能化的发展，现有的车辆中对于多媒体、座椅、氛围灯、空调等的控制越发智能，目前，主流车辆已经能够支持直接通过语音控制车辆的设施，对于车企来说，当开发的车辆在需求确定时，基本可以确定车辆使用的语言环境，因而语音的控制方面会针对车辆的语言环境进行设置。然而，还存在一种情况，就是当现有的车辆需要进一步开发出海外版时，或者是处于与当前车辆的语言环境不相适配的环境时，则需要对现有车辆的语音识别部分进行改进。

目前，行业内还未出现对于现有车辆的语音识别改进的方案。

发明内容

本申请实施例的主要目的在于提供一种基于现有车辆的语音控制方法、装置、设备及车辆，旨在扩大现有车辆的适用性，节约车辆的改进成本。

为实现上述目的，本申请实施例的一方面提出了一种基于现有车辆的语音控制方法，包括：获取语音数据；确定所述语音数据的语言类型；若所述语言类型不是目标语言类型，则将所述语音数据对应的语言类型转换为目标语言类型；基于所述目标语言类型对车辆进行控制；其中，所述目标语言类型为现有车辆支持的语言类型。

在一些实施例中，所述确定所述语音数据的语言类型，包括：将所述语音数据进行转换，得到对应的第一文本；通过语言检测的方法对所述第一文本进行检测，确定所述第一文本对应的语言类型，进而得到所述语音数据对应的语言类型。

在一些实施例中，所述将所述语音数据进行转换，得到对应的第一文本，包括：提取所述语音数据的每一帧中的音素信息；通过所述音素信息确定对应的单词；根据所述单词得到所述第一文本。

在一些实施例中，所述将所述语音数据对应的语言类型转换为目标语言类型，包括：将所述第一文本输入语言翻译模型，得到第二文本；其中，所述第二文本用于表征符合目标语言类型的所述语音数据对应的文本信息。

在一些实施例中，所述基于所述目标语言类型对车辆进行控制，包括：获取第二文本，所述第二文本是与所述目标语言类型对应的所述语音数据的文本信息；提取所述第二文本中的指令信息；基于所述指令信息对车辆进行控制。

在一些实施例中，所述提取所述第二文本中的指令信息，包括：将所述第二文本输入自然语言处理模型，得到所述第二文本中包括的指令信息。

在一些实施例中，所述基于所述指令信息对车辆进行控制，包括：确定所述指令信息对应的控制目标；通过所述控制目标对应的接口对所述控制目标进行控制。

为实现上述目的，本申请实施例的另一方面提出了一种基于现有车辆的语音控制装置，所述基于现有车辆的语音控制装置包括：获取模块，用于获取语音数据；确定模块，用于确定所述语音数据的语言类型；转换模块，用于若所述语言类型不是目标语言类型，则将所述语音数据对应的语言类型转换为目标语言类型；控制模块，用于基于所述目标语言类型对车辆进行控制；其中，所述目标语言类型为现有车辆支持的语言类型。

为实现上述目的，本申请实施例的又一方面提出了一种车机设备，所述车机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述的基于现有车辆的语音控制方法。

为实现上述目的，本申请实施例的又一方面提出了一种车辆，所述车辆包括上述实施例所述的一种基于现有车辆的语音控制装置或上述实施例所述的车机设备。

本申请实施例至少包括以下有益效果：

本申请提供一种基于现有车辆的语音控制方法、装置、设备及车辆，基于现有车辆的语音控制方法包括：获取语音数据，确定语音数据的语言类型，如果确定出的语言类型不是目标语言类型，那么将语音数据对应的语言类型转换为目标语言类型，之后基于目标语言类型对车辆进行控制，目标语言类型为现有车辆支持的语言类型，通过上述方式降低了现有车辆对于语音控制系统改进的成本，进一步扩大了现有车辆的适用性。

可以理解的是，本申请公开的装置、车机设备和车辆的有益效果与基于现有车辆的语音控制方法的有益效果相同，在此不再赘述。

本申请的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本申请实施例提供的基于现有车辆的语音控制方法的流程图；

图2是本申请实施例提供的基于现有车辆的语音控制系统的原理示意图；

图3是本申请实施例提供的基于现有车辆的语音控制装置的模块示意框图；

图4是本申请实施例提供的车机设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。以下示例性实施例中所描述的实施方式并不代表与本申请实施例相一致的所有实施方式，它们仅是与如所附权利要求书中所详述的、本申请实施例的一些方面相一致的装置和方法的例子。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念，但除非特别说明，这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。例如，在不脱离本申请实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“若”、“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”等，至少一个包括一个、两个或两个以上，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指多个中的任意一个。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

为了使本申请的发明构思易于理解，在对本申请实施例进行详细说明之前，首先对本申请实施例中涉及的英文缩写(术语)/相关概念进行说明，本申请实施例中涉及的英文缩写(术语)/相关概念适用于如下的解释。

车机：车机指的是安装在汽车里面的车载信息娱乐产品的简称，车机在功能上能够实现人与车，车与外界(车与车或车与云)的信息通讯。车机大多安装在中控台里面，有的车机主机和屏幕是在一起，有的车机主机和屏幕分离的。

TBOX:英文全称为telematics box，即远程/车载通信模块，T-BOX是车联网系统中的一个重要组成部分，是一个集成车身网络和无线通讯功能的智能终端设备，通过连接车载CAN总线和外部云平台，实现车辆与车辆(V2V)、车辆与基础设施(V2I)、车辆与互联网(V2N)之间的通信和数据交换。

API：英文全称为Application Programming Interface，即应用程序编程接口，是一些预先定义的函数，目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力，而又无需访问源码，或理解内部工作机制的细节。

NLP：英文全称为Natural Language Processing，即自然语言处理，是以语言为对象，利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具，在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。包括自然语言理解(Natural Language Understanding，NLU)和自然语言生成(Natural Language Generation，NLG)两部分。

现有的车辆在其需求确定的时候，其使用的语言环境也基本确定下来，且现有车辆往往立项较早，在其开发初期，由于技术的制约或需求的约束，并不具备多种语言的识别功能，其往往只能实现确定的语言的控制方式。但是当现有的车辆面对需求改版时，例如，基于国内应用市场开发的车辆需要开发海外版时，这时，需要在现有的国内版车辆的基础上进行改版，使其支持海外版的使用环境；这将主要涉及到车机的修改，需要车机能够支持多种语言的识别进一步基于多种语言对车辆进行控制。对于车机的改版方式有多种，每一种的技术实现难度和成本都是需要考虑的实际问题。

其中一种方案是：通过语音切换的方式，即通过语音控制修改使用语言，例如：需要用户说出“你好红旗，请修改语言为英语”，车内语音识别模块识别出该语音信息，将车内语言环境修改为英语环境。这种方式，需要在车机系统嵌入多种语音环境，并需要增加基于多种语音环境的控制指令的解析以对车辆进行控制，由于需要支持多种语言类别的指令解析，因此，需要对车辆中的各个可控模块或模块提供的接口进行适配和调试，工作量巨大，且需要嵌入多种语音环境，因此，对车机系统的运行性能提出了挑战，通过该种方式进行车机系统的改版，很可能造成车辆系统的不稳定。综上，这种方式并不是一个最优的选择方案。

还有一种方案是在中控中添加切换语言入口，对语言进行修改。一方面，这种方式需要用户手动对中控进行操作，增加了使用的复杂度，并降低用户的用车体验，不利于市场推广；另一方面，这种方式仍然不可避免的需要在车机系统嵌入多种语音环境，并需要增加基于多种语音环境的控制指令的解析以对车辆进行控制，同样具有调试工作量巨大，车机系统性能要求高的问题，且存在改版后的车辆系统不稳定的可能性。因此，这种方式也不是一个最优的选择方案。

有鉴于此，本申请提出了一种基于现有车辆的语音控制方法、装置、设备及车辆，该方案通过获取语音数据，确定语音数据的语言类型，如果确定出的语言类型不是目标语言类型，那么将语音数据对应的语言类型转换为目标语言类型，之后基于目标语言类型对车辆进行控制，目标语言类型为现有车辆支持的语言类型，通过上述方式降低了现有车辆对于语音控制系统改进的成本，进一步扩大了现有车辆的适用性，并有利于市场推广。

下面将结合附图详细描述本申请实施例提供的一种基于现有车辆的语音控制方法的实现步骤。

本申请实施例提供的方法，主要应用于车机中，车机可以是任意的型号，车机系统可以是QNX、Linux、安卓操作系统等，本申请实施例对车机的具体实现方式不做限定。在一些实施例中，车机中的运算也可以借由服务器进行，以适配现有车机的硬件性能。例如可以通过TBOX模块，将车机需要运算的数据发送至服务器端进行运算，之后将运算结果通过TBOX模块返回给车机进行进一步的处理和控制。其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络、以及大数据和人工智能平台等基础云计算服务的云服务器。

以上是对本申请实施例的实施环境的介绍。

本申请实施例还提供了一种基于现有车辆的语音控制方法，如图1所示，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示或描述的步骤。

本申请实施例的基于现有车辆的语音控制方法包括以下步骤：

步骤1：获得语音数据；

步骤2：确定获得的语音数据所对应的语言类型；

步骤3：若确定出来的语言类型不是目标语言类型，那么将语音数据所对应的语言类型转变为目标语言类型；

步骤4：通过转变后的目标语言类型控制车辆；

其中，目标语言类型是现有车辆能够支持或者已经支持的语言类型。

本申请实施例所示意的步骤1至步骤4，通过将识别出的不支持的语言类型转变为支持的语言类型进一步对车辆进行控制，以此提高了现有车辆的适应性，由于是使用目标语言对车辆进行的控制，因此节约了现有车辆语音控制改版的成本。

在一些实施例的步骤1中，可以通过车载麦克风来采集并获取语音数据，获取的语音数据可以是截取的输入语音中的部分语音信息，也可以是一条完成的语音信息，语音信息中应包括一条或者多条语音语句。语音数据可以为任意语种，例如，中文、英文、法文或韩文等。应理解，基于本申请实施例的运行环境，获得的有效的语音数据(即最终能够实现车辆控制的语音数据)应该是其中包括有具体的执行指令的语音数据。获取语音的方式可以通过点击语音输入界面提供的语音输入标签，以采集用户的语音数据，也可以点击表示语音控制的标签，对用户的语音信息进行采集。

示例性地，语音采集的具体实现代码，可以表示如下：

recognizer＝sr.Recognizer()

with sr.Microphone()as source:

print("请说话：")

audio＝recognizer.listen(source)

上述示例代码中，调用了recognizer.listen()函数将通过麦克风采集的音频数据转变为需要识别的语音数据。上述代码示例中，还会输出“请说话：”的提示符号，该提示符号可以通过显示屏以文字方式输出，也可以通过车载音响以语音提示方式输出，但不限于此。

本申请提供的实施例通过获取用户的语音数据，为后续的语言检测和转换以及对车辆的控制提供了数据基础。

在一些实施例的步骤2中，对获取到的语音数据，需要确定其对应的语言类型。

可选地，可以将语音数据转换为第一文本，之后再对第一文本进行语言类别的识别。

可以通过提取语音数据中的每一帧中的音素信息，之后通过提取的音素信息确定其对应的单词，之后再根据确定的单词得到转换后的第一文本。

可选地，可以通过语音识别模型将用户的语音数据转换为第一文本。其中，语音识别模型可以为自动语音识别(Automatic Speech Recognition，ASR)模型。自动语音识别模型能够将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。示例性地，可以使用现有的语音识别库或者API，例如，Google Speech-to-Text、百度语音识别等方式将语音数据转换为文本数据(第一文本)。

示例性地，语音进行文本转换的具体实现代码，可以表示如下：

text＝recognizer.recognize_google(audio,language＝'zh-CN')

print("你说的是：",text)

上述示例代码中，调用了speech_recognition库中的recognize_google函数，基于该函数将语音数据(audio)转换为中文输出的第一文本(text)，并将text进行输出。同上，输出的text的内容可以通过显示屏以文字方式输出，也可以通过车载音响以语音提示方式输出，但不限于此。

在一些实施例中，还会通过语言检测的方法对第一文本进行检测分析，进而得到第一文本对应的语言类型，由此确定出语音数据所对应的语言类型。

可选地，可以基于现有的语言检测库或API，如langdetect、fasttext等对第一文本进行检测分析。langdetect库的设计是基于Google的语言检测库(the language-detection library)。其核心原理主要基于“字符的n元模型”。n元模型是一种统计语言模型，考虑了文本中的字符序列。例如，一个“三元模型”(3-gram)会考虑文本中所有连续的3个字符的序列。n元模型可以捕捉文本中的局部结构和模式。langdetect主要依赖字符的n元模型来构建和比较语言配置文件。当给定一个待检测语言的文本时，langdetect会计算该文本的n-gram，并与所有可用的语言配置文件进行比较，通过比较，会计算文本与每种语言配置文件的相似度，并将文本分类为最相似的语言配置文件所代表的语言。FastText是一款快速文本分类器，提供简单而高效的文本分类和表征学习的方法。

示例性地，使用中可以先导入langdetect库，之后，通过调用detect函数，通过detect函数检测出输入的文本的语言类型。

示例性地，文本的语言类型识别的具体实现代码，可以表示如下：

pip install langdetect

from langdetect import detect

language＝detect(text)

print("语言类型：",language)

上述示例代码中，调用了langdetect库中的detect函数，对上一个示例中的中文输出的第一文本(text)进行检测，得到检测结果(language)并以“语言类型：”的形式进行输出。可选地，“语言类型：”也可以不输出，这个根据具体的使用环境和需求进行灵活设置，另外，如果输出的话，那么输出的语言类型的内容可以通过显示屏以文字方式输出，也可以通过车载音响以语音提示方式输出，但不限于此。

本申请实施例通过对获取到的语音数据确定其对应的语言类型，为后续将该语音类型转变为目标语言类型提供了依据，如果获取的语言类型为目标语言类型，则可以直接通过获取的语言类型进行车辆的控制。

在一些实施例的步骤3中，如果确定出来的语言类型不是目标语言类型，那么将语音数据所对应的语言类型转变为目标语言类型。

示例性地，现有车辆根据其立项时的需求是面向国内市场，因此，其车机系统中的语音控制模块已经能够支持汉语的普通话的识别和通过普通话进行车辆的一些模块的控制，根据新提出的需求，现有车辆需要能够支持英语、德语、法语等，或者能够支持国内地区的主要方言，例如粤语、温州语或者陕西方言等对车辆的控制，因此，对于识别出来的对应的语言类型需要将其转换为现有车辆已经能够支持的普通话，并基于普通话对车辆进行控制。

可选地，如果识别出的语言类型不是目标语言(例如：汉语)，则可以通过将步骤2中检测出的文本信息输入语言翻译模型，得到符合目标语言类型(例如：汉语)的语音数据对应的文本信息(第二文本)。

示例性地，语言翻译模型可以是Google Translate或者百度翻译等。具体的，可以使用其提供的API，在程序中调用对应的翻译模块，实现对文本的翻译。

示例性地，使用中可以先由googletrans导入Translator函数，通过Translator函数对第一文本进行翻译，得到符合目标语言类型的第二文本。

示例性地，对第一文本的翻译的具体实现代码，可以表示如下：

if language！＝'en':

translator＝Translator()

text_translated＝translator.translate(text,src＝language,dest＝'en').text

print("翻译后的文本：",text_translated)

else:

text_translated＝text

上述示例代码中，目标语言以英语为例，通过调用Translator中的translate函数，得到翻译文本，其中翻译文本的语言类型根据参数dest确定。上述代码示例中，参数dest被赋值为“en”即英语，因此，翻译之后的文本为英文文本。之后，将翻译之后的英文文本以“翻译后的文本：”的形式进行输出。可选地，“翻译后的文本：”也可以不输出，或者以其他语言形式输出，这个根据具体的使用环境和需求进行灵活设置。另外，如果输出的话，那么输出的语言类型的内容可以通过显示屏以文字方式输出，也可以通过车载音响以语音提示方式输出，但不限于此。

本申请实施例通过将识别出的非目标语言类型的文本转变为目标语言类型，进而可以基于目标语言类型对现有车辆进行控制，以此节约了开发支持多种语音类型的语音控制系统所需的资源，使得现有车辆能够在多种语音环境下仍然能够实现语音控制功能，而不必对现有车辆的语音控制模块(指令控制部分)进行大的修改或者调整，现有车辆仍然可以继续使用已经存在的语音控制模块(指令控制部分)对车辆进行控制，不仅提高了改版的开发效率也保障了车机运行的稳定性。

在一些实施例的步骤4中，可以直接通过转变后的目标语言类型对车辆实施控制。具体地，当得到与车辆已经支持的目标语言类型所对应的语音数据的第二文本之后，提取出第二文本中的可能的指令信息，并基于提取出的指令信息控制车辆中的一些设施。

可选地，可以将符合目标语言类型的第二文本输入到自然语言处理模型(NLP)，以提取出第二文本中可能包括的指令信息。示例性地，可以使用关键词提取或依存句法分析等方法对第二文本中的指令信息进行提取。

示例性地，使用中可以先导入nltk库，其中，nltk其英文全称为：NaturalLanguage Toolkit，是一个Python自然语言处理工具库，能够为自然语言处理(NLP)提供一个完整的、易于使用的工具集。通过nltk中提供的函数，能够对输入的文本进行处理，例如，指令信息的提取。

示例性地，对第二文本中的指令分析的具体实现代码，可以表示如下：

tokens＝nltk.word_tokenize(text_translated)；

keywords＝[word for word in tokens if word in['open','music','player']]；

上述示例代码中，目标语言以英语，指令以打开音乐播放器为例，通过调用nltk中的word_tokenize函数，得到第二文本中包括的词，其中，word_tokenize是nltk库提供的其中一种分词函数，通过word_tokenize可以将输入的文本中的词语提取出来，之后，通过将提取出的词语和指令中的词语进行比较判断，分析出第二文本中可能存在的指令信息。上述代码示例中，进行比较的指令信息包括‘open’、‘music’、‘player’，如果第二文本中也包括对应的字符，则可以确认，第二文本中包括的指令信息是打开音乐播放器。可选地，对于识别的指令信息可以输出以进一步确认，也可以不输出，根据具体的使用环境和需求进行灵活设置，另外，如果输出的话，那么输出的指令信息的内容可以通过显示屏以文字方式输出，也可以通过车载音响以语音提示方式输出，但不限于此。

可选地，可以基于提取出的指令信息控制车辆中的一些设施。具体地，需要首先确定指令信息对应的控制目标，之后，通过控制目标对应的接口对控制目标进行控制。

示例性地，通过对第二文本的分析，确定出其指令信息包括：打开音乐播放器，则可以确定指令信息对应的控制目标是音乐播放器，执行的操作是打开，因此，可以通过音乐播放器提供的API调用相关功能模块，打开音乐播放器。

请参照图2，图2是本申请实施例提供的基于现有车辆的语音控制系统的原理示意图，语音控制系统包括语音识别模块、语言类型转换模块、指令分析模块以及车载空调、收音机、网络、多媒体、导航仪、APP和车身控制模块但不限于此。通过语音识别模块对捕获的语音信息进行识别，之后将识别出的语音信息对应的语言类型，通过语言类型转换模块转换为现有车辆支持的目标语言类型，如果识别出语音对应的语言类型为目标语言类型则可以不经转换，直接输入指令分析执行模块进行指令的分析和执行，也就是说，输入指令分析执行模块的语言类型为目标语言类型；之后通过指令分析执行模块执行指令，具体的指令的操作对象可以是车辆支持的APP、空调设备、收音机、车身控制模块、网络、多媒体设备和导航仪等。指令可以包括打开、关闭、收音机的频段搜索、频段调节、空调的温度调节、网络中蓝牙的连接、控制通话、多媒体设备的播放、暂停、快进、快退、切换、导航设备的路径规划、目的地设置、车身控制模块中的车窗控制、灯光控制、门锁控制、雨刷控制等。

需要说明的是，对于上述方法的执行，可以直接在车机端执行，也可以将具体的执行指令进行封装，通过TBOX发送至服务器，借助服务器的算力进行运算，并将运算结果返回给车机端，车机端基于服务器返回的结果依据现有的控制方式对车辆进行控制。应理解，服务器只是提供算力，具体的执行方式是通过车机端确定的。这样可以进一步节约车机端的改版成本，可以在不改变车机端现有硬件支持能力的情况下，使车机端支持多种语言的语音控制。

以上实施例介绍了基于现有车辆的语音控制方法的实施方式，下面将结合附图详细描述本申请实施例提供的基于现有车辆的语音控制装置的实施方式。

对于上述实施例所提供的基于现有车辆的语音控制方法，本申请实施例还提供了基于现有车辆的语音控制装置，用于实现上述方法，如图3所示，图3是本申请实施例提供的基于现有车辆的语音控制装置的模块示意框图，基于现有车辆的语音控制装置包括：

获取模块，用于获得语音数据；

确定模块，用于确定获得的语音数据所对应的语言类型；

转换模块，用于若确定出来的语言类型不是目标语言类型时，那么将语音数据所对应的语言类型转变为目标语言类型；

控制模块，用于通过转变后的目标语言类型控制车辆；

其中，目标语言类型为现有车辆支持的语言类型。

可以理解的是，上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

本申请实施例还提供了一种电子设备，如图4所示，电子设备包括存储器，一个或多个处理器(图4中仅示出一个)及存储在存储器上并可在处理器上运行的计算机程序。其中：存储器用于存储软件程序以及单元，处理器通过运行存储在存储器的软件程序以及单元，从而执行各种功能应用以及数据处理，以获取上述预设事件对应的资源。可选地，处理器通过运行存储在存储器的上述计算机程序时实现上述基于现有车辆的语音控制方法。

存储器作为一种非暂态计算机可读介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。

可以理解的是，上述方法实施例中的内容均适用于本电子设备实施例中，本电子设备实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

本申请实施例还提供了一种车辆，车辆包括上述的车机设备或基于现有车辆的语音控制装置或上述的电子设备的电驱动总成。具体地，车辆可以为私家车，例如轿车、SUV、MPV或皮卡等。车辆也可以为运营车，例如面包车、公交车、小型货车或大型拖挂车等。车辆可以为油车也可以为新能源车。当车辆为新能源车时，其可以为混动车，也可以为纯电车。

可以理解的是，上述方法实施例中的内容均适用于本车辆实施例中，本车辆实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

本申请实施例还提供了一种计算机程序产品，上述计算机程序产品包括计算机程序，上述计算机程序被一个或多个处理器执行时能够实现如上述基于现有车辆的语音控制方法的步骤。

可以理解的是，上述方法实施例中的内容均适用于本计算机程序产品中，本计算机程序产品实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

本申请实施例提供的基于现有车辆的语音控制方法、装置、车机设备、车辆及计算机程序产品，通过获取音频数据，确定音频数据的语言类型，如果确定出的语言类型不是目标语言类型，那么将音频数据对应的语言类型转换为目标语言类型，之后基于目标语言类型对车辆进行控制，目标语言类型为现有车辆支持的语言类型，通过上述方式降低了现有车辆对于语音控制系统改进的成本，使得现有的车辆在较小的改动下能够支持多种语言类型的语音控制，节约了车辆改版的开发时间，并降低了改版所需的成本，扩大了现有车辆的适用性，有利于对现有车辆的市场推广。

本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

尽管本文描述了具体实施方案，但是本领域中的普通技术人员将认识到，许多其它修改或另选的实施方案同样处于本公开的范围内。例如，结合特定设备或组件描述的功能和/或处理能力中的任一项可以由任何其它设备或部件来执行。另外，虽然已根据本公开的实施方案描述了各种例示性具体实施和架构，但是本领域中的普通技术人员将认识到，对本文所述的例示性具体实施和架构的许多其它修改也处于本公开的范围内。

上文参考根据示例性实施方案所述的系统、方法、系统和/或计算机程序产品的框图和流程图描述了本公开的某些方面。应当理解，框图和流程图中的一个或多个块以及框图和流程图中的块的组合可分别通过执行计算机可执行程序指令来实现。同样，根据一些实施方案，框图和流程图中的一些块可能无需按示出的顺序执行，或者可以无需全部执行。另外，超出框图和流程图中的块所示的那些部件和/或操作以外的附加部件和/或操作可存在于某些实施方案中。

因此，框图和流程图中的块支持用于执行指定功能的装置的组合、用于执行指定功能的元件或步骤的组合以及用于执行指定功能的程序指令装置。还应当理解，框图和流程图中的每个块以及框图和流程图中的块的组合可以由执行特定功能、元件或步骤的专用硬件计算机系统或者专用硬件和计算机指令的组合来实现。

本文所述的程序模块、应用程序等可包括一个或多个软件组件，包括例如软件对象、方法、数据结构等。每个此类软件组件可包括计算机可执行指令，所述计算机可执行指令响应于执行而使本文所述的功能的至少一部分(例如，本文所述的例示性方法的一种或多种操作)被执行。

软件组件可以用各种编程语言中的任一种来编码。一种例示性编程语言可以为低级编程语言，诸如与特定硬件体系结构和/或操作系统平台相关联的汇编语言。包括汇编语言指令的软件组件可能需要在由硬件架构和/或平台执行之前由汇编程序转换为可执行的机器代码。另一种示例性编程语言可以为更高级的编程语言，其可以跨多种架构移植。包括更高级编程语言的软件组件在执行之前可能需要由解释器或编译器转换为中间表示。编程语言的其它示例包括但不限于宏语言、外壳或命令语言、作业控制语言、脚本语言、数据库查询或搜索语言、或报告编写语言。在一个或多个示例性实施方案中，包含上述编程语言示例中的一者的指令的软件组件可直接由操作系统或其它软件组件执行，而无需首先转换成另一种形式。

软件组件可存储为文件或其它数据存储构造。具有相似类型或相关功能的软件组件可一起存储在诸如特定的目录、文件夹或库中。软件组件可为静态的(例如，预设的或固定的)或动态的(例如，在执行时创建或修改的)。

上面结合附图对本申请实施例作了详细说明，但是本申请不限于上述实施例，在所属技术领域普通技术人员所具备的知识范围内，还可以在不脱离本申请宗旨的前提下作出各种变化。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：中国第一汽车股份有限公司;

上一篇：基于音乐基因表达编程的特定作曲风格音乐生成方法
下一篇：基于智能语音交互监管平台信息管理系统