掌桥专利:专业的专利平台
掌桥专利
首页

一种应用于车载设备的环境模拟方法、相关装置及设备

文献发布时间:2023-06-19 13:46:35


一种应用于车载设备的环境模拟方法、相关装置及设备

技术领域

本申请实施例涉及实车测试技术领域,尤其涉及一种应用于车载设备的环境模拟方法、相关装置及设备。

背景技术

随着AI智能语音发展的越来越迅猛,越来越多的人体验到AI智能语音的便利之处,AI智能语音也广泛应用到智能车载语音交互市场中,而语音交互系统的软硬件性能以及系统的功能、质量都无法保证,在出厂前都需要进行测试,比如语音唤醒率测试。

但是,这些测试数据大部分都是用人工去一次又一次的唤醒,另外还需要有一个人专门在旁边记录,这会大量浪费人力资源,并且人工介入测试环境中进行测试设备的调整或标定,来模拟装车以后的如车辆行驶的真实环境,容易受人为因素干扰大,出现人为误差,使得模拟出来的测试环境还原真实场景的还原度不高,从而导致获取到的测试数据准确降低。

发明内容

本申请实施例提供了一种应用于车载设备的环境模拟方法、相关装置及设备,用于通过实时环境信息中的实时环境音频信号确定环境模拟设备的目标调整参数,使得环境模拟设备可以根据目标调整参数进行调整,来动态优化车载模拟环境,不仅能够实现对整个车载模拟环境的远程控制,还能够避免因人工参与导致模拟环境中设备产生调整误差的情况,减少人力资源成本,降低人为因素的干扰,使得采集到的数据更为准确,并且能够快速的得到有效的数据。

获取目标场景的配置文件以及待播放文件,其中,配置文件是用于支持环境模拟设备模拟目标场景对应的车载模拟环境的初始配置参数和文件的集合,待播放文件包括环境噪声音频、第一对象的原音音频以及第二对象的干扰音频;

向环境模拟设备发送配置文件,以使环境模拟设备根据配置文件进行初始化;

向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境;

接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,其中,实时环境信息至少包括实时环境音频信号,实时环境音频信号包括车载语音设备的响应音频信号、车载播放设备的播放音频信号,以及环境模拟设备的背景噪声音频信号、原音音频信号和干扰音频信号;

根据实时环境音频信号确定环境模拟设备的目标调整参数;

向初始化后的环境模拟设备发送目标调整参数,以使环境模拟设备根据目标调整参数进行调整,以优化车载模拟环境。

本申请另一方面提供了一种应用于车载设备的环境模拟装置,包括:

获取单元,用于获取目标场景的配置文件以及待播放文件,其中,配置文件是用于支持环境模拟设备模拟目标场景对应的车载模拟环境的初始配置参数和文件的集合,待播放文件包括环境噪声音频、第一对象的原音音频以及第二对象的干扰音频;

发送单元,用于向环境模拟设备发送配置文件,以使环境模拟设备根据配置文件进行初始化;

发送单元,还用于向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境;

获取单元,还用于接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,其中,实时环境信息至少包括实时环境音频信号,实时环境音频信号包括车载语音设备的响应音频信号、车载播放设备的播放音频信号,以及环境模拟设备的背景噪声音频信号、原音音频信号和干扰音频信号;

处理单元,用于根据实时环境音频信号确定环境模拟设备的目标调整参数;

发送单元,还用于向初始化后的环境模拟设备发送目标调整参数,以使环境模拟设备根据目标调整参数进行调整,以优化车载模拟环境。

在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:

根据预设的配置条件获取与实时环境音频信号相对应的标准配置参数;

计算配置文件的原始配置参数与标准配置参数的差值,得到目标调整参数。

在一种可能的设计中,本申请实施例另一方面的一种实现方式中,处理单元具体可以用于:

对实时环境音频信号进行切分操作,得到响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号;

若响应音频信号、播放音频信号、背景噪声音频信号、原音音频信号和干扰音频信号之间的比重不符合比重阈值,则根据比重阈值获取调整参数,得到目标调整参数。

在一种可能的设计中,本申请实施例另一方面的一种实现方式中,

处理单元,还用于将所述实时环境图像与异常环境图像进行匹配,若匹配成功,则根据所述异常环境图像获取对应的异常修正参数;

发送单元,还用于向所述初始化后的环境模拟设备发送所述异常修正参数,以使所述环境模拟设备根据所述异常修正参数进行调整,以优化所述车载模拟环境。

在一种可能的设计中,本申请实施例另一方面的一种实现方式中,

发送单元,还用于将配置文件发送至环境接收设备,以使环境接收设备根据配置文件进行标准化;

获取单元具体可以用于:接收标准化后的环境接收设备采集到的与车载模拟环境相对应的实时环境信息。

在一种可能的设计中,本申请实施例另一方面的一种实现方式中,

获取单元,还用于获取声卡标识;

发送单元具体可以用于:向初始化后的环境模拟设备发送待播放文件以及声卡标识,以使初始化后的环境模拟设备调用与声卡标识相对应的目标声卡播放待播放文件,生成车载模拟环境。

本申请另一方面提供了一种计算机设备,包括:存储器、收发器、处理器以及总线系统;

其中,存储器用于存储程序;

处理器用于执行存储器中的程序时实现如上述各方面的方法;

总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。

本申请的另一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。

本申请的一个方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一方面所提供的应用于车载设备的环境模拟方法。

从以上技术方案可以看出,本申请实施例具有以下优点:

通过获取配置文件以及待播放文件,并向环境模拟设备发送配置文件,以使环境模拟设备根据配置文件进行初始化,进而向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境,然后,接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,根据实时环境音频信号确定环境模拟设备的目标调整参数,并向初始化后的环境模拟设备发送目标调整参数,以使环境模拟设备根据目标调整参数进行调整,以优化车载模拟环境。通过上述方式,能够实时接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,并根据实时环境信息中的实时环境音频信号确定环境模拟设备的目标调整参数,使得环境模拟设备可以根据目标调整参数进行调整,来动态优化车载模拟环境,不仅能够实现对整个车载模拟环境的远程控制,还能够避免因人工参与导致模拟环境中设备产生调整误差的情况,减少人力资源成本,降低人为因素的干扰,使得采集到的数据更为准确,并且能够快速的得到有效的数据。

附图说明

图1是本申请实施例中车载处理系统的一个架构示意图;

图2是本申请实施例中应用于车载设备的环境模拟方法的一个实施例流程图;

图3是本申请实施例中应用于车载设备的环境模拟方法的另一个实施例流程图;

图4是本申请实施例中应用于车载设备的环境模拟方法的另一个实施例流程图;

图5是本申请实施例中应用于车载设备的环境模拟方法的另一个实施例流程图;

图6是本申请实施例中应用于车载设备的环境模拟方法的另一个实施例流程图;

图7是本申请实施例中应用于车载设备的环境模拟方法的另一个实施例流程图;

图8是本申请实施例中应用于车载设备的环境模拟方法的一个原理流程示意图;

图9是本申请实施例中应用于车载设备的环境模拟方法的另一个原理流程示意图;

图10是本申请实施例中应用于车载设备的环境模拟装置的一个实施例示意图;

图11是本申请实施例中计算机设备的一个实施例示意图。

具体实施方式

本申请实施例提供了一种应用于车载设备的环境模拟方法、相关装置及设备,用于通过实时环境信息中的实时环境音频信号确定环境模拟设备的目标调整参数,使得环境模拟设备可以根据目标调整参数进行调整,来动态优化车载模拟环境,不仅能够实现对整个车载模拟环境的远程控制,还能够避免因人工参与导致模拟环境中设备产生调整误差的情况,减少人力资源成本,降低人为因素的干扰,使得采集到的数据更为准确,并且能够快速的得到有效的数据。

本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

随着信息的飞速发展,人工智能以及数据库(Database)也逐渐走入人们生活的方方面面。人工智能不仅在文本翻译以及情感分析等方面具有意义,还在智能问答以及语音交互等方面也具有广泛的实践意义。人工智能的出现,也极大地方便了人们的工作和生活。其中,人工智能是利用数学计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换而言之,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能是一门综合学科,涉及的领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能的基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统和机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。在自然语言处理技术中,人工智能可以用来处理文本,并对文本中的词语进行合理的解释。以及在机器学习/深度学习技术中,人工智能可以用来处理文本,并对文本中的词频或词语的重要度进行统计或解释。本申请实施例提供的应用于车载设备的环境模拟方法就可以通过机器学习/深度学习技术来实现。

应理解,本申请提供的应用于车载设备的环境模拟方法可以应用于实车测试技术领域,用于通过模拟车载真实环境完成对车载设备测试的场景中,作为示例,例如通过模拟车载真实环境完成车载语音交互系统的语音唤醒率测试;作为另一示例,例如通过模拟车载真实环境完成车载语音交互系统的语音识别率测试;作为另一示例,例如通过模拟车载真实环境完成车载语音交互系统的导航定位测试;作为另一示例,例如通过模拟车载真实环境完成车机播放器的语音唤醒率测试等,在上述种种场景中,为了实现还原车载真实环境的模拟,传统的语音交互系统的测试方法主要是通过人工去一次又一次的唤醒,另外还需要有一个人专门在旁边记录,这会大量浪费人力资源,并且人工介入测试环境中进行测试设备的调整或标定,来模拟装车以后的如车辆行驶的真实环境,容易受人为因素干扰大,出现人为误差,使得模拟出来的测试环境还原真实场景的还原度不高,从而导致获取到的测试数据准确降低。

为了解决上述问题,本申请提出了一种应用于车载设备的环境模拟方法,该方法应用于图1所示的车载处理系统,请参阅图1,图1为本申请实施例中车载处理系统的一个架构示意图,如图1所示,服务器通过获取配置文件以及待播放文件,并通过向环境模拟设备发送配置文件,以使环境模拟设备根据配置文件进行初始化,进而向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境,然后,接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,根据实时环境音频信号确定环境模拟设备的目标调整参数,并向初始化后的环境模拟设备发送目标调整参数,以使环境模拟设备根据目标调整参数进行调整,以优化车载模拟环境。通过上述方式,能够实时接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,并根据实时环境信息中的实时环境音频信号确定环境模拟设备的目标调整参数,使得环境模拟设备可以根据目标调整参数进行调整,来动态优化车载模拟环境,不仅能够实现对整个车载模拟环境的远程控制,还能够避免因人工参与导致模拟环境中设备产生调整误差的情况,减少人力资源成本,降低人为因素的干扰,使得采集到的数据更为准确,并且能够快速的得到有效的数据。

可以理解的是,图1中仅示出了一个终端设备,在实际场景中可以由更多种类的终端设备参与到数据处理的过程中,例如个人电脑(personal computer,PC)、笔记本电脑、掌上电脑、智能电视、智能手表、智能手机或车载终端(例如车载导航终端)等,具体数量和种类因实际场景而定,具体此处不做限定。另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,特别是在多模型训练交互的场景中,服务器的数量因实际场景而定,具体此处不做限定。

需要注意的是,本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdelivery network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,终端设备以及服务器可以连接组成区块链网络,本申请在此不做限制。

可以理解的是,如本申请所公开的应用于车载设备的环境模拟方法、相关设备以及装置,其中多个服务器/终端设备可以组成为一区块链,而服务器/终端设备为区块链上的节点。在实际应用中,可以在区块链中需要进行节点与节点之间的数据共享,每个节点上可以存储有车载环境数据等。

下面将对本申请中应用于车载设备的环境模拟方法进行介绍,请参阅图2,本申请实施例中应用于车载设备的环境模拟方法一个实施例包括:

在步骤S101中,获取目标场景的配置文件以及待播放文件,其中,配置文件是用于支持环境模拟设备模拟目标场景对应的车载模拟环境的初始配置参数和文件的集合,待播放文件包括环境噪声音频、第一对象的原音音频以及第二对象的干扰音频;

在本实施例中,当用户想要对车载设备进行测试,如语音交互系统的软硬件性能以及系统的功能进行测试,比如语音唤醒率测试时,可以通过在客户端的应用显示界面上执行项目选择的选择操作,可以使客户端感知到用户选择的项目或场景,即目标场景,则客户端可以根据该选择操作生成相应的测试或选择请求,并将携带有选择的项目或场景的标识的测试或选择请求发送至服务器,使得服务器可以根据选择的项目或场景的标识,在数据库中获取该项目或场景目录下存储的配置文件以及待播放文件,使得后续可以根据获取到的配置文件以及待播放文件来模拟和还原车辆行驶的真实场景,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,项目选择是多媒体软件工具提供可选择项目以及场景的功能,用于获取不同项目下的音频配置文件,并可以通过服务端接口动态获取项目信息或场景信息并展示在应用显示页面上。

其中,音频配置文件包括外设设备对应的配置文件,以及可以播放的音频文件,即待播放文件,配置文件与待播放文件具有对应关系,可以理解的是,每个项目或场景目录包含有至少一个音频配置文件,即包含有至少一个配置文件和至少一个待播放文件,其中,在不同场景目录中均可以有以“fileMatch.xls”命名的配置文件,还可以采用其他文件格式,此处不作具体限制。

其中,待播放文件环境噪声音频、第一对象的原音音频以及第二对象的干扰音频,环境噪声音频可以是在同一场景中,在不同的路段、不同时间点以及不同分贝值下采集的n个音频文件,其中,n为大于等于1的整数,因为实车会行驶在各种各样的开放场景中,如空旷的高速公路、吵闹的市中心、安静的乡村、安静的郊外或空旷的长隧道等开放道路或空间,还可以是其他场景,此处不作具体限制,从而可以采集到实车环境中各种分贝值下的噪声环境。

其中,噪声环境中的噪声是使人感到不愉快的声音的总称,人们通常用声级计测量声波的大小,声级的单位是分贝(dB),而正常人可以听到的最小的声音叫做听阈,听阈的声强为零分贝,能够使人耳开始产生疼痛感的声音叫做痛阈,痛阈为120分贝,其中,在实际日常应用中,可以感知的声音的分贝具体可以表现为人们轻声耳语时为30分贝,一般交谈时为60分贝,大声吵嚷时为80至90分贝,日常的汽车或机动车为20至100分贝左右,火车或手扶拖拉机等为100分贝左右,大炮发射、飞机起飞为130分贝左右。

其中,第一对象的原音音频指的是目标场景中位于主驾驶上的对象,在特定环境如安静的录音棚中录制的原声音频文件,具体可以表现为主驾驶上的对象与可能存在与车内其他位置上的其他人物对象之间的对话、主驾驶上的对象向车载语音设备发出的唤醒指令或者主驾驶上的对象拨打电话或哼歌或者发出感叹词等语料。

其中,第二对象的干扰音频指的是目标场景中位于副驾驶上的对象或车辆后排的对象,在特定环境如安静的录音棚中录制的原声音频文件,具体可以表现为分别与主驾驶上的对象之间的对话,副驾驶的上对象或车辆后排的对象拨打电话或哼歌或者发出感叹词等语料。

其中,配置文件为支持环境模拟设备模拟所述目标场景对应的车载模拟环境的初始配置参数和文件的集合,能够用于将车载设备调试至标准的文件,具体可以表现为调整电脑、人工嘴或播放器等设备的音量大小使分贝值达到配置文件所规定的标准,或者是将摄像机等摄像装置调整焦距达到配置文件所规定的标准等,还可以是其他配置参数,此处不作具体限制。

具体地,如图8所示,当用户在客户端的应用显示界面上执行了项目选择的选择操作,可以使客户端感知到用户选择的项目或场景,如静音场景、自燥场景或外燥场景等目标场景,还可以是其他项目或场景,此处不作具体限制,然后,客户端可以根据感知到的选择操作生成相应的测试或选择请求,客户端还可以根据感知到的选择操作给测试或选择请求赋予相应的项目或场景的标识,进而可以将携带有选择的项目或场景的标识的测试或选择请求发送至服务器,使得服务器可以根据接收到的项目或场景的标识,在数据库中进行索引或遍历,以快速匹配到与该项目或场景的标识对应的项目或场景目录,然后,可以准确获取到该项目或场景目录下存储的配置文件以及待播放文件,使得后续可以根据准确获取到的配置文件以及待播放文件来模拟和还原车辆行驶的真实场景,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,项目或场景的标识(identity,ID)可以用于指示用户选择的项目或场景,可以具体表现为整数(int)型的数字串,也可以具体表现为字符串等,此处不作具体限制。

其中,客户端的应用显示界面具体可以是使用开源框架(javafx)绘制搭建UI交互页面,还可以是使用其他框架搭建的界面,此处不作具体限制。

例如,假设用户在客户端的应用显示界面上选择的项目或场景为静音场景,则客户端可以生成选择的静音场景对应的静音场景测试请求,该静音场景测试请求可以携带有静音场景标识如A1,然后,客户端可以将携带有静音场景标识如A1的静音场景测试请求发送至服务器,使得服务器可以在数据库中索引到与静音场景标识如A1相对应的静音场景目录,并可以直接获取静音场景目录下存储的配置文件如人工嘴的播放分贝值为30分贝,以及待播放文件如郊区路段环境噪声1、导航语料1以及聊天干扰语料1。

可以理解的是,如图9所示,在获取配置文件以及待播放文件之前,本实施例还可以通过客户端将采集到的原始音频文件上传至服务器进行音频处理,以生成可以用于环境模拟的待播放文件,其中,服务器对获取到的原始音频文件进行音频处理具体可以是采用音频管理工具(sox)对原始音频文件进行音频处理,还可以是采用其他音频工具,此处不作具体限制。

进一步地,如图9所示,采用音频管理工具对原始音频文件进行音频处理具体可以是通过音频管理工具调用对应的执行脚本,分别对原始音频文件进行文件幅值归一化、文件合并、文件截取以及文件格式转换等处理,以得到待播放文件。

其中,文件幅值归一化是指将上传的所有原始音频文件的文件幅值都进行归一化处理。文件合并是指将归一化后的音频文件合并到相应的存储文件夹中的文件的头部,或者将归一化后的音频文件合并到存储文件夹中的文件的尾部,或者将归一化后的音频文件合并为一个文件。文件截取是指从头部截取文件,具体可以是根据输入的时间进行截取,或者从尾部截取文件,具体也可以是根据输入的时间进行截取。文件格式转换是指将上传的原始音频文件统一修改后缀名,转换为统一格式进行存储。

在步骤S102中,向环境模拟设备发送配置文件,以使环境模拟设备根据配置文件进行初始化;

在本实施例中,在获取到配置文件以及待播放文件之后,服务器可以向环境模拟设备发送配置文件,具体可以是通过任务盒子进行文件传输,任务盒子可以先对获取到的配置文件进行解析,解析得到配置数据包以及配置数据包对应的设备标识,然后,可以通过任务盒子可以将解析得到的配置数据包,发送至与设备标识相对应的环境模拟设备中,使得环境模拟设备可以根据获取到配置数据包中的配置参数对当前的设备参数进行调整,即对环境模拟设备进行初始化,使得环境模拟设备可以将设备参数调整至配置文件中所规定的标准,能够将环境模拟设备调试至标准状态,使得后续可以使用初始化后的环境模拟设备模拟车载模拟环境,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,任务盒子是与服务器以及终端设备建立了通信连接,以及与各个车载设备或外设设备建立长连接的远程信息处理器,能够用于对车内的各个设备以及各项功能进行控制,从而可以实现服务器以及终端设备对车内的各个设备以及各项功能的远程操控。

其中,任务盒子是与服务器以及终端设备建立通信连接具体可以是通过适用于网络请求的开源框架(Retrofit)+异步的基于事件的程序的库(RxJava)+开源的轻量级框架(OkHttp)的网络架构建立通信连接,还可以是通过其他网络架构,如安卓开源框架(xUtils)、网络通信框架(Volley)以及java原生的标准类(HttpURLConnection)以及开源框架(HttpClient),此处不作具体限制。

其中,环境模拟设备是用于模拟车载模拟环境时所需的外设设备,环境模拟设备具体可以表现为人工嘴、车机播放器以及高保真音箱等,还可以是其他播放设备,此处不作具体限制。

具体地,如图8所示,当获取到的配置文件以及待播放文件时,服务器可以通过任务盒子向环境模拟设备发送配置文件,具体可以是采用传输协议(SFTP)将配置文件发送至任务盒子,其中,SFTP使用加密传输认证信息和传输数据,使得数据传输更安全更稳定,然后,任务盒子接收到的配置文件后,任务盒子可以先对配置文件进行解析,具体可以是采用jxl-2.6.12.jar包对配置文件进行解压,以读取写入xls格式的配置文件,可以得到配置数据包以及配置数据包对应的设备标识,然后,可以通过任务盒子可以将解析得到的配置数据包,发送至与设备标识相对应的环境模拟设备如人工嘴中,使得人工嘴可以根据获取到配置数据包中的配置参数对当前的设备参数进行调整,比如对人工嘴进行粉噪调试,使得人工嘴的播放音量可以调整至配置文件中所规定的音量设定值,以达到待还原的真实场景所要求的分贝,使得后续可以使用粉噪调试后的人工嘴模拟车载模拟环境,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,粉噪调试是指可以单独控制环境模拟设备的左右双声道不同音量值,使得环境模拟设备的播放音量可以调整至配置文件中所规定的音量设定值,以达到实施场景所要求的分贝。

例如,假设环境模拟设备如人工嘴对应的配置文件中所规定的音量设定值为35至40分贝,则可以将人工嘴的播放音量调整至如36分贝。

在步骤S103中,向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境;

在本实施例中,在环境模拟设备初始化后,可以理解为,该环境模拟设备处于模拟准备状态,则服务器可以通过任务盒子将待播放文件发送至初始化后的环境模拟设备中,使得初始化后的环境模拟设备可以按照配置文件中所规定的标准,对待播放文件进行播放,能够模拟出一个车辆行驶场景,即生成车载模拟环境,进而能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

可以理解的是,为了能够更加真实地模拟或还原各个人物对象处于车载环境中的反应,本实施例可以在车内布置高保真的音箱和低音炮来播放环境噪声音频,以模拟或还原车辆行驶在目标场景中的环境噪声,还可以在主驾驶座位、副驾驶座位以及车辆后排座位上分别布置有人工嘴,通过主驾驶座位上的人工嘴播放第一对象的原音音频,通过副驾驶座位或车辆后排座位上播放第二对象的干扰音频。

具体地,如图8所示,当环境模拟设备根据配置文件完成初始化时,服务器可以将与配置文件相对应的待播放文件发送至任务盒子,同理,也可以采用SFTP协议将待播放文件发送至任务盒子,使得任务盒子可以接收到的待播放文件进行解析,具体可以是通过开源包(jaudiotagger)对待播放文件进行解析,还可以是采用其他开源工具进行解析,此处不作具体限制,可以解析得到待播放的环境噪声音频、第一对象的原音音频以及第二对象的干扰音频等音频文件,可以理解的是,如果目标场景中,只有第一对象时,则获取到的待播放文件可以只有目标场景对应的环境噪声音频以及第一对象的原音音频。

例如,一个待播放文件为一个通过闹市区场景对应的一个闹市区环境噪声音频,第一对象的10条待播放的导航语料和聊天语料,以及第二对象的10条聊天干扰语料,或者是一个通过郊区的场景下编辑好的需要重复200次的一个郊区环境噪声音频和第一对象的一条导航语料,然后,任务盒子可以将解析得到的待播放的环境噪声音频、第一对象的原音音频以及第二对象的干扰音频等音频文件发送至对应的环境模拟设备如高保真的音箱、主驾驶座位、副驾驶座位以及车辆后排座位上分别布置有人工嘴中,使得初始化后的环境模拟设备可以按照调试后的音量对获取到的待播放文件,如需要重复200次的一个郊区环境噪声音频和第一对象的一条导航语料进行依次播放,来模拟出需要重复200次的00次的一个郊区环境噪声音频和第一对象的一条导航语料对应的一个第一对象驾驶车辆行驶在郊区环境的场景。

在步骤S104中,接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,其中,实时环境信息至少包括实时环境音频信号,实时环境音频信号包括车载语音设备的响应音频信号、车载播放设备的播放音频信号,以及环境模拟设备的背景噪声音频信号、原音音频信号和干扰音频信号;

在本实施例中,在初始化后的环境模拟设备播放待播放文件,生成车载模拟环境后,可以通过环境接收设备实时采集车内的实时环境信息,如车载语音设备的响应音频信号、车载播放设备的播放音频信号,以及环境模拟设备的背景噪声音频信号、原音音频信号和干扰音频信号等实时环境音频信号,然后,环境接收设备可以将采集到的实时音频信号通过任务盒子实时回传至服务器,使得后续服务器可以根据接收的实时音频信号进行处理,以获取处理结果,并可以根据处理结果对环境模拟设备进行自动调优,无需人为参与环境模拟设备的误差标定,减少人为因素的干扰,进而可以实现对车载模拟环境的动态调优,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,环境接收设备是能够用于采集车载模拟环境相对应的实时环境信息的外设设备,环境接收设备具体可以表现为可编程的麦克风、分贝仪、可编程的摄像机、调试桥(Android Debug Bridge,ADB)工具以及光学字符识别(Optical Character Recognition,OCR)工具等,还可以是其他数据采集设备,此处不作具体限制。

其中,可编程的麦克风安装有驱动程序以支持对采集到的实时音频信号进行实时回传至服务器,同理,可编程的摄像机也安装有驱动程序以支持对采集到的实时图像进行实时回传至服务器。

其中,车载语音设备的响应音频信号具体可以表现为语音交互系统响应第一对象的原音音频如导航指令而发出的声音,例如,第一对象的原音音频如导航指令为“去目的地A”,语音交互系统响应该导航指令发出如“已规划到目的地A的最近路线”的声音。

其中,车载播放设备的播放音频信号具体可以表现为语音交互系统响应第一对象的原音音频如播放音乐指令而控制车载播放设备播放音乐,如车载音箱播放“音乐B”的声音,以使后续可以根据接收到车载播放设备的播放音频信号,结合车厢长度以及车载播放设备的型号,可以用于判断麦克风的摆放位置是否合适,部署在各个位置上人工嘴的位置是否合适,以及部署在车内的高保真音箱和低音炮的位置是否合适等,并可以根据判断结果调整部署位置,从而可以更好地还原车载模拟环境。

其中,环境模拟设备的原音音频信号具体可以表现为主驾驶座位上布置的人工嘴当前正在播放的语料生成的音频信号,环境模拟设备的干扰音频信号具体可以表现为副驾驶座位上布置的人工嘴播放的语料产生的音频信号,环境模拟设备的背景噪声音频信号具体可以表现为高保真音箱播放的环境噪声音频产生的音频信号。

可以理解的是,为了能够更好更准确地采集到实时音频信号,本实施例可以在车载语音设备处和在车载播放设备处都设置有麦克风,以及在主驾驶座位、副驾驶座位以及车辆后排座位上布置的人工嘴的两侧设置有麦克风,以及在高保真音箱和低音炮的两侧也设置有麦克风。

具体地,如图8所示,当初始化后的环境模拟设备播放待播放文件,生成车载模拟环境时,环境接收设备如可编程的麦克风结合分贝仪实时采集当前车载模拟环境中环境模拟设备产生的实时环境音频信号如主驾驶座位上布置的人工嘴当前正在播放的语料生成的音频信号即原音音频信号,副驾驶座位上布置的人工嘴播放的语料产生的音频信号即干扰音频信号,高保真音箱播放的环境噪声音频产生的背景噪声音频信号等,然后,环境接收设备可以将采集到的实时音频信号通过任务盒子实时回传至服务器,进行服务端的运算分析。

例如,假设在一个车载模拟环境为行驶如隧道的场景中可编程的麦克风结合分贝仪采集到的实时音频信号为主驾驶座位上布置的人工嘴当前正在播放的语料生成的音频信号为50分贝,以及高保真音箱播放的环境噪声音频产生的背景噪声音频信号为60分贝。

在步骤S105中,根据实时环境音频信号确定环境模拟设备的目标调整参数;

在本实施例中,在服务器接收到环境接收设备上传的实时音频信号之后,服务器可以对接收到的实时环境音频信号进行分析运算,以获取分析结果,并可以根据分析结果判断当前环境模拟设备是否需要进行误差调整,若否,则可以理解为当前的环境模拟设备处于良性状态,无需进行误差调整,可以继续使用当前的配置参数;若是,则可以根据分析结果获取目标调整参数,以使后续环境模拟设备可以根据目标调整参数进行动态调优,进而可以实现对车载模拟环境的动态调优,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,目标调整参数是用于调整环境模拟设备的当前的配置参数的参数指标,目标调整参数具体可以表现为环境模拟设备的当前的配置参数需要调整的上限数值或下限数值,还可以表现为环境模拟设备的当前的配置参数可以直接变更的参数值,还可以是其他表现形式,此处不作具体限制。

具体地,如图8所示,当服务器接收到环境接收设备上传的实时音频信号时,服务器可以对接收到的实时环境音频信号进行分析运算,具体可以是如图9所示,服务器可以根据实时音频信号调用相应的服务接口,并通过该服务接口将实时音频信号传递至统计计算模块进行详细计算,来获取准确的分析结果.

例如,假设在一个车载模拟环境为行驶如隧道的场景中可编程的麦克风结合分贝仪当前采集到的实时音频信号为主驾驶座位上布置的人工嘴当前正在播放的语料生成的音频信号为40分贝,以及高保真音箱播放的环境噪声音频产生的背景噪声音频信号为90分贝,而上一时刻采用到的驾驶座位上布置的人工嘴当前正在播放的语料生成的音频信号也是40分贝,以及高保真音箱播放的环境噪声音频产生的背景噪声音频信号为50分贝,根据接收到的实时音频信号,可以分析出车辆已经进入隧道环境中,在隧道中的环境噪声升高,当前主驾驶座位上的人工嘴播放的语料生成的音频信号未发生变化,为了能够更加真实地还原车载模拟环境,服务器可以根据伦巴效应计算环境噪声升高40分贝时,第一对象的说话声音的分贝数,即部署在主驾驶座位上的人工嘴的播放响度如70分贝,则该人工嘴播放的分贝数要调高30分贝,即目标调整参数。

其中,伦巴效应是指在较强的背景噪声会使讲话人的发音方式发生变化,即使发相同的语音,其语音的特征参数也会与安静环境下的发音有所不同,像声音变高,语速变慢,音调及共振峰变化等。

在步骤S106中,向初始化后的环境模拟设备发送目标调整参数,以使环境模拟设备根据目标调整参数进行调整,以优化车载模拟环境。

在本实施例中,在获取到目标调整参数之后,服务器可以通过任务盒子将目标调整参数实时传递至环境模拟设备,使得环境模拟设备可以根据接收到目标调整参数将环境模拟设备的当前的配置参数进行动态调整,无需人为参与环境模拟设备的误差标定,减少人为因素的干扰,进而可以实现对车载模拟环境的动态调优,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

具体地,如图8所示,当获取到目标调整参数时,服务器可以将目标调整参数进行打包并发送至任务盒子,任务盒子可以对打包的目标调整参数进行解压,解压方式可以与任务盒子解析配置文件的方式相似,此处不再赘述,然后,任务盒子可以将解压得到目标调整参数实时准确地传递至环境模拟设备,使得环境模拟设备可以根据接收到目标调整参数将环境模拟设备的当前的配置参数进行动态调整,例如,假设环境模拟设备如主驾驶座位上的人工嘴接收到的目标调整参数为上调5分贝,则可以主驾驶座位上的人工嘴可以将当前的音量配置参数上调5分贝,然后,主驾驶座位上的人工嘴可以按照调整后的音量55分贝继续播放第一对象的原音音频,实现动态调优车载模拟环境,使得车载模拟环境能够更加还原真实场景。

可以理解的是,如图9所示,在动态调优的车载模拟环境中,还可以通过环境接收设备如摄像机实时或按照预设的时间间隔拍摄并采集被测试的车载设备如语音交互系统的视频画面,可以通过摄像机记录完整的环境模拟设备播放待播放文件以及被测试的车载设备如语音交互系统进行语音识别的过程,使得摄像机能够将记录下的测试数据通过任务盒子实时上传至服务器中进行分析运算,如分析得到被测试的车载设备如语音交互系统的唤醒率以及识别率等,还可以是其他分析结果,如导航定位准确率等,此处不作具体限制,能够在还原真实场景还原度的车载模拟环境中,获取到准确率较高的测试数据,并将获取到的测试数据上传至服务器中进行分析运算,能够在一定程度上提高获取测试数据对应的唤醒率或识别率的准确度。

其中,服务器对摄像机能够将记录下的测试数据进行分析运算,以获取被测试的车载设备如语音交互系统的识别率,具体可以是通过对上传视频进行截取以及剪切处理,之后还可以调用开源框架如飞浆进行图文识别,或是其他开源框架,此处不作具体限制,得到上传的视频图片的图文识别结果信息,然后,将经过图文识别后的视频图片以及图文识别结果信息,与提前录入在数据库的正确图片以及图片标注进行对比,并根据分析工具提供的算法计算出来识别率,以及统计场景中标注的识别率,还可以采用其他计算方式,此处不作具体限制,进一步地,还可以根据获取到的识别率实时生成测试报告并反馈至终端设备的显示界面,以便于用户进行查阅、管理或调整等处理。

其中,服务器对摄像机能够将记录下的测试数据进行唤醒词的成功率的计算,具体可以是优先选择是否识别图片内嵌图片,根据像素查找上传的视频图片中是否包含提前录入在数据库的图片,如果有则记录唤醒,如果没有则记录未唤醒,还可以采用其他计算方式,此处不作具体限制,进一步地,还可以根据记录的唤醒结果实时生成测试报告并反馈至终端设备的显示界面,以便于用户进行查阅、管理或调整等处理。

另外,摄像机还可以在环境模拟设备播放待播放文件过程中,按照预设的特定的时间点拍摄一张或多张图片,并通过任务盒子快速准确地上传至服务器中,可以用于图文识别数据分析,从而能够应用于识别率的分析计算。

进一步地,在动态调优的车载模拟环境中,还可以通过环境接收设备如ADB根据接收到的ADB指令,在环境模拟设备播放待播放文件时,对当前车载模拟环境中的车机屏幕画面进行录制,在录制结束时可以将录制的画面数据通过任务盒子及时上传至服务器中进行分析处理,可以用于图文识别数据分析,从而能够应用于识别率的分析计算,还可以从车机系统中将录制视频导出,可以用于后续视频上传或本地图文识别分析等。

另外,ADB还支持ADB截屏指令,可以在环境模拟设备播放待播放文件过程中,按照预设的特定的时间点根据接收到的ADB截屏指令,截取当前状态车机屏幕画面,通过任务盒子及时上传至服务器中进行分析处理,可以用于图文识别数据分析,从而能够应用于识别率的分析计算,还可以导出到本地磁盘中,可以用于后续图片上传或本地图文识别分析等。

进一步地,本实施例还可以根据项目、场景或解析时间等,将计算得到的识别率以及唤醒率等展示到web页面上,或者其他显示界面上,此处不作具体限制,能够便于用户通过显示界面对获取到的数据进行查看、搜索、对比、修改识别数据或重新计算结果等操作。

在本申请实施例中,提供了一种应用于车载设备的环境模拟方法,通过上述方式,能够实时接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,并根据实时环境信息中的实时环境音频信号确定环境模拟设备的目标调整参数,使得环境模拟设备可以根据目标调整参数进行调整,来动态优化车载模拟环境,不仅能够实现对整个车载模拟环境的远程控制,还能够避免因人工参与导致模拟环境中设备产生调整误差的情况,减少人力资源成本,降低人为因素的干扰,使得采集到的数据更为准确,并且能够快速的得到有效的数据。

可选地,在上述图2对应的实施例的基础上,本申请实施例提供的文本类别的确定方法另一个可选实施例中,如图3所示,根据实时环境音频信号确定环境模拟设备的目标调整参数,包括:

在步骤S301中,根据预设的配置条件获取与实时环境音频信号相对应的标准配置参数;

在步骤S302中,计算配置文件的原始配置参数与标准配置参数的差值,得到目标调整参数。

在本实施例中,在接收到环境接收设备采集到的实时环境音频信号后,服务器可以先根据预设的配置条件来获取与实时环境音频信号相对应的标准配置参数,然后,可以通过计算配置文件的原始配置参数与标准配置参数之间的差值,来将获取到的差值作为目标调整参数,以使后续环境模拟设备可以根据目标调整参数将当前的配置参数动态调优至符合标准配置参数,进而可以实现对车载模拟环境的动态调优,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,预设的配置条件具体可以表现为环境模拟设备对应的标准配置参数-噪声的关系条件,还可以是其他配置条件,此处不作具体限制。标准配置参数是也是根据伦巴效应进行设置的参数,存在噪声与标准配置参数为正相关的关系,可以理解为噪声越大,标准配置参数的数值越大。响度是与声强相对应的声音大小的知觉量,声强是客观的物理量,响度是主观的心理量,响度不仅跟声强有关,还跟频率有关,频率不同,响度级也不相同,响度受声强制约,声强级提高,响度级一般也要提高。

具体地,如图9所示,当服务器接收到环境接收设备上传的实时音频信号时,服务器可以对接收到的实时环境音频信号进行分析运算,具体可以是先对获取到的实时环境音频信号进行解析,可以解析得到相应的音频数据如响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号,例如,当前主驾驶座位上的人工嘴播放的语料的音量为50分贝,以及高保真音箱播放的背景噪声为40分贝,然后,可以将解析得到当前车载模拟环境中产生的背景噪声音频信号、原音音频信号在预设的配置条件中进行遍历或匹配,以获取与该当前车载模拟环境中产生的背景噪声相对应的预设配置条件,进而,可以获取该预设的配置条件中设置的标准配置参数,例如,噪声为40分贝对应的原音音频信号的播放标准配置参数为30分贝,则可以计算主驾驶座位上的人工嘴对应的标准配置参数与配置文件的原始配置参数之间的差值,可以得到差值为-20分贝,即主驾驶座位上的人工嘴对应的目标调整参数为下调20分贝,可以理解的是,如果主驾驶座位上的人工嘴对应的计算配置文件的原始配置参数与标准配置参数之间的差值,可以得到差值为+10分贝,即目标调整参数为下调10分贝。

可选地,在上述图2对应的实施例的基础上,本申请实施例提供的文本类别的确定方法另一个可选实施例中,如图4所示,根据实时环境音频信号确定环境模拟设备的目标调整参数,包括:

在步骤S401中,对实时环境音频信号进行切分操作,得到响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号;

在步骤S402中,若响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号之间的比重不符合比重阈值,则根据比重阈值获取调整参数,得到目标调整参数。

在本实施例中,在接收到环境接收设备采集到的实时环境音频信号后,服务器可以先对获取到实时环境信号进行切分操作,来获取当前车载模拟环境对应的响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号,进而,可以计算响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号之间的比重,然后,可以将计算得到的比重与预设的比重阈值进行比较,若计算得到的比重属于预设的比重阈值允许的误差范围内,即响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号之间的比重符合比重阈值,则可以理解为当前的各个环境模拟设备处于良性状态,无需进行误差调整,可以继续使用当前的配置参数;若计算得到的比重不属于预设的比重阈值允许的误差范围内,即响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号之间的比重不符合比重阈值,则可以根据比重阈值获取与各个环境模拟设备相对应的调整参数,来作为目标调整参数,以使后续环境模拟设备可以根据目标调整参数进行动态调优,进而可以实现对车载模拟环境的动态调优,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,调整参数与比重阈值呈正相关,具体可以表现为各个环境模拟设备的当前的配置参数可以乘以的权重系数,或者各个环境模拟设备的当前的配置参数需要调整的上限数值或下限数值,还可以表现为各个环境模拟设备的当前的配置参数可以直接变更的参数值,还可以是其他表现形式,此处不作具体限制。其中,比重阈值具体可以表现为环境模拟设备对应的原始配置参数除以预设的标准噪声得到的比重数值,还可以是其他比重阈值,此处不作具体限制,预设的标准噪声可以根据响度原理进行获取。

具体地,如图9所示,当服务器接收到环境接收设备上传的实时音频信号时,服务器可以对接收到的实时环境音频信号进行分析运算,具体可以是采用多媒体软件工具(AdobeAuditionCS6)对实时环境音频信号进行信号切分,还可以采用其他切分方式,此处不作具体限制,来获取实时环境信号对应的响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号,例如,语音交互系统的发出的响应音频信号为45分贝,主驾驶座位上的人工嘴播放的原音音频信号为30分贝,以及高保真音箱播放的背景噪声信号为90分贝,无播放音频信号以及无干扰音频信号,然后,可以计算响应音频信号、原音音频信号以及背景噪声信号之间的比重,可以得到比重为1.5:1:3,进而,可以计算得到的比重与预设的比重阈值进行比较,例如,假设预设的比重阈值允许的误差范围为正负0.05,以及预设的比重阈值为1.5:1.5:3,可知计算得到的比重不符合该比重阈值,可知,主驾驶座位上的人工嘴不符合播放条件,则可以根据该比重阈值获取与主驾驶座位上的人工嘴相对应的调整参数,例如,假设预设的比重阈对应的调整参数表现为权重系数+1.5,即目标调整参数为权重系数1.5,即主驾驶座位上的人工嘴的播放响度应调整为45分贝。

可选地,在上述图2对应的实施例的基础上,本申请实施例提供的文本类别的确定方法另一个可选实施例中,如图5所示,实时环境信息还包括实时环境图像;该方法还包括:

在步骤S501中,将实时环境图像与异常环境图像进行匹配,若匹配成功,则根据异常环境图像获取对应的异常修正参数;

在步骤S502中,向初始化后的环境模拟设备发送异常修正参数,以使环境模拟设备根据异常修正参数进行调整,以优化车载模拟环境。

在本实施例中,在环境接收设备采集到的与车载模拟环境相对应的实时环境图像之后,可以通过任务盒子将实时环境图像上传至服务器进行分析运算,可以将实时环境图像与异常环境图像进行匹配,若没有匹配成功,则可以理解为当前的环境模拟设备处于良性状态,无需进行异常修正,可以继续使用当前的配置参数;若匹配成功,则可以根据异常环境图像获取对应的异常修正参数,以使后续环境模拟设备可以根据异常修正参数进行异常调整,避免因参数异常导致环境模拟设备出现故障,以维护环境模拟设备的正常运行,实现对环境模拟设备的动态调优,进而可以实现对车载模拟环境的动态调优,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,异常环境图像是提前录入在数据库的图片,每个图片对应有图片异常标注,可以用于与上传的实时环境图像进行对比分析。异常调整参数与异常环境图像具有对应关系,异常调整参数是用于对可能存在异常的环境模拟设备进行修正的参数,异常调整参数具体可以表现为环境模拟设备的当前的配置参数可以乘以的安全系数以获取修正参数,还可以表现为环境模拟设备的当前的配置参数可以直接变更的参数值,还可以是其他表现形式,此处不作具体限制。安全系数是符合实际设备使用规范的系数,可以根据实际应用需求进行设置,此处不作具体限制。

具体地,如图9所示,当服务器接收到环境接收设备上传的实时环境图像时,服务器可以对接收到的实时环境图像进行分析运算,具体可以是先使用多媒体图像处理工具对实时环境图像进行灰度处理,以获取处理后的灰度图像,然后,将处理后的灰度图像与数据库中存储的异常环境图像进行一一匹配,以获取处理后的灰度图像与每个异常环境图像之间的相似度,若数值最大的相似度大于或等于预设的相似阈值,则确定数值最大的相似度对应的异常环境图像与实时环境图像匹配成功,或者,可以对上传实时环境图像进行截取以及剪切处理,之后还可以调用开源框架如飞浆进行图文识别,或是其他开源框架,此处不作具体限制,得到实时环境图像的图文识别结果信息,然后,将经过实时环境图像的图文识别结果信息与提前录入在数据库的异常环境图像的图片异常标注进行匹配,如果命中图像异常标注的命中率满足预设的命中阈值,则确定图像异常标注的命中率最大对应的异常环境图像与实时环境图像匹配成功,还可以采用其他图像匹配方式,此处不作具体限制。

进一步地,在异常环境图像与实时环境图像匹配成功之后,可以根据异常环境图像与异常修正参数之间的对应关系获取异常修正参数,例如,假设异常环境图像对应的异常修正参数表现为安全系数-0.12,然后,可以服务器可以将获取到的异常修正参数通过任务盒子发送至环境模拟设备如人工嘴,例如,假设主驾驶座位上的人工嘴当前的配置参数为50分贝,则计算当前的配置参数与获取到的异常修正参数之间的乘积为-6分贝,并将当前的配置参数与该乘积进行加和,得到修正参数为44分贝,即可以将主驾驶座位上的人工嘴当前的配置参数调整至44分贝,以符合环境模拟设备的使用规范,能够避免在异常环境中环境模拟设备能够正常运行。

可以理解的是,本实施例还可以根据实时环境图像确定环境模拟设备存在异常情况时,发出设备异常提示,以进一步维护环境模拟设备的正常运作,从而在一定程度上优化车载模拟环境,其中,设备异常提示具体可以表现为预警语音播报、及时信息或者灯光提示等,还可以是其他提示方式,此处不作具体限制。

可选地,在上述图2对应的实施例的基础上,本申请实施例提供的文本类别的确定方法另一个可选实施例中,如图6所示,该方法还包括:

在步骤S601中,将配置文件发送至环境接收设备,以使环境接收设备根据配置文件进行标准化;

在步骤S602中,接收标准化后的环境接收设备采集到的与车载模拟环境相对应的实时环境信息。

在本实施例中,在获取到配置文件之后,服务器可以通过任务盒子向环境接收设备发送配置文件,任务盒子可以先对获取到的配置文件进行解析,解析得到配置数据包以及配置数据包对应的设备标识,然后,可以通过任务盒子可以将解析得到的配置数据包,发送至与设备标识相对应的环境接收设备中,使得环境接收设备可以根据获取到配置数据包中的配置参数对当前的设备参数进行调整,即对环境接收设备进行标准化,使得环境接收设备可以将设备参数调整至配置文件中所规定的标准,能够将环境接收设备调试至标准状态,使得后续可以使用标准化后的环境接收设备能够更好更准确地采集或捕捉到车载模拟环境中的实时环境信息,从而在一定程度上提高获取测试数据的准确率。

具体地,如图8所示,当获取到的配置文件时,服务器可以通过任务盒子向环境接收设备发送配置文件,具体可以是采用传输协议(SFTP)将配置文件发送至任务盒子,然后,任务盒子接收到的配置文件后,任务盒子可以先对配置文件进行解析,可以得到配置数据包以及配置数据包对应的设备标识,并可以通过任务盒子可以将解析得到的配置数据包,发送至与设备标识相对应的环境接收设备如摄像机、ADB或OCR等中,使得环境接收设备可以根据获取到配置数据包中的配置参数对当前的设备参数进行调整,例如,车内固定好摄像头可以按照接收到的配置参数调整焦距,使得后续用户通过终端设备的显示界面上的预览的形式查看摄像头捕捉的清晰画面,或者,在采用录屏方案时,可以按照接收到的配置参数对OCR识别的截图位置,合图大小,文字有效色彩等参数进行标准化调试,以正确录制如20s的屏幕画面作为实时环境信息,从而在一定程度上提高获取测试数据的准确率。

其中,OCR调试还可以针对车机屏幕已采集的视频,进行图像帧获取、区域图片截取、多图片合成大图以及图文识别(tesseract)等的一系列流程操作,能够用于将识别工作在本地自动化完成,从而一定程度上提高测试效率。

可选地,在上述图2对应的实施例的基础上,本申请实施例提供的文本类别的确定方法另一个可选实施例中,如图7所示,该方法还包括:

在步骤S701中,获取声卡标识;

在步骤S702中,向初始化后的环境模拟设备发送待播放文件以及声卡标识,以使初始化后的环境模拟设备调用与声卡标识相对应的目标声卡播放待播放文件,生成车载模拟环境。

在本实施例中,在通过任务盒子向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境之前,本实施例还可以获取用户通过客户端上传的声卡标识,或者是获取提前与配置文件对应声卡标识,还可以是其他获取方式获取声卡标识,此处不作具体限制,然后,可以通过任务盒子向初始化后的环境模拟设备发送待播放文件以及声卡标识,使得初始化后的环境模拟设备调用与声卡标识相对应的目标声卡进行输出待播放文件,同时,左右声道还可单独播放不同的音频文件,来模拟出车辆多场景以及多音源环境,能够在一定程度上提高还原真实场景的效果,从而在一定程度上提高获取测试数据的准确率。

其中,声卡标识(identity,ID)用于指示声卡设备,可以具体表现为整数(int)型的数字串如声卡型号,也可以具体表现为字符串如声卡设备名称等,此处不作具体限制。声卡可以把来自话筒、磁带、光盘的原始声音信号加以转换,输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音乐设备数字接口(MIDI)发出合成乐器的声音。

具体地,在获取到配置文件以及待播放文件时,可以根据配置文件与声卡标识之间的对应的关系获取主驾驶座位上的人工嘴对应的声卡标识如001,高保真音箱对应的声卡标识如002,以及副驾驶座位上的人工嘴对应的声卡标识如003,然后,可以通过任务盒子将声卡标识001和第一对象的原音音频发送至初始化后的主驾驶座位上的人工嘴中,以及将声卡标识002和环境噪声音频发送至初始化后的高保真音箱中,以及声卡标识002和第二对象的干扰音频发送至初始化后的副驾驶座位上的人工嘴中,使得初始化后的主驾驶座位上的人工嘴可以根据获取的声卡标识确定目标声卡001,进而,可以使用目标声卡001来将接收到的第一对象的原音音频进行信号转换,以输出到主驾驶座位上的人工嘴,使得主驾驶座位上的人工嘴能够更好地播放第一对象的原音音频,同理,使得初始化后的高保真音箱可以根据获取的声卡标识确定目标声卡002,进而,可以使用目标声卡002来将接收到的环境噪声音频进行信号转换,以输出到高保真音箱,使得高保真音箱能够更好地播放环境噪声音频,同理,可以使得初始化后的副驾驶座位上的人工嘴可以根据获取的声卡标识确定目标声卡003,进而,可以使用目标声卡003来将接收到的第二对象的干扰音频进行信号转换,以输出到副驾驶座位上的人工嘴,使得副驾驶座位上的人工嘴能够更好地播放第二对象的干扰音频,从而生成还原度更高的第一对象驾驶车辆行驶在目标场景中的车载模拟环境。

下面对本申请中的应用于车载设备的环境模拟装置进行详细描述,请参阅图10,图10为本申请实施例中应用于车载设备的环境模拟装置的一个实施例示意图,应用于车载设备的环境模拟装置20包括:

获取单元201,用于获取目标场景的配置文件以及待播放文件,其中,配置文件是用于支持环境模拟设备模拟目标场景对应的车载模拟环境的初始配置参数和文件的集合,待播放文件包括环境噪声音频、第一对象的原音音频以及第二对象的干扰音频;

发送单元202,用于向环境模拟设备发送配置文件,以使环境模拟设备根据配置文件进行初始化;

发送单元202,还用于向初始化后的环境模拟设备发送待播放文件,以使初始化后的环境模拟设备播放待播放文件,生成车载模拟环境;

获取单元201,还用于接收环境接收设备采集到的与车载模拟环境相对应的实时环境信息,其中,实时环境信息至少包括实时环境音频信号,实时环境音频信号包括车载语音设备的响应音频信号、车载播放设备的播放音频信号,以及环境模拟设备的背景噪声音频信号、原音音频信号和干扰音频信号;

处理单元203,用于根据实时环境音频信号确定环境模拟设备的目标调整参数;

发送单元202,还用于向初始化后的环境模拟设备发送目标调整参数,以使环境模拟设备根据目标调整参数进行调整,以优化车载模拟环境。

可选地,在上述图10对应的实施例的基础上,本申请实施例提供的应用于车载设备的环境模拟装置的另一实施例中,处理单元203具体可以用于:

根据预设的配置条件获取与实时环境音频信号相对应的标准配置参数;

计算配置文件的原始配置参数与标准配置参数的差值,得到目标调整参数。

可选地,在上述图10对应的实施例的基础上,本申请实施例提供的应用于车载设备的环境模拟装置的另一实施例中,处理单元203具体可以用于:

对实时环境音频信号进行切分操作,得到响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号;

若响应音频信号、播放音频信号,背景噪声音频信号、原音音频信号和干扰音频信号之间的比重不符合比重阈值,则根据比重阈值获取调整参数,得到目标调整参数。

可选地,在上述图10对应的实施例的基础上,本申请实施例提供的应用于车载设备的环境模拟装置的另一实施例中,

处理单元203,还用于将实时环境图像与异常环境图像进行匹配,若匹配成功,则根据异常环境图像获取对应的异常修正参数;

发送单元202,还用于向初始化后的环境模拟设备发送异常修正参数,以使环境模拟设备根据异常修正参数进行调整,以优化车载模拟环境。

可选地,在上述图10对应的实施例的基础上,本申请实施例提供的应用于车载设备的环境模拟装置的另一实施例中,

发送单元202,还用于将配置文件发送至环境接收设备,以使环境接收设备根据配置文件进行标准化;

获取单元201具体可以用于:接收标准化后的环境接收设备采集到的与车载模拟环境相对应的实时环境信息。

可选地,在上述图10对应的实施例的基础上,本申请实施例提供的应用于车载设备的环境模拟装置的另一实施例中,

获取单元201,还用于获取声卡标识;

发送单元202具体可以用于:向初始化后的环境模拟设备发送待播放文件以及声卡标识,以使初始化后的环境模拟设备调用与声卡标识相对应的目标声卡播放待播放文件,生成车载模拟环境。

本申请另一方面提供了另一种计算机设备示意图,如图11所示,图11是本申请实施例提供的一种计算机设备结构示意图,该计算机设备300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)310(例如,一个或一个以上处理器)和存储器320,一个或一个以上存储应用程序331或数据332的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器320和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备300中的一系列指令操作。更进一步地,中央处理器310可以设置为与存储介质330通信,在计算机设备300上执行存储介质330中的一系列指令操作。

计算机设备300还可以包括一个或一个以上电源340,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口360,和/或,一个或一个以上操作系统333,例如Windows Server

上述计算机设备300还用于执行如图2至图7对应的实施例中的步骤。

本申请的另一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如图2至图7所示实施例描述的方法中的步骤。

本申请的另一方面提供了一种包含指令的计算机程序产品当其在计算机或处理器上运行时,使得所述计算机或处理器执行如图2至图7所示实施例描述的方法中的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

技术分类

06120113806105