一种设备音量自动调节方法、装置和电子设备

文献发布时间：2023-06-19 10:48:02

技术领域

本发明涉及语音处理领域，具体涉及一种设备音量自动调节方法、装置和电子设备。

背景技术

当前市场上所见的音箱、电视等产品在播放音频或视频时如果用户行为发生变化，比如接到电话、室内跑步、吹头发、用吸尘器打扫卫生等，此时产品的音量仍维持不变，比较影响用户体验。例如，用户正在以较高音量看电视时，突然接到领导的电话，此时较大的电视背景噪音肯定会影响两方的通话质量。

目前对于上述问题的解决办法是可以通过检测用户与设备的距离来调节音量大小，但此方法无法满足用户距离没变但用户行为发生变化的场景下对于音量自动调节的需求，因此，需要进行技术优化。

发明内容

本发明提供一种设备音量自动调节方法、装置和电子设备，能够解决音响设备不能根据用户行为特征进行自动调节音量的技术问题。

本发明解决上述技术问题的技术方案如下：

第一方面，提供一种设备音量自动调节方法，所述方法包括：创建行为数据库，所述行为数据库中包含有行为数据、与所述行为数据对应的音量数据；获取用户的实际行为数据，将所述实际行为数据与所述行为数据库中的行为数据进行比对；在所述实际行为数据与所述行为数据库中的行为数据一致的情况下，获取用户的距离数据；根据所述用户的距离数据和行为数据库中的音量数据自动调节设备音量。

进一步地，所述行为数据库包括预设行为数据库和自定义行为数据库，所述预设行为数据库中包含有预设的行为数据，所述自定义行为数据库中包含有用户依据自身需求设置的自定义行为数据。

进一步地，所述自定义行为数据库的创建方法，包括：获取用户上传的视频数据；对所述视频数据进行识别，得到视频数据中的行为特征；根据所述行为特征确定所述视频数据的属性，生成自定义行为数据库。

进一步地，所述获取用户的实际行为数据之前，所述方法还包括：实时监测所述设备周围环境内是否存有人存在；在检测到有人存在的情况下，获取用户的实际行为数据。

进一步地，将所述实际行为数据与所述行为数据库中的行为数据进行比对，包括：根据所述实际行为数据，得到用户的特征数据；根据所述特征数据以及所述特征数据的变化值判断所述实际行为数据与所述行为数据库中的行为数据是否一致。

进一步地，在所述实际行为数据与所述行为数据库中的行为数据一致的情况下，获取用户的距离数据，包括：判断所述实际行为数据与预设行为数据库中的行为数据是否一致，若是，则进行获取用户的距离数据的步骤；若否，则判断所述实际行为数据与自定义行为数据库中的行为数据是否一致，若是，则进行获取用户的距离数据的步骤，若否，则继续进行实时监测所述设备周围环境内是否存有人存在的步骤。

进一步地，判断所述实际行为数据与自定义行为数据库中的行为数据是否一致，包括：判断所述实际行为数据中的特征数据与所述自定义行为数据库中的特征数据的相似度；当所述相似度大于第一阈值时，确定所述实际行为数据与自定义行为数据库中的行为数据一致；当所述相似度小于第一阈值时，确定所述实际行为数据与自定义行为数据库中的行为数据不一致。

进一步地，所述获取用户的距离数据，包括：根据用户的实际行为数据获取用户的面部图像；根据所述面部图像的大小，确定用户的距离数据。

进一步地，所述根据所述用户的距离数据和行为数据库中的音量数据自动调节设备音量，包括：根据所述用户的距离数据和行为数据库中的行为数据包含的原始距离，得到距离系数，所述原始距离为行为数据库中用户与设备的距离；根据所述距离系数和行为数据库中的音量数据得到目标音量值；判断设备当前音量与所述目标音量值是否相同，若不同，则调节设备当前音量与所述目标音量值一致。

进一步地，提供一种设备音量自动调节装置，所述装置包括：数据库创建模块，用于创建行为数据库，所述行为数据库中包含有行为数据、与所述行为数据对应的音量数据；行为对比模块，用于获取用户的实际行为数据，将所述实际行为数据与所述行为数据库中的行为数据进行比对；用户距离计算模块，用于在所述实际行为数据与所述行为数据库中的行为数据一致的情况下，获取用户的距离数据；音量调节模块，用于根据所述用户的距离数据和行为数据库中的音量数据自动调节设备音量。

第三方面，提供一种电子设备，所述电子设备包括语音设备、人体感应器、图像采集装置、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤；所述人体感应器设置在所述语音设备上，用于检测语音设备周围环境是否有人存在；所述图像采集装置设置在语音设备上，用于获取用户的实际行为数据。

第四方面，提供一种计算机可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

本发明的有益效果是：本实施例通过采集用户的实际行为数据，与行为数据库中的行为数据作对比，根据对比结果获取用户的距离数据，根据距离数据实时计算目标音量值，并根据目标音量值调节设备音量，且支持自定义行为数据设置，能够满足多种场合的用户需求。

附图说明

图1为本发明实施例提供的一种设备音量自动调节方法流程图。

图2为本发明实施例提供的一种设备音量自动调节设备的结构示意图。

图3为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

本发明实施例提供的一种设备音量自动调节方法，参考图1，该方法包括：

步骤S1：创建行为数据库，行为数据库中包含有行为数据、与行为数据对应的音量数据；

可选地，行为数据可以是用户的打电话、做家务、玩手机等行为特征，与行为数据对应的音量数据可以是根据用户的行为特征匹配的音量值，例如当用户在预设的1米距离内打电话时，该音量值为50分贝，用户在预设的1米距离内做家务时，该音量值为80分贝，也就是说该音量值的大小由用户的行为特征决定。

本实施例中，行为数据库包括预设行为数据库和自定义行为数据库，预设行为数据库中包含有预设的行为数据，例如通过样本训练出识别模型，由该识别模型能够识别出的行为数据组成预设行为数据库。自定义行为数据库中包含有用户依据自身需求设置的自定义行为数据。自定义行为数据库的创建方法，包括：获取用户上传的视频数据；对视频数据进行识别，得到视频数据中的行为特征；根据行为特征确定视频数据的属性，生成自定义行为数据库。

也就是说，自定义行为数据中的行为数据为用户根据自身需求和场景，自定义输入一定的视频，例如预设行为数据库中不包含有吹头发的行为数据，那么用户可以通过手机等智能设备录制洗头发的视频，通过自定义行为数据库存储，那么当本实施例的方法在实施时，即可对该洗头发的行为特征进行识别，能够满足不同场景和不同行为的识别需求，从而根据不同场景自动调节设备音量。

具体地，对于行为特征的识别，可以通过获取视频图像中，每帧图像中人体关键点的几何位置关系，以及连续多帧图像中人体关键点几何位置关系的变化情况；根据该变换情况对视频中的行为特征进行分析，得到行为特征对应的属性，该属性可以是洗碗、刷牙等。

步骤S2：获取用户的实际行为数据，将实际行为数据与行为数据库中的行为数据进行比对；

为了节省设备的存储空间，本实施例只需要在有人活动的情况下进行视频采集，因此在获取用户的实际行为数据之前，实时监测设备周围环境内是否存有人存在；在检测到有人存在的情况下，获取用户的实际行为数据。

本实施例中，用户的实际行为数据可以通过设备采集的视频来获取，上述将实际行为数据与行为数据库中的行为数据进行比对，可以根据实际行为数据得到用户的特征数据；根据特征数据以及特征数据的变化值判断实际行为数据与行为数据库中的行为数据是否一致。若一致，进行下述步骤S3，从而获取与该实际行为数据的行为特征对应的目标音量值，若不一致，则持续监测周围环境内是否有人存在的步骤。

步骤S3：在实际行为数据与行为数据库中的行为数据一致的情况下，获取用户的距离数据；

本实施例中，由于行为数据库包括预设行为数据库和自定义行为数据库，为了缩短检测的时间，本实施例首先判断实际行为数据与预设行为数据库中的行为数据是否一致，若是，则进行获取用户的距离数据的步骤；若否，则判断实际行为数据与自定义行为数据库中的行为数据是否一致，若是，则进行获取用户的距离数据的步骤，若否，则继续进行实时监测所述设备周围环境内是否存有人存在的步骤。通过先将实际行为数据与预设行为数据库中的行为数据进行比对，后将实际行为数据与自定义行为数据库中的行为数据进行比对的方式，从而提高检测效率，缩短检测时长。

本实施例中，由于自定义行为数据未经过样本训练，其检测效果有限，因此本实施例采用相似度来判断实际行为数据与自定义行为数据的一致性。在判断实际行为数据与自定义行为数据库中的行为数据是否一致时，采用的方法包括：判断实际行为数据中的特征数据与自定义行为数据库中的特征数据的相似度；当相似度大于第一阈值时，确定实际行为数据与自定义行为数据库中的行为数据一致；当相似度小于第一阈值时，确定实际行为数据与自定义行为数据库中的行为数据不一致。

可选的，本实施例根据用户的实际行为数据获取用户的面部图像；根据面部图像的大小，确定用户的距离数据。例如，在一段视频中，用户逐渐远离设备，那么用户的面部图像在整个一帧画面中的比例会越来越小，根据这一原理，可以计算出用户的面部图像与距离之间的对应关系，从而可以通过用户面部图像的大小来计算用户与设备的实际距离。进一步地，获取行为数据库中的行为数据所包含的用户与设备之间的原始距离，通过该原始距离和用户的实际距离得到距离系数，根据该距离系数从而计算目标音量值。

步骤S4：根据用户的距离数据和行为数据库中的音量数据自动调节设备音量。

具体地，目标音量值的计算公式可以为：V

其中，V

根据所述用户的距离数据和行为数据库中的音量数据得到目标音量值；

判断设备当前音量与所述目标音量值是否相同，若不同，则调节设备当前音量与目标音量值一致。

本实施例中的设备可以是音乐播放器、智能电视等智能语音设备。

本实施例通过采集用户的实际行为数据，与行为数据库中的行为数据作对比，根据对比结果获取用户的距离数据，根据距离数据实时计算目标音量值，并根据目标音量值调节设备音量，且支持自定义行为数据设置，能够满足多种场合的用户需求。

本实施例还提供一种设备音量自动调节装置200，参考图2，该装置包括：

数据库创建模块201，用于创建行为数据库，行为数据库中包含有行为数据、与所述行为数据对应的音量数据；该模块执行的具体功能在上述步骤S1中均有描述，为避免重复，在此不再赘述。

行为对比模块202，用于获取用户的实际行为数据，将所述实际行为数据与所述行为数据库中的行为数据进行比对；该模块执行的具体功能在上述步骤S2中均有描述，为避免重复，在此不再赘述。

用户距离计算模块203，用于在所述实际行为数据与所述行为数据库中的行为数据一致的情况下，获取用户的距离数据；该模块执行的具体功能在上述步骤S3中均有描述，为避免重复，在此不再赘述。

音量调节模块204，用于根据所述用户的距离数据和行为数据库中的音量数据自动调节设备音量。该模块执行的具体功能在上述步骤S4中均有描述，为避免重复，在此不再赘述。

本实施例还提供一种电子设备100，参考图3，该电子设备包括语音设备102、人体感应器103、图像采集装置104、处理器105、存储器101及存储在所述存储器101上并可在所述处理器上运行的程序或指令，程序或指令被所述处理器105执行时实现上述方法的步骤；人体感应器103设置在所述语音设备102上，与该语音设备电连接，用于检测语音设备102周围环境是否有人存在；图像采集装置104设置在语音设备上，与该语音设备电连接，用于获取用户的实际行为数据。且语音设备102、人体感应器103、图像采集装置104、存储器101均与处理器电连接。

本实施例还提供一种计算机可读存储介质可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现上述方法的步骤。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：蒋莹;李鹏;梁家恩;
专利申请人：云知声智能科技股份有限公司;厦门云知芯智能科技有限公司;