一种用户行为分析方法、装置、电子设备和存储介质

文献发布时间：2023-06-19 11:49:09

技术领域

本申请涉及计算机技术领域，尤其涉及一种用户行为分析方法、装置、电子设备和存储介质。

背景技术

目前，视频监控可以包括前端摄像机、传输线缆、视频监控平台。摄像机可分为网络数字摄像机和模拟摄像机，可作为前端视频图像信号的采集。一般来说，摄像机可以通过网络线缆或同轴视频电缆将视频图像传输到控制主机，控制主机再将视频信号分配到各监视器及录像设备。同时，还可以采集声音信号，并将声音信号分配到各监视器及录像设备，从而可以基于视频数据和音频数据来分析用户行为。然而，由于采集到的声音信号过于杂乱，导致只能基于视频数据分析用户行为，这可能存在用户行为分析不准确的问题。因此，在这种场景下，如何提高用户行为分析的准确性成为当前阶段亟待解决的技术问题。

发明内容

本申请实施例提供了一种用户行为分析方法、装置、电子设备和存储介质，提高了用户行为分析的准确性。

本申请第一方面提供了一种用户行为分析方法，所述方法应用于用户行为分析系统，所述用户行为分析系统包括服务器、摄像头、以及与所述摄像头建立通信连接的至少一个麦克风阵列，所述摄像头与所述麦克风阵列之间的距离大于阈值，所述方法包括：

所述服务器获取音视频数据，所述音视频数据为对视频数据和音频数据进行同步后的数据，所述视频数据为通过所述摄像头采集的至少一个用户的视频数据，所述音频数据为所述麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的音频数据；

所述服务器根据所述音视频数据，确定所述至少一个用户中每个用户的行为。

本申请第二方面提供了一种用户行为分析装置，所述装置包括获取模块和确定模块，

所述获取模块，用于获取音视频数据，所述音视频数据为对视频数据和音频数据进行同步后的数据，所述视频数据为通过摄像头采集的至少一个用户的视频数据，所述音频数据为通过与所述摄像头建立通信连接的至少一个麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的音频数据，所述摄像头与所述麦克风阵列之间的距离大于阈值；

所述确定模块，用于根据所述音视频数据，确定所述至少一个用户中每个用户的行为。

本申请第三方面提供了一种用户行为分析的电子设备，包括处理器、存储器、通信接口以及一个或多个程序，其中，所述一个或多个程序被存储在所述存储器中，并且被生成由所述处理器执行，以执行一种用户行为分析方法任一项方法中的步骤的指令。

本申请第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述存储计算机程序被所述处理器执行，以实现一种用户行为分析方法任一项所述的方法。

可以看出，上述技术方案中，通过将摄像头采集的视频数据和至少一个麦克风阵列采集到的音频数据同步为音视频数据，并根据音视频数据，确定用户的行为，避免了现有方案中只基于监控画面来分析用户行为所导致的用户行为分析不准确的问题，从而提高了用户行为分析的准确性。同时，通过利用麦克风阵列对采集到的声音信号进行编码，实现了在摄像头与麦克风阵列分离的情况下提高了音频数据传输的可靠性，进而实现将音频数据超远距离传输给摄像头，从而支持将摄像头和麦克风分离部署，可以精确地采集到超远距离处纯净的音频数据。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1是本申请实施例提供的一种用户行为分析系统的示意图；

图2是本申请实施例提供的又一种用户行为分析系统的示意图；

图3是本申请实施例提供的一种用户行为分析方法的流程示意图；

图4是本申请实施例提供的又一种用户行为分析方法的流程示意图；

图5为本申请实施例提供的一种用户行为分析装置的示意图；

图6为本申请的实施例涉及的硬件运行环境的电子设备结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下分别进行详细说明。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，参见图1，图1是本申请实施例提供的一种用户行为分析系统的示意图，该用户行为分析系统包括服务器110、摄像头120、以及与摄像头120建立通信连接的至少一个麦克风阵列130。其中，至少一个麦克风阵列130与摄像头之间的距离大于阈值，其中，麦克风阵列130与摄像头之间的距离大于阈值表明麦克风阵列130可以与摄像头分离部署，也就是将麦克风阵列拉远部署。

其中，至少一个麦克风阵列与摄像头之间的距离大于阈值，可以理解为：至少一个麦克风阵列中每个麦克风阵列与摄像头之间的距离均大于阈值；或，至少一个麦克风阵列中第一麦克风阵列与摄像头之间的距离大于第一阈值，至少一个麦克风阵列中第二麦克风阵列与摄像头之间的距离大于第二阈值，第一阈值和第二阈值不同。阈值例如可以为10米-1000米中的任意一个值，在此不做限制。第一阈值和第二阈值例如可以为10米-1000米中的任意两个不同的值，在此不做限制。这样就可以将至少一个麦克风阵列部署在不同位置，可以采集到任意一个地点处的声音信号，提高采集到的音频的纯净度。

可以看出，在本方案中，通过将摄像头采集的视频数据和至少一个麦克风阵列采集到的音频数据同步为音视频数据，并根据音视频数据，确定用户的行为，避免了现有方案中只基于监控画面来分析用户行为所导致的用户行为分析不准确的问题，从而提高了用户行为分析的准确性。同时，通过利用麦克风阵列对采集到的声音信号进行编码，实现了在摄像头与麦克风阵列分离的情况下提高了音频数据传输的可靠性，进而实现将音频数据超远距离传输给摄像头，从而支持将摄像头和麦克风分离部署，可以精确地采集到超远距离处纯净的音频数据。

可以理解的，本申请中，摄像头120可以为普清摄像头、高清摄像头、鱼眼摄像头、广角摄像头等，在此不做限制。

需要说明的，在本申请中，摄像头120可以为一个或多个摄像头，在此不做限制。

可选的，图1中的各网元(例如服务器110、摄像头120、至少一个麦克风阵列130等)可以由一个设备实现，也可以由多个设备共同实现，还可以是一个设备内的一个功能模块，本申请实施例对此不作具体限定。可以理解的是，上述功能既可以是硬件设备中的网络元件，也可以是在专用硬件上运行的软件功能，或者是平台(例如，云平台)上实例化的虚拟化功能。

例如，图1中的各设备均可以通过图2中的通信装置200来实现。图2所示为可适用于本申请实施例提供的通信装置的硬件结构示意图。该通信装置200包括至少一个处理器201，通信线路202，存储器203以及至少一个通信接口204。

处理器201可以是一个通用中央处理器(central processing unit，CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本申请方案程序执行的集成电路。

通信线路202可包括一通路，在上述组件之间传送信息。

通信接口204，是任何收发器一类的装置(如天线等)，用于与其他设备或通信网络通信，如以太网，RAN，无线局域网(wireless local area networks，WLAN)等。

存储器203可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过通信线路202与处理器相连接。存储器也可以和处理器集成在一起。本申请实施例提供的存储器通常可以具有非易失性。其中，存储器203用于存储执行本申请方案的计算机执行指令，并由处理器201来控制执行。处理器201用于执行存储器203中存储的计算机执行指令，从而实现本申请下述实施例提供的方法。

可选的，本申请实施例中的计算机执行指令也可以称之为应用程序代码，本申请实施例对此不作具体限定。

在一种可能的实施方式中，处理器201可以包括一个或多个CPU，例如图2中的CPU0和CPU1。

在一种可能的实施方式中，通信装置200可以包括多个处理器，例如图2中的处理器201和处理器207。这些处理器中的每一个可以是一个单核(single-CPU)处理器，也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在一种可能的实施方式中，若通信装置200为服务器110，则通信装置200还可以包括输出设备205和输入设备206。输出设备205和处理器201通信，可以以多种方式来显示信息。例如，输出设备205可以是液晶显示器(liquid crystal display，LCD)，发光二级管(light emitting diode，LED)显示设备，阴极射线管(cathode ray tube，CRT)显示设备，或投影仪(projector)等。输入设备206和处理器201通信，可以以多种方式接收用户的输入。例如，输入设备206可以是鼠标、键盘、触摸屏设备或传感设备等。

上述的通信装置200可以是一个通用设备或者是一个专用设备。本申请实施例不限定通信装置200的类型。

参见图3，图3是本申请实施例提供的一种用户行为分析方法的流程示意图。该用户行为分析方法可以用户行为分析系统，所述用户行为分析系统包括服务器、摄像头、以及与所述摄像头建立通信连接的至少一个麦克风阵列，所述摄像头与所述麦克风阵列之间的距离大于阈值，如图3所示，所述方法可以包括：

301、所述服务器获取音视频数据，所述音视频数据为对视频数据和音频数据进行同步后的数据，所述视频数据为通过所述摄像头采集的至少一个用户的视频数据，所述音频数据为所述麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的音频数据。

其中，步骤301可以包括：服务器从摄像头获取音视频数据。

其中，所述麦克风阵列采集的所述至少一个用户的声音信号，可以理解为：所述麦克风阵列在预设区域内采集的所述至少一个用户的声音信号，预设区域为所述麦克风阵列能采集到声音信号的区域，这个预设区域可以是该麦克风阵列周围的区域，这样由于麦克风阵列拉远部署，从而该麦克风阵列采集到的声音信号就是距离摄像头较远距离处的用户的声音信号，由于该麦克风只采集周围区域的声音信号，从而可以采集到纯净的声音信号，相比现有技术中在采集距离摄像头较远处的声音信号时，则需要增强麦克风阵列的采集能力，但是这种采集方式会将整个路径上的声音信号采集，采集到的声音比较复杂，难以对用户行为进行精确的分析。

举例来说，若现有想要采集100m处的音频数据，则需要将从以摄像头为起点，100m处为终点的路径上的所有的声音信号，而本申请中可以将麦克风阵列直接部署在100m处，这样就可以直接采集100m处周围的信号，而无需采集整个路径上的信号，可以保证采集到较为纯净的信号，提高监控的精确度。即可以实现摄像头与麦克风阵列分离的情况下，采集一定范围内的声音信号。

可选的，所述音频数据为所述麦克风阵列对第一数字信号进行信道编码后数据，所述第一数字信号为对第二数字信号进行压缩编码后的信号，所述第二数字信号为对所述麦克风阵列采集的所述至少一个用户的声音信号进行数字转换后的信号。

其中，音频数据为麦克风阵列对第一数字信号进行信道编码后的数据，可以理解为：音频数据为麦克风阵列采用RS前向纠错编码或其他信道编码算法对第一数字信号进行信道编码后数据。

其中，第一数字信号为对第二数字信号进行压缩编码后的信号，可以理解为：第一数字信号为采用OPUS压缩编码或压缩编码算法对第二数字信号进行压缩编码后的信号，第一数字信号的内存小于第二数字信号的内存。

示例性的，在麦克风阵列侧集成有音频转换模块、编码模块和通信模块，则麦克风阵列在采集到用户的声音信号后，可通过音频转换模块对用户的声音信号进行数字转换得到第二数字信号；然后，将数字信号输入到编码模块，通过编码模块先对第二数字信号进行压缩编码，得到第一数字信号，再对第一数字信号进行信道编码，得到该音频数据；最后，将该音频数据输入到通信模块，通过该通信模块将该音频数据传输给摄像头。

可选的，所述音视频数据为所述摄像头采用预设音视频同步编码对所述视频数据和所述音频数据进行同步后发送至所述服务器的数据，所述音频数据为所述麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的通过无线传输发送给所述摄像头的音频数据。

其中，所述预设音视频同步编码可以包括以下一种：H.264、H.265。可以理解的，预设音视频同步编码还可以是其他的音视频同步编码技术，在此不做限制。

需要说明的，在本申请中，音视频数据可以为所述摄像头内置的处理器采用预设音视频同步编码对所述视频数据和所述音频数据进行同步后发送至所述服务器的数据，在此不做限制。

其中，无线传输例如可以包括蓝牙、第四代移动通信技术(4th generationmobile networks，4G)、第五代移动通信技术(5th generation mobile networks，5G)等，在此不做限制。

302、所述服务器根据所述音视频数据，确定所述至少一个用户中每个用户的行为。

可选的，步骤302可以包括：所述服务器对所述音视频数据进行语音识别，得到所述音视频数据对应的文本信息；所述服务器获取所述文本信息中包括的敏感词，所述敏感词为与用户行为关联的敏感词；所述服务器根据所述音视频数据，确定所述每个用户的动作；所述服务器根据所述文本信息中包括的敏感词和所述每个用户的动作，确定所述每个用户的行为。

其中，所述服务器对所述音视频数据进行语音识别，得到所述音视频数据对应的文本信息，可以包括：所述服务器提取所述音视频数据中的语音数据；所述服务器对所述语音数据进行编码，得到所述语音数据对应的第一特征向量；所述服务器将所述第一特征向量输入编码器，得到第二特征向量，所述编码器是根据第一语音样本集训练得到的，所述第一语音样本集包括不同用户行为所对应的语音数据的第一特征向量；所述服务器根据所述第二特征向量，确定所述文本信息。

其中，服务器对语音数据进行编码，得到该语音数据对应的第一特征向量，例如，服务器可以采用独热编码对语音数据进行编码，得到该语音数据对应的第一特征向量。

其中，服务器根据第二特征向量，确定音视频数据对应的文本信息，可以包括：服务器将第二特征向量输入语音识别模型，以得到音视频数据对应的文本信息，语音识别模型是根据第二语音样本集训练得到的，该第二语音样本集是该编码器在输入第一语音样本集时输出的语音样本集。

可以理解的，编码器可以与语音识别模型级联。换句话来说，例如，将第一特征向量输入编码器，得到第二特征向量后，第二特征向量可以输入到语音识别模型。

示例性的，敏感词例如可以包括“打人”，每个用户的动作可能包括抬手、脚踢之类的，那么可以确定存在打架斗殴的行为。

可以看出，上述技术方案中，通过根据音视频数据确定敏感词以及用户的动作，避免了现有方案中只基于监控画面来分析用户行为所导致的用户行为分析不准确的问题，从而提高了用户行为分析的准确性。同时，通过对两次不同的编码，使得编码后的语音数据可以更加贴合某种行为下的特征，进而可以获得更加贴近某种行为下的文本信息，进一步提高了用户行为分析的准确性。

可选的，所述服务器获取所述文本信息中包括的敏感词，包括：所述服务器对所述文本信息中的无效字段进行过滤，得到过滤后的文本信息；所述服务器获取预设敏感词集合，所述预设敏感词集合包括至少一个预设敏感词；所述服务器根据至少一个预设敏感词，确定所述过滤后的文本信息中包括的敏感词。

其中，无效字段可以由管理员配置，或预先配置在服务器中，或根据不同用户行为所对应的语音数据确定的无法支持用户行为分析的字段，在此不做限制。

其中，预设敏感词集合可以由管理员配置，或预先配置在服务器中，或根据不同用户行为所对应的语音数据确定的能支持用户行为分析的关键词，在此不做限制。

需要说明的，在本申请中，无法支持用户行为分析的字段例如可以包括停用词、助词等，在此不做限制。

可以看出，上述技术方案中，通过过滤文本信息中的无效字段，并根据过滤后的文本信息来确定敏感词，提高了敏感词确定的效率。

可选的，所述服务器根据所述音视频数据，确定所述每个用户的动作，包括：所述服务器获取所述音视频数据中的至少一帧图像；所述服务器确定所述至少一帧图像中每帧图像包括的动作；所述服务器根据所述每帧图像包括的动作，确定所述每个用户的动作。

其中，至少一帧图像可以为包括的用户数量高于阈值的图像，阈值可以由管理员配置，或预先配置在服务器中，在此不做限制。

其中，服务器确定所述至少一帧图像中每帧图像包括的动作，例如可以包括：服务器对每帧图像进行特征提取，得到每帧图像对应的特征向量；服务器根据每帧图像对应的特征向量，确定每帧图像包括的动作。

可以理解的，服务器可以采用神经网络中的卷积层对每帧图像进行特征提取，得到每帧图像对应的特征向量，该神经网络是基于视频样本预先训练好的，该视频样本中的每帧图像均包括不同用户行为所对应的动作。

可以看出，上述技术方案中，通过确定每帧图像包括的动作来确定每个用户的动作，实现了更加精准的确定用户的动作。同时，避免了基于音视频数据确定用户动作时处理数据量过大的问题。

另外，服务器还可以依次对语音数据进行声纹识别、语音分离识别、人员定位等，在此不做限制。

参见图4，图4是本申请实施例提供的又一种用户行为分析方法的流程示意图。该用户行为分析方法可以用户行为分析系统，所述用户行为分析系统包括服务器、摄像头、以及与所述摄像头建立通信连接的至少一个麦克风阵列，所述摄像头与所述麦克风阵列之间的距离大于阈值，如图4所示，所述方法可以包括：

401、所述服务器获取音视频数据，所述音视频数据为对视频数据和音频数据进行同步后的数据，所述视频数据为通过所述摄像头采集的至少一个用户的视频数据，所述音频数据为所述麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的音频数据。

其中，关于步骤401，可以参考上述相关描述，在此不加赘述。

402、所述服务器对所述音视频数据进行语音识别，得到所述音视频数据对应的文本信息。

其中，关于步骤402，可以参考上述相关描述，在此不加赘述。

403、所述服务器获取所述文本信息中包括的敏感词，所述敏感词为与用户行为关联的敏感词。

其中，关于步骤403，可以参考上述相关描述，在此不加赘述。

404、所述服务器根据所述音视频数据，确定所述每个用户的动作。

其中，关于步骤404，可以参考上述相关描述，在此不加赘述。

405、所述服务器根据所述文本信息中包括的敏感词和所述每个用户的动作，确定所述每个用户的行为。

其中，关于步骤405，可以参考上述相关描述，在此不加赘述。

可以看出，上述技术方案中，通过将摄像头采集的视频数据和部署在摄像头监控范围内的至少一个麦克风阵列采集到的音频数据同步为音视频数据，并根据音视频数据，确定用户的行为，避免了现有方案中只基于监控画面来分析用户行为所导致的用户行为分析不准确的问题，从而提高了用户行为分析的准确性。同时，通过利用麦克风阵列对采集到的声音信号进行编码，实现了在摄像头与麦克风阵列分离的情况下提高了音频数据传输的可靠性，进而实现将音频数据超远距离传输给摄像头，从而支持将摄像头和麦克风分离部署，可以精确地采集到超远距离处纯净的音频数据。

参见图5，图5为本申请实施例提供的一种用户行为分析装置的示意图。其中，如图5所示，本申请实施例提供的一种用户行为分析装置500包括获取模块501和确定模块502。

所述获取模块501，用于获取音视频数据，所述音视频数据为对视频数据和音频数据进行同步后的数据，所述视频数据为通过摄像头采集的至少一个用户的视频数据，所述音频数据为通过与所述摄像头建立通信连接的至少一个麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的音频数据，所述摄像头与所述麦克风阵列之间的距离大于阈值；

所述确定模块502，用于根据所述音视频数据，确定所述至少一个用户中每个用户的行为。

可选的，在根据所述音视频数据，确定所述至少一个用户中每个用户的行为时，所述确定模块502，具体用于对所述音视频数据进行语音识别，得到所述音视频数据对应的文本信息；获取所述文本信息中包括的敏感词，所述敏感词为与用户行为关联的敏感词；根据所述音视频数据，确定所述每个用户的动作；根据所述文本信息中包括的敏感词和所述每个用户的动作，确定所述每个用户的行为。

可以看出，上述技术方案中，通过根据音视频数据确定敏感词以及用户的动作，避免了现有方案中只基于监控画面来分析用户行为所导致的用户行为分析不准确的问题，从而提高了用户行为分析的准确性。

可选的，在获取所述文本信息中包括的敏感词时，所述确定模块502，用于对所述文本信息中的无效字段进行过滤，得到过滤后的文本信息；获取预设敏感词集合，所述预设敏感词集合包括至少一个预设敏感词；根据至少一个预设敏感词，确定所述过滤后的文本信息中包括的敏感词。

可以看出，上述技术方案中，通过过滤文本信息中的无效字段，并根据过滤后的文本信息来确定敏感词，提高了敏感词确定的效率。

可选的，在对所述音视频数据进行语音识别，得到所述音视频数据对应的文本信息时，所述确定模块502，用于提取所述音视频数据中的语音数据；对所述语音数据进行编码，得到所述语音数据对应的第一特征向量；将所述第一特征向量输入编码器，得到第二特征向量，所述编码器是根据第一语音样本集训练得到的，所述第一语音样本集包括不同用户行为所对应的语音数据的第一特征向量；根据所述第二特征向量，确定所述文本信息。

可以看出，上述技术方案中，通过对两次不同的编码，使得编码后的语音数据可以更加贴合某种行为下的特征，进而可以获得更加贴近某种行为下的文本信息，进一步提高了用户行为分析的准确性。

可选的，在根据所述音视频数据，确定所述每个用户的动作时，所述确定模块502，用于获取所述音视频数据中的至少一帧图像，其中，所述至少一帧图像为包括的用户数量高于阈值的图像；确定所述至少一帧图像中每帧图像包括的动作；根据所述每帧图像包括的动作，确定所述每个用户的动作。

参见图6，图6为本申请的实施例涉及的硬件运行环境的电子设备结构示意图。

本申请实施例提供了一种用户行为分析的电子设备，包括处理器、存储器、通信接口以及一个或多个程序，其中，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，以执行包括任一项用户行为分析方法中的步骤的指令。其中，如图6所示，本申请的实施例涉及的硬件运行环境的电子设备可以包括：

处理器601，例如CPU。

存储器602，可选的，存储器可以为高速RAM存储器，也可以是稳定的存储器，例如磁盘存储器。

通信接口603，用于实现处理器601和存储器602之间的连接通信。

本领域技术人员可以理解，图6中示出的电子设备的结构并不构成对其的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图6所示，存储器602中可以包括操作系统、网络通信模块以及一个或多个程序。操作系统是管理和控制服务器硬件和软件资源的程序，支持一个或多个程序的运行。网络通信模块用于实现存储器602内部各组件之间的通信，以及与电子设备内部其他硬件和软件之间通信。

在图6所示的电子设备中，处理器601用于执行存储器602中一个或多个程序，实现以下步骤：

获取音视频数据，所述音视频数据为对视频数据和音频数据进行同步后的数据，所述视频数据为通过所述摄像头采集的至少一个用户的视频数据，所述音频数据为所述麦克风阵列对所述麦克风阵列采集的所述至少一个用户的声音信号进行编码后的音频数据；

根据所述音视频数据，确定所述至少一个用户中每个用户的行为。

本申请涉及的电子设备的具体实施可参见上述用户行为分析方法的各实施例，在此不做赘述。

本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述存储计算机程序被所述处理器执行，以实现以下步骤：

根据所述音视频数据，确定所述至少一个用户中每个用户的行为。

本申请涉及的计算机可读存储介质的具体实施可参见上述用户行为分析方法的各实施例，在此不做赘述。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应所述知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应所述知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：唐军;
专利申请人：深圳市冠标科技发展有限公司;

上一篇：主动标识载体及其管理方法、服务平台
下一篇：一种图像处理方法及装置