掌桥专利:专业的专利平台
掌桥专利
首页

基于虚拟形象的语音交互方法、电子设备及存储介质

文献发布时间:2024-04-18 19:58:26


基于虚拟形象的语音交互方法、电子设备及存储介质

技术领域

本发明的实施方式涉及信息处理技术领域,更具体地,本发明的实施方式涉及基于虚拟形象的语音交互方法,以及执行前述语音交互方法的电子设备和计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述可包括可以探究的概念,但不一定是之前已经想到或者已经探究的概念。因此,除非在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术,并且并不因为包括在本部分中就承认是现有技术。

人工智能聊天服务是一种为用户提供随时可用虚拟语音助手的服务,可以通过一虚拟人与用户进行语音对话交互。然而,目前关于该人工智能聊天服务的技术多是闭源的,且一些电子设备(例如,词典笔、听力学习机、扫描翻译笔等)受限于软硬件配置,使得该项人工智能聊天服务技术尚未在该类电子设备上具体落地,形成一定的技术瓶颈。

发明内容

已知的针对电子设备上落地基于虚拟形象的语音交互设计效果不理想,这是非常令人烦恼的过程。

为此,非常需要一种改进的基于虚拟形象的语音交互方案,利用虚拟摄像头实现与语音答复相关的虚拟形象图像和音频信息的同步播放。

在本上下文中,本发明的实施方式期望提供一种基于虚拟形象的语音交互方法、电子设备及存储介质。

在本发明实施方式的第一方面中,提出了一种基于虚拟形象的语音交互方法,包括:响应于接收到用户语音数据,获取关于所述用户语音数据的语音答复;生成关于所述语音答复的虚拟形象图像和音频信息;构建虚拟摄像头设备,并将所述虚拟形象图像和所述音频信息写入所述虚拟摄像头设备中;以及对所述虚拟摄像头设备所存储的数据进行读取播放。

在本发明的一个实施例中,构建虚拟摄像头设备包括:在操作系统中安装并加载目标内核模块,以基于所述目标内核模块为所述虚拟摄像头设备提供驱动;以及基于所述目标内核模块创建所述虚拟摄像头设备。

在本发明的另一个实施例中,生成关于所述语音答复的虚拟形象图像和音频信息包括:基于训练好的虚拟形象生成模型对所述语音答复进行处理,以输出关于所述语音答复的虚拟形象图像和音频信息。

在本发明的又一个实施例中,将所述虚拟形象图像和所述音频信息写入所述虚拟摄像头设备中包括:将所述虚拟形象生成模型输出的每一帧虚拟形象图像和其对应的音频信息写入所述虚拟摄像头设备中。

在本发明的再一个实施例中,将所述虚拟形象生成模型输出的每一帧虚拟形象图像和其对应的音频信息写入所述虚拟摄像头设备中包括:调用操作系统中的目标应用程序接口将所述每一帧虚拟形象图像和其对应的音频信息写入所述虚拟摄像头设备中。

在本发明的一个实施例中,对所述虚拟摄像头设备所存储的数据进行读取播放包括:调用音视频播放器对所述虚拟摄像头设备所存储的数据进行读取播放。

在本发明的另一个实施例中,获取用户语音数据包括:基于本地端的录音组件录制所述用户语音数据;或获取外部设备发送的所述用户语音数据。

在本发明的又一个实施例中,获取关于所述用户语音数据包括:将所述用户语音数据发送至云端服务器;以及获取所述云端服务器基于所述用户语音数据反馈的脉冲编码调制格式的语音答复。

在本发明实施方式的第二方面中,提供了一种电子设备,包括:处理器;以及存储器,其存储有基于虚拟形象的语音交互的计算机指令,当所述计算机指令由所述处理器运行时,使得所述电子设备执行根据前文以及下文多个实施例所述的方法。

在本发明实施方式的第三方面中,提供了一种计算机可读存储介质,包含有基于虚拟形象的语音交互的程序指令,当所述程序指令由处理器执行时,使得实现根据前文以及下文多个实施例所述的方法。

根据本发明实施方式的基于虚拟形象的语音交互方法、电子设备及存储介质,可以利用与用户语音数据相关的语音答复来生成虚拟形象图像和音频信息,并基于所构建的虚拟摄像头对虚拟形象图像和音频信息进行同步展示。由此,该基于虚拟形象的语音交互技术在具体落地时,仅需要电子设备具备读取虚拟摄像头的功能即可实现虚拟形象图像和音频信息的同步,无需再额外针对虚拟形象图像和音频信息设计缓冲同步逻辑,突破了语音交互技术无法落地低配设备的技术瓶颈。

附图说明

通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:

图1示意性地示出了适于实现本发明实施方式的示例性计算系统100的框图;

图2示意性地示出了根据本发明一个实施例的基于虚拟形象的语音交互方法的流程示意图;

图3示意性地示出了根据本发明另一个实施例的基于虚拟形象的语音交互方法的流程示意图;

图4示意性地示出了根据本发明又一个实施例的基于虚拟形象的语音交互方法的流程示意图;以及

图5示意性地示出了根据本发明实施例的电子设备的结构示意图。

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

图1示出了适于实现本发明实施方式的示例性计算系统100的框图。如图1所示,计算系统100可以包括:中央处理单元(CPU)101、随机存取存储器(RAM)102、只读存储器(ROM)103、系统总线104、硬盘控制器105、键盘控制器106、串行接口控制器107、并行接口控制器108、显示控制器109、硬盘110、键盘111、串行外部设备112、并行外部设备113和显示器114。这些设备中,与系统总线104耦合的有CPU 101、RAM 102、ROM 103、硬盘控制器105、键盘控制器106、串行控制器107、并行控制器108和显示控制器109。硬盘110与硬盘控制器105耦合,键盘111与键盘控制器106耦合,串行外部设备112与串行接口控制器107耦合,并行外部设备113与并行接口控制器108耦合,以及显示器114与显示控制器109耦合。应当理解,图1所述的结构框图仅仅是为了示例的目的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况增加或减少某些设备。

本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式,本文一般称为“电路”、“模块”、“单元”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是,但不限于,电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举示例)例如可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络(包括局域网(LAN)或广域网(WAN))连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

下面将参照本发明实施例的方法的流程图和设备(或系统)的框图描述本发明的实施方式。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。

也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置的产品。

也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。

根据本发明的实施方式,提出了一种基于虚拟形象的语音交互方法、电子设备及存储介质。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。

下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。

发明概述

发明人发现,目前针对电子设备上落地虚拟形象的语音交互设计效果不理想。具体地,通常该类虚拟形象的语音交互设计(例如人工智能聊天服务)多是闭源的,仅限于在某类(例如IOS)系统中运行。另外,该类虚拟形象的语音交互设计一般落地在一些配置较高的设备中,其对系统配置要求较高,普适性较差。

对此,发明人经研究发现,电子设备中的音视频播放器可以读取摄像头中的音视频数据进行播放。基于此,可以针对交互过程中产生的语音答复生成虚拟形象图像和对应的音频,并在电子设备中创建用于存储虚拟形象图像和对应的音频的虚拟摄像头,以通过对虚拟摄像头设备的数据写入和数据读取,实现虚拟形象的语音交互设计在电子设备中的具体落地。

在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。

示例性方法

下面参考图2来描述根据本发明示例性实施方式的基于虚拟形象的语音交互方法。需要注意的是,本发明的实施方式可以应用于适用的任何场景。

图2示意性地示出了根据本发明一个实施例的基于虚拟形象的语音交互方法200(以下简称方法200)的流程示意图。

如图2所示,在步骤S201处,可以响应于接收到用户语音数据,获取关于该用户语音数据的语音答复。该用户语音数据可以理解是用户与电子设备人机交互过程中的交互数据。通常用户可以以语音形式向电子设备输入该用户语音信息。例如通过电子设备的录音接口录制该用户语音数据,或者用户通过外部设备录制语音数据并传送至该电子设备,又或者用户向外部设备输入文字数据,然后外部设备将该文字设备转换成语音数据并发送至电子设备。而电子设备则可以根据该用户语音信息给出相应的语音答复。需要说明的是,方法200所适应的人机交互场景并不进行限定,例如可以是口语对话练习场景,或者生活或工作中的咨询类交互场景等。另外,这里对用户语音数据的描述为示例性说明,具体可以根据用户与电子设备之间的人机交互设计来调整。

在步骤S202处,可以生成关于语音答复的虚拟形象图像和音频信息。在根据用户语音数据获取到相关的语音答复之后,可以根据该语音答复来生成虚拟形象图像和音频信息,以便借助虚拟形象图像和音频信息来对语音答复进行可视化展示。

在步骤S203处,可以构建虚拟摄像头设备,并将虚拟形象图像和音频信息写入虚拟摄像头设备中。通过构建虚拟摄像头设备,以基于该虚拟摄像头设备实现对虚拟形象图像和音频信息的缓存对齐处理。

在步骤S204处,可以对前述的虚拟摄像头设备所存储的数据进行读取播放。

由此,可以针对交互过程中产生的语音答复生成虚拟形象图像和对应的音频,并在电子设备中创建用于存储虚拟形象图像和对应的音频的虚拟摄像头,以通过对虚拟摄像头设备的数据写入和数据读取来实现虚拟形象图像和音频信息的同步展示,使得基于虚拟形象的语音交互技术在具体落地时,仅需要电子设备具备读取虚拟摄像头的功能即可实现虚拟形象图像和音频信息的同步,无需再额外针对虚拟形象图像和音频信息设计缓冲同步逻辑,突破了语音交互技术无法落地低配设备的技术瓶颈。

图3示意性地示出了根据本发明另一个实施例的基于虚拟形象的语音交互方法300(以下简称方法300)的流程示意图。可以理解的是,方法300是对图2中方法200的进一步限定和/或拓展。因此,前文结合图2的相关细节性描述同样也适用于下文。

如图3所示,在步骤S301处,可以获取用户语音数据,并将该用户语音数据发送至云端服务器。在一些实施例中,可以通电子设备的录音接口对用户的音频数据进行采集,以得到脉冲编码调制(Pulse Code Modulation,简称PCM)格式的用户语音数据。当然,也可以通过外部录音设备来采集用户语音数据,并将采集到的用户语音数据发送至电子设备。需要说明的,这里对用户语音数据的相关细节性描述仅是示例性说明,具体可以根据电子设备与用户之间的人机交互设计来调整。

另外,本实施例中考虑到电子设备的配置以及对用户语音数据的响应速度等,可以将用户语音数据发送至云端服务器进行处理。在实际应用中,若电子设备能够支持语音答复的生成,可以在电子设备的本地端生成关于交互信息的语音答复。

在步骤S302处,获取可以获取云端服务器基于用户语音数据反馈的脉冲编码调整格式的语音答复。在一些实施例中,云端服务器在接收到交互信息之后,可以将交互信息转换为文字、进行文字内容识别和语义识别等、针对文字内容进行答复以及将答复内容转换成PCM格式的语音答复。云端服务器在生成语音答复之后,可以将该语音答复下发至电子设备。

在步骤S303处,可以基于训练好的虚拟形象生成模型对语音答复进行处理,以输出关于该语音答复的虚拟形象图像和音频信息。这里的虚拟形象生成模型可以通过对神经网络模型训练得到。例如,在一些实施例中,可以获取作为训练数据的语料,然后抓取关于这些语料的真人表情和/或肢体动作(例如真人朗读这些语料时的面部表情和/或动作),基于抓取到的真人表情和/或肢体动作生成虚拟形象的表情和/或肢体动作,然后基于这些语料和对应的虚拟形象的表情和/或肢体动作对神经网络模型进行训练,使得训练得到的虚拟形象生成模型具备基于语音生成对应的虚拟形象图像和音频信息的功能。需要说明的是,这里的虚拟形象可以是固定形象,虚拟形象生成模型根据每一帧语音生成匹配的表情和/或肢体动作,将所生成的表情和/肢体动作与固定形象融合得到每一帧的虚拟形象图像,所得到的每一帧虚拟形象图像和音频信息是对齐的。

另外,前述的固定形象可以是单一的形象,也可以是多个不同的形象。当为单一的形象时,后续展示给每个用户的形象是统一的。当为多个不同的形象时,可以将这些不同形象展示给用户,供用户选择,使得后续展示给每个用户的形象可以根据用户设置进行调整,从而提升用户的使用体验。

此外,虚拟形象生成模型在利用语音生成虚拟形象图像过程中,可以使用原始语音作为该虚拟形象图像对应的音频信息。又或者,还可以对原始语音进行处理(例如进行变音处理等),以生成与虚拟形象图像更加贴合的音频信息。

需要说明的是,上述对虚拟形象生成模型的相关描述仅是示例性说明,本发明的方案并不局限于此,其他能够支持虚拟形象图像和音频信息生成的技术也适用于本申请。

在得到虚拟形象图像和音频信息之后,可以构建虚拟摄像头设备。具体地,在步骤S304处,可以在操作系统中安装并加载目标内核模块,以基于该目标内核模块为虚拟摄像头设备提供驱动,以及基于该目标内核模块创建前述的虚拟摄像头设备。在一些实施场景中,该目标内核模块可以包括V4L2模块。该V4L2是Video for linux2的简称,为Linux中关于视频设备的内核驱动。在Linux中,视频设备是设备文件,可以像访问普通文件一样对其进行读写。可以通过该V4L2模块实现虚拟摄像头设备的构建。需要说明的是,这里仅以V4L2模块为例来进行说明,本发明的方案并不局限于此,可以根据电子设备的具体操作系统来调整目标内核模块的具体类型。

接着,在步骤S305处,可以将虚拟形象生成模型输出的每一帧虚拟形象图像和其对应的音频信息写入虚拟摄像头设备中。在完成虚拟摄像头设备的构建之后,可以将虚拟形象生成模型输出的每一帧虚拟形象图像和其对应的音频信息写入虚拟摄像头设备中,以基于虚拟摄像头设备自身性能实现虚拟形象图像和音频信息的缓存和对齐。

具体地,在一些实施例中,可以调用操作系统中的目标应用程序接口将每一帧虚拟形象图像和其对应的音频信息写入虚拟摄像头设备中。其中,该目标应用程序接口可以是系统自带的接口,也可以是根据实际需求设计的接口。例如,可以调用操作系统的接口(例如write接口)将虚拟形象图像和其对应的音频信息写入虚拟摄像头设备中。

在步骤S306处,可以调用音视频播放器对虚拟摄像头设备所存储的数据进行读取播放。在一些实施例中,大部分播放器都能够直接打开以及读取摄像头设备,这里的音视频播放器可以选用基于Fast Forward Mpeg(简称FFmpeg)的播放器。其中,FFmpeg是一个功能强大的音视频处理工具,可以用来进行音视频采集、编码、解码、转换等操作。该基于FFmpeg的音视频播放器具体可以调用命令或者使用C语言对虚拟摄像头设备进行读取播放。需要说明的是,这里对音视频播放器的细节性描述仅是举例说明,本发明并不对音视频播放器的类型进行限制,可以支持对虚拟摄像头设备中内容的读取播放即可。

图4示意性地示出了根据本发明又一个实施例的基于虚拟形象的语音交互方法400(以下简称方法400)的流程示意图。可以理解的是,方法400是对图2中方法200和图3中方法300的进一步限定和/或拓展。因此,前文结合图2和图3的相关细节性描述同样也适用于下文。另外,在图4中,对接方案和本地算法都是在电子设备的本地端实施,云端用于生成语音答复。当然,根据电子设备的具体配置,也可以在本地端生成语音答复。

如图4所示,在步骤S401处,可以接收用户语音数据。在一些实施例中,可以通过设备的录音接口采集用户的音频数据,以得到用户语音数据。一般来说,通过配置录音接口的采样率、采集通道、采样精度等参数,就可以采集到语音的数据流(例如,可以是PCM格式语音或者PCM的进一步压缩格式语音等)。其中,PCM是声音的模拟信号(波形)以一定的采样率(时间间隔)采样量化后的一种数字信号格式,该PCM数据流的格式大致可以是包含很多采样点值的数组,例如数组[0x1122,0x2312,...]。

在步骤S402处,可以将该用户语音数据发送至云端服务器,由云端服务器将语音转换成文字。例如,可以通过自动语音识别技术(简称ASR)将语音形式的交互信息转换成文字。在步骤S403处,可以对所转换的文字进行语义识别,基于语音分析识别结果返回答复。接着,在步骤S404处,可以将文字形式的答复转换成语音形式的答复。例如,可以使用语音合成技术(简称TTS)将文字形式的答复转换成语音形式的答复。

在云端服务器生成语音答复之后,可以将语音答复反馈至本地端。在步骤S405处,可以利用本地算法对语音答复进行处理。本地算法具体可以通过预训练的虚拟形象生成模型来实现,将语音答复(例如PCM格式的语音答复)输入至虚拟形象生成模型中,然后基于该虚拟形象生成模型生成符合这段语音口型的AI虚拟人画面的数据以及符合AI虚拟人形象的语音音色的数据。

在得到虚拟形象图像和音频信息之后,需要将该虚拟形象图像和音频信息同步播放出来。然而,所生成的虚拟形象图像和音频信息并不是类似mp4的音视频文件数据,其不能直接使用常见的视频播放器进行播放。因此,需要构建虚拟摄像头设备来实现虚拟形象图像和音频信息的同步播放。

具体地,在步骤S406处,可以虚拟出一个摄像头设备。在一些实施例中,在linux操作系统中,可以基于v4l2loopback模块虚拟出一个摄像头设备(例如,摄像头节点:/dev/video0)。具体地,可以在操作系统中安装v4l2loopback内核模块,然后加载该内核模块,并创建虚拟视频节点,以完成虚拟摄像头设备的创建。

在步骤S407处,可以将音视频(包括前述的虚拟形象图像和音频信息)写入所创建的虚拟摄像头设备(例如,虚拟的V4L2设备/dev/video0)中。具体地,可以调用write接口等操作系统接口将虚拟形象图像(例如RGB格式的图像)和其对应的音频信息(例如PCM格式的音频)写入虚拟摄像头设备中。

在步骤S408处,可以从虚拟摄像头设备中读取播放所存储的虚拟形象图像和音频信息。具体地,大部分播放器的软件开发工具包都支持直接打开本地摄像头(包括前文所述的在本地端构建的虚拟摄像头设备),这里可以直接使用基于FFmpeg的播放器读取和播放虚拟摄像头设备所存储的虚拟形象图像和音频信息。

由此,该基于虚拟形象的语音交互技术在电子设备上落地时,仅需要电子设备具备读取虚拟摄像头的功能(例如仅需一个支持linux下V4L2的视屏播放器)即可,无需再额外针对虚拟形象图像和音频信息设计缓冲同步逻辑。

示例性设备

在介绍了本发明示例性实施方式的方法之后,接下来,参考图5对本发明示例性实施方式的基于虚拟形象的语音交互方法的相关产品进行描述。

图5示意性地示出了根据本发明实施例的电子设备500的示意框图。如图5所示,电子设备500可以包括处理器501和存储器502。其中存储器502存储有基于虚拟形象的语音交互的计算机指令,当所述计算机指令由处理器501运行时,使得便电子设备500执行根据前文结合图2~图4所描述的方法。例如,在一些实施例中,电子设备500可以接收用户语音数据、获取关于用户语音数据的语音答复、生成关于语音答复的虚拟形象图像和音频信息、构建虚拟摄像头设备以写入虚拟形象图像和音频信息,读取播放虚拟摄像头设备所存储的数据等等。基于此,基于虚拟形象的语音交互技术在电子设备500上落地过程中,仅需要电子设备具备读取虚拟摄像头的功能即可实现虚拟形象图像和音频信息的同步,无需再额外针对虚拟形象图像和音频信息设计缓冲同步逻辑,突破了语音交互技术无法落地低配设备的技术瓶颈。

另外,本实例中的电子设备500可以包括词典笔、听力学习机、扫描翻译笔或者其他需要布设基于虚拟形象的语音交互设计的设备。

应当注意,尽管在上文详细描述中提及了设备的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。

申请文件中提及的动词“包括”、“包含”及其词形变化的使用不排除除了申请文件中记载的那些元素或步骤之外的元素或步骤的存在。元素前的冠词“一”或“一个”不排除多个这种元素的存在。

虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。

相关技术
  • 一种语音交互方法、装置、电子设备及可读存储介质
  • 一种语音交互的方法、电子设备及计算机存储介质
  • 基于区块链的虚拟形象交互方法、终端及可读存储介质
  • 一种虚拟形象视频播放方法、装置、电子设备及存储介质
  • 虚拟形象的创建方法、装置、电子设备与存储介质
  • 基于虚拟形象的语音交互方法、电子设备及存储介质
  • 直播间虚拟形象的交互方法、装置、电子设备和存储介质
技术分类

06120116487172