导航：首页> 光学>基于虚拟聊天室的信息交互方法、服务器、存储介质和电子设备

基于虚拟聊天室的信息交互方法、服务器、存储介质和电子设备

文献发布时间：2024-04-18 20:00:50

技术领域

本申请涉及信息处理技术领域，具体而言，涉及一种基于虚拟聊天室的信息交互方法、服务器、存储介质和电子设备。

背景技术

随着科学技术的不断发展，人工智能逐步走进人们生活的各个技术领域。如ChatGPT(Chat Generative Pre-trained Transformer)便是一种基于人工智能的聊天程序。

ChatGPT可以基于人工智能技术驱动自然语言处理工具，其基于在预训练阶段所见的模式和统计规律，来生成回答，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流。

但发明人发现，在一些特定的应用场景下(如直播场景)，目前的人机交互方式受限于文本形式体现，使得部分信息交互过程可能会缺乏一定的体验感。例如，部分文字障碍者就无法体验人工智能带来的科技体验感。

发明内容

本申请公开了一种基于虚拟聊天室的信息交互方法、服务器、存储介质和电子设备。所述信息交互方法包括接收来自用户的用户信息，用户信息包括第一信息和用户所选择的预设虚拟形象的类型；根据第一信息通过人工智能技术生成对应的交互信息；根据预设虚拟形象的类型确定与交互信息对应的声音类型；使预设虚拟形象基于声音类型以语音形式在用户端呈现交互信息。

根据本申请的一些实施例，接收来自用户的第一信息和用户确定的预设虚拟形象的类型之前，方法还包括：判断出用户进入虚拟聊天室，通过预设虚拟形象向用户发送第二信息；其中，第二信息包括预设用语信息和预设动作信息。

根据本申请的一些实施例，在使预设虚拟形象基于语气类型以语音形式在用户端呈现交互信息之前，方法还包括：确定与交互信息所对应的表情配置信息；使预设虚拟形象基于语气类型以语音形式在用户端呈现交互信息包括：使预设虚拟形象以语音形式在用户端显示交互信息的同时，以预设速度呈现表情配置信息。

根据本申请的一些实施例，根据第一信息生成对应的交互信息包括：在第一信息为第一语音信息的情况下，将第一语音信息转化为第一文本信息；基于第一文本信息通过人工智能技术生成文本交互信息；将文本交互信息转换为语音交互信息。

根据本申请的另一方面，公开了一种服务器。所述服务器包括信息接收模块、信息处理模块和信息交互模块。信息接收模块接收来自用户的用户信息，用户信息包括第一信息和用户所选择的预设虚拟形象的类型；信息处理模块根据第一信息通过人工智能技术生成对应的交互信息，根据预设虚拟形象的类型确定与交互信息对应的声音类型；信息交互模块使预设虚拟形象基于声音类型以语音形式在用户端呈现交互信息。

根据本申请的一些实施例，信息接收模块判断出用户进入虚拟聊天室的情况下，信息交互模块通过预设虚拟形象向用户发送第二信息；其中，第二信息包括预设用语信息和预设动作信息。

根据本申请的一些实施例，信息处理模块确定与交互信息所对应的表情配置信息，并使预设虚拟形象以语音形式在用户端显示交互信息的同时，以预设速度呈现表情配置信息。

根据本申请的一些实施例，信息处理模块在第一信息为第一语音信息的情况下，将第一语音信息转化为第一文本信息，基于第一文本信息通过人工智能技术生成文本交互信息，并将文本交互信息转换为语音交互信息。

根据本申请的又一方面，本申请提供了一种非易失性计算机可读存储。所述存储介质上存储有计算机程序，该计算机程序可以实现如上文所述的信息交互方法。

根据本申请的又一方面，本申请提供了一种电子设备。所述电子设备包括一个或多个处理器和存储装置，存储装置用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器可以实现如上文所述的信息交互方法。

本申请提供的信息交互方法通过接收来自用户的信息，将用户信息通过信息转换技术生成对应的交互信息，并通过预设虚拟形象以语音形式呈现至用户，可以实现基于人工智能的“虚拟形象”与人类的无障碍互动。该信息交互方法扩展了人机交互的应用场景，不再受限制于传统的文字形式的交互，提高了人机交互的效率和体验感。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本申请示例实施例的信息交互方法的一流程图；

图2示出本申请示例实施例的信息交互方法的又一流程图；

图3示出本申请示例实施例的信息交互的示意图；

图4示出本申请示例实施例的服务器的示意图。

附图标记说明：

服务器1、信息接收模块10、信息处理模块20、信息交互模块30。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本申请将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有这些特定细节中的一个或更多，或者可以采用其它的方式、组元、材料、装置等。在这些情况下，将不详细示出或描述公知结构、方法、装置、实现、材料或者操作。

此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

下面结合本申请实施例中的附图，对本申请的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的一方面，提供了一种基于虚拟聊天室的信息交互方法，该信息交互方法接收来自用户的信息，将用户信息通过信息转换技术生成对应的交互信息，并通过预设虚拟形象以语音形式呈现至用户，可以实现基于人工智能的“虚拟形象”与人类的无障碍互动。该信息交互方法扩展了人机交互的应用场景，不再受限制于传统的文字形式的交互，提高了人机交互的效率和体验感。

图1示出本申请示例实施例的信息交互方法的一流程图。如图1所示，该信息交互方法包括步骤S100-S400。示例性地，该信息交互方法可以由服务器所执行。

在步骤S100中，服务器接收来自用户的用户信息，用户信息包括第一信息和用户所选择的预设虚拟形象的类型。

预设场景包括但不限于是直播场景，还可以是即时聊天或视频对话等场景，本申请对比不做限制。虚拟聊天室内配置有预设虚拟形象，这里可以理解的是，虚拟聊天室和预设虚拟形象可以为服务器基于用户需求所预设配置的。

根据示例实施例，用户所输入的第一信息包括文字信息或语音信息等包括用户聊天意图的信息。

虚拟形象指通过数字技术模拟真实的人物形象生成的三维卡通人物模型。预设虚拟形象的类型包括但不限于如虚拟形象种类、虚拟形象性格等，虚拟形象可以是人类、动物或其它预设的卡通形象，虚拟性格可以为温柔、彪悍、幽默等。

用户通过预设场景进入虚拟聊天室，通过虚拟聊天室的信息采集组件(如文字输入组件或语音录入组件)输入聊天信息并选择想要进行聊天对话的虚拟形象的类型。

可选地，虚拟形象的类型也可以是服务器在虚拟聊天室中所预设确定的。

在步骤S200中，服务器根据第一信息通过人工智能技术生成对应的交互信息。

服务器接收用户的第一信息，并对第一信息进行信息处理生成对应的回复信息。示例性地，服务器基于大语言模型对用户输入的第一信息生成回复信息。大语言模型(LLM)是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理自然语言对话，实现基于人工智能的人机交互。

图2示出本申请示例实施例的信息交互方法的又一流程图；图3示出本申请示例实施例的信息交互的示意图。如图2所示，步骤S200还可以包括步骤S210-S230。

在步骤S210中，服务器在第一信息为第一语音信息的情况下，将第一语音信息转化为第一文本信息。

在步骤S220中，服务器基于第一文本信息通过人工智能技术生成文本交互信息。

在步骤S230中，服务器将文本交互信息转换为语音交互信息。

例如，如图3所示，用户通过信息采集组件(如麦克风)输入语音信息，服务器基于语音转文本技术将用户聊天信息转换为文本交互数据(文本数据)，并基于大语言模型生成与该文本数据所对应的回复信息，并再次通过文本转语音技术生成该回复信息对应的语音交互信息，并将语音交互信息反馈至用户端。

可选地，服务器还可以对所处理的交互信息进行敏感词过滤处理。

在步骤S300中，服务器根据预设虚拟形象的类型确定与交互信息对应的声音类型。

在步骤S400中，服务器使预设虚拟形象基于声音类型以语音形式在用户端呈现交互信息。

例如，服务器根据用户所选取的虚拟形象的类型确定与该虚拟形象对应的声音类型。虚拟形象的声音类型可以包括语气、声调、方言、动物叫声等等，也可以包括顽皮、温柔、幽默、阳刚等类型。虚拟形象的声音类型是基于大语言模型所训练配置的，虚拟形象的声音类型与虚拟形象在配置时设置为同一类型。

服务器在用户端使预设虚拟形象基于声音类型(如语气)将回复信息以语音形式反馈给用户端，以和用户通过预设虚拟形象进行人机交互。

可选地，服务器向用户端发送的交互信息也可以为文字版交互信息。

可选地，在步骤S100之前，服务器判断出用户进入虚拟聊天室，则通过预设虚拟形象向用户发送第二信息。第二信息包括预设用语信息和预设动作信息。

例如，用户通过预设路径进入虚拟聊天室后，服务器通过预设虚拟形象向用户播放欢迎语和欢迎动作，如此可以增强人机交互的趣味性。

可选地，在步骤S400之前，服务器还确定与交互信息所对应的表情配置信息。以及服务器使预设虚拟形象以语音形式在用户端播放交互信息的同时，以预设速度呈现表情配置信息。

例如，服务器还确定与回复信息所对应的表情配置信息，如表情配置信息可以为开心、苦恼、愤怒或悲伤等类型。服务器可以在用户端显示回复信息的同时，以预设速度(如50帧/s)驱动预设虚拟形象呈现表情信息，可以增强人机交互的趣味性。

示例性地，服务器可以基于Unity(实时3D互动内容创作和运营平台)技术实现预设虚拟形象的驱动。

本申请的另一方面提供了一种服务器，该服务器用于执行如上文所述的信息交互方法。图4示出本申请示例实施例的服务器的示意图，如图4所示，服务器1包括信息接收模块10、信息处理模块20、信息交互模块30。

根据示例实施例，信息接收模块10接收来自用户的用户信息，用户信息包括第一信息和用户所选择的预设虚拟形象的类型。

根据示例实施例，用户所输入的第一信息包括文字信息或语音信息等包括用户聊天意图的信息。

可选地，虚拟形象的类型也可以是服务器在虚拟聊天室中所预设确定的。

信息处理模块20根据第一信息通过人工智能技术生成对应的交互信息。

信息接收模块10接收用户的第一信息，信息处理模块20对第一信息进行信息处理生成对应的回复信息。示例性地，信息处理模块20基于大语言模型对用户输入的第一信息生成回复信息。大语言模型(LLM)是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理自然语言对话，实现基于人工智能的人机交互。

可选地，信息处理模块20在第一信息为第一语音信息的情况下，将第一语音信息转化为第一文本信息，基于第一文本信息通过人工智能技术生成文本交互信息，并将文本交互信息转换为语音交互信息。

例如，用户通过信息采集组件(如麦克风)输入语音信息，信息处理模块20基于语音转文本技术将用户聊天信息转换为文本交互数据(文本数据)，并基于大语言模型生成与该文本数据所对应的回复信息，并再次通过文本转语音技术生成该回复信息对应的语音交互信息。

可选地，信息处理模块20还可以对所处理的交互信息进行敏感词过滤处理。

根据示例实施例，信息处理模块20根据预设虚拟形象的类型确定与交互信息对应的声音类型，以及信息交互模块30使预设虚拟形象基于声音类型以语音形式在用户端呈现交互信息。

例如，信息处理模块20根据用户所选取的虚拟形象的类型确定与该虚拟形象对应的声音类型。虚拟形象的声音类型可以包括语气、声调、方言、动物叫声等，也可以包括顽皮、温柔、幽默、阳刚等类型。虚拟形象的声音类型是基于大语言模型所训练配置的，虚拟形象的声音类型与虚拟形象在配置时设置为同一类型。

信息交互模块30在用户端使预设虚拟形象基于声音类型(如语气)将回复信息以语音形式反馈给用户端，以和用户通过预设虚拟形象进行人机交互。

可选地，信息交互模块30向用户端发送的交互信息也可以为文字版交互信息。

可选地，信息接收模块10判断出用户进入虚拟聊天室的情况下，信息交互模块30通过预设虚拟形象向用户发送第二信息。第二信息包括预设用语信息和预设动作信息。

例如，用户通过预设路径进入虚拟聊天室后，信息交互模块30通过预设虚拟形象向用户播放欢迎语和欢迎动作，如此可以增强人机交互的趣味性。

可选地，信息处理模块20确定与交互信息所对应的表情配置信息，信息交互模块30使预设虚拟形象以语音形式在用户端显示交互信息的同时，以预设速度呈现表情配置信息。

例如，信息处理模块20还确定与回复信息所对应的表情配置信息，如表情配置信息可以为开心、苦恼、愤怒或悲伤等类型。信息交互模块30可以在用户端显示回复信息的同时，以预设速度(如50帧/s)驱动预设虚拟形象呈现表情信息，可以增强人机交互的趣味性。

示例性地，信息交互模块30可以基于Unity(实时3D互动内容创作和运营平台)技术实现预设虚拟形象的驱动。

本申请通过接收来自用户的信息，将用户信息通过信息转换技术生成对应的交互信息，并通过预设虚拟形象以语音形式呈现至用户，可以实现基于人工智能的“虚拟形象”与人类的无障碍互动。本申请扩展了人机交互的应用场景，不再受限制于传统的文字形式的交互，提高了人机交互的效率和体验感。

最后应说明的是，以上所述仅为本申请的优选实施例而已，并不用于限制本申请，尽管参照前述实施例对本申请进行详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：北京数引科技有限公司;

上一篇：一种具有清理功能的塑料颗粒生产用造粒机
下一篇：一种宽带太赫兹表面等离子体片上聚焦与能量主动分配器件