掌桥专利:专业的专利平台
掌桥专利
首页

信息处理的方法、设备、存储介质及程序产品

文献发布时间:2023-06-19 13:46:35


信息处理的方法、设备、存储介质及程序产品

技术领域

本公开涉及人工智能中的信息流、语音技术、计算机视觉、自然语言处理(NaturalLanguage Processing,简称NLP)、即时通信等领域,尤其涉及一种信息处理的方法、设备、存储介质及程序产品。

背景技术

随着智能终端的发展,即时通信系统成为人们之间交流必不可少的工具,在即时通信系统中可以添加多个联系人并可以建立联系群组,进行单独聊天或群组聊天,如何使得即时通信系统操作越来越便捷,是即时通信系统发展的关键。

目前的即时通信系统,需要用户手动编辑并发送信息,对于手被占用,设备距离用户较远等不具备手动操作条件的情况,则无法发送信息。

发明内容

本公开提供了一种信息处理的方法、设备、存储介质及程序产品。

根据本公开的第一方面,提供了一种信息处理的方法,包括:

在有屏智能设备运行通信软件的过程中,接收用于通过所述通信软件发送信息的第一语音指令,所述第一语音指令包含待发送的目标信息的特征信息;

根据所述目标信息的特征信息,若确定所述目标信息是已有信息,且与所述特征信息匹配的备选对象的数量大于1,则展示所述备选对象;

接收用于选定备选对象的第二语音指令,所述第二语音指令包含被选定的至少一个备选对象的标识信息;

根据所述至少一个备选对象的标识信息,通过所述通信软件将所述至少一个备选对象发送给信息接收方的设备。

根据本公开的第二方面,提供了一种信息处理的设备,包括:

语音交互模块,用于在有屏智能设备运行通信软件的过程中,接收用于通过所述通信软件发送信息的第一语音指令,所述第一语音指令包含待发送的目标信息的特征信息;

备选对象展示模块,用于根据所述目标信息的特征信息,若确定所述目标信息是已有信息,且与所述特征信息匹配的备选对象的数量大于1,则展示所述备选对象;

所述语音交互模块还用于:接收用于选定备选对象的第二语音指令,所述第二语音指令包含被选定的至少一个备选对象的标识信息;

信息发送模块,用于根据所述至少一个备选对象的标识信息,通过所述通信软件将所述至少一个备选对象发送给信息接收方的设备。

根据本公开的第三方面,提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。

根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。

根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。

根据本公开的技术提高了有屏智能设备信息发送操作的便捷性、及时性和效率。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开提供的一种即时通信系统架构的示例图;

图2是本公开第一实施例提供的信息处理的方法流程图;

图3是本公开第二实施例提供的信息处理的方法流程图;

图4是本公开第三实施例提供的信息处理的设备示意图;

图5是本公开第四实施例提供的信息处理的设备示意图;

图6是用来实现本公开实施例的信息处理的方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

本公开中的术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。

本公开提供一种信息处理的方法、设备、存储介质及程序产品,应用于人工智能中的信息流、语音技术、计算机视觉、NLP、即时通信等领域,以提高设备的操作便捷性。

本公开提供的信息处理的方法,可以应用于即时通信系统,具体可以应用于如图1所示的系统架构,包括:通信软件所在的有屏智能设备10和11,作为服务端的服务器20,图1中以有屏智能设备10向有屏智能设备11的一次信息发送为例进行示例性地说明,如图1中所示,服务器20用于对有屏智能设备10发送的语音指令进行语义识别得到对应的语义信息,并将语义信息发送给有屏智能设备10。发送方的有屏智能设备10可以通过语义交互的方式实现信息发送功能。具体地,有屏智能设备10接收用户的第一语音指令,并通过服务器20获取第一语音指令的第一语义信息;根据第一语义信息,可以获取到第一语音指令所包含的待发送的目标信息的特征信息;根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量大于1,则展示备选对象;接收用于选定备选对象的第二语音指令,通过服务器20获取第二语音指令的第二语义信息;根据第二语义信息,获取第二语音指令包含的被选定的至少一个备选对象的标识信息;根据至少一个备选对象的标识信息,通过通信软件将至少一个备选对象发送给信息接收方的有屏智能设备11。

另外,有屏智能设备10也可以作为接收方,接收其他有屏智能设备发送的信息。有屏智能设备11也可以作为发送方,向其他有屏智能设备发送信息。

本公开提供的信息处理的方法,通过纯语音交互的方式实现了信息的发送,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

图2是本公开第一实施例提供的信息处理的方法流程图。本实施例提供的信息处理的方法具体可以应用于运行通信软件的有屏智能设备,例如,用于即时通信的终端设备等,本实施例此处不做具体限定。

如图2所示,该方法具体步骤如下:

步骤S201、在有屏智能设备运行通信软件的过程中,接收用于通过通信软件发送信息的第一语音指令,第一语音指令包含待发送的目标信息的特征信息。

本实施例中,在需要发送信息时,无论接收方是一个人(如即时通信系统中与一个人单聊的场景)还是多个人(如即时通信系统中与一个人群聊的场景),均可以通过语音交互的方式实现信息的发送,用户只需向有屏智能设备发送语音指令,无需用户进行手动操作。

其中,第一语音指令为用户想要发送信息时发出的语音,有屏智能设备在被唤醒后可以实时地采集用户发出的语音,也即获取到用户输入的语音指令。

在接收到第一语音指令之后,基于语音识别技术,可以获取到第一语音指令所包含的待发送的目标信息的特征信息。

其中,目标信息为待发送的信息。目标信息的特征信息用于描述目标信息的特征,根据目标信息的特征信息可以确定待发送的目标信息。

示例性地,目标信息的特征信息可以包括目标信息的信息类型,是否是已有信息等。

其中,信息类型可以包括以下至少一项:图片、语音、音频、视频、表情、文件等。

是否是已有信息是指要发送的目标信息是否是已存储的信息,如果不是已有信息,则目标信息为需要现场采集的信息,例如,现场拍摄照片,或现场录制语音等。

另外,目标信息的特征信息还可以包括其他用于描述想要发送的目标信息的特征,此处不做具体限定。

步骤S202、根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量大于1,则展示备选对象。

在获取到待发送的目标信息的特征信息之后,若确定目标信息是已有信息,可以在已有信息中确定与特征信息匹配的备选对象。如果备选对象的数量大于1,可以展示所有与特征信息匹配的备选对象。用户可以查看备选对象,并通过语音交互的方式选定至少一个备选对象作为目标信息。

步骤S203、接收用于选定备选对象的第二语音指令,第二语音指令包含被选定的至少一个备选对象的标识信息。

本实施例中,在将所有与特征信息匹配的备选对象进行展示之后,用户可以通过第二语音指令选定至少一个备选对象作为目标信息。

在接收到第二语音指令之后,基于语音识别技术,可以获取第二语音指令所包含的被选定的至少一个备选对象的标识信息。

其中,备选对象的标识信息可以是备选对象的展示位置信息、名称等能够确定备选对象的信息。备选对象的展示位置信息可以是用于描述备选对象在所展示的所有备选对象中的位置的信息,例如,展示位置信息可以包含以下至少一种:排序位置、在显示屏幕上位置信息。

示例性地,以目标信息为已有图片为例,在展示多张备选图片之后,接收到的第二语音指令可以包含如下内容:“发送第2张图片”、“选择前三张图片”、“选择最后一排图片”、“选择右上角的一张图片”等。

步骤S204、根据至少一个备选对象的标识信息,通过通信软件将至少一个备选对象发送给信息接收方的设备。

在获取到被选定的至少一个备选对象的标识信息之后,根据至少一个备选对象的标识信息可以获取到被选定的至少一个备选对象,并将被选定的至少一个备选对象作为目标信息,通过通信软件将目标信息发送给信息接收方的设备。

本公开实施例中,在有屏智能设备运行通信软件的过程中,接收用于通过通信软件发送信息的第一语音指令,第一语音指令包含待发送的目标信息的特征信息;根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量大于1,则展示备选对象;接收用于选定备选对象的第二语音指令,第二语音指令包含被选定的至少一个备选对象的标识信息;根据至少一个备选对象的标识信息,通过通信软件将至少一个备选对象发送给信息接收方的设备,能够通过纯语音交互的方式实现从多个备选对象中选择确定目标信息,并自动实现目标信息的获取和发送,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

图3是本公开第二实施例提供的信息处理的方法流程图。在上述第一实施例的基础上,本实施例中,接收用于通过通信软件发送信息的第一语音指令之后,还包括:根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量等于1,则通过通信软件将备选对象发送给信息接收方的设备。

如图3所示,该方法具体步骤如下:

步骤S301、在有屏智能设备运行通信软件的过程中,接收用于通过通信软件发送信息的第一语音指令,第一语音指令包含待发送的目标信息的特征信息。

本实施例中,在需要发送信息时,无论接收方是一个人(如即时通信系统中与一个人单聊的场景)还是多个人(如即时通信系统中与一个人群聊的场景),均可以通过语音交互的方式实现信息的发送,用户只需向有屏智能设备发送语音指令,无需用户进行手动操作。

其中,第一语音指令为用户想要发送信息时发出的语音,有屏智能设备在被唤醒后可以实时地采集用户发出的语音,也即获取到用户输入的语音指令。

例如,第一语音指令可以是用户发出的包含以下任意一内容语音:“我要发图片”、“给妈妈发个视频”、“拍张照片发给妈妈”。

在接收到第一语音指令之后,基于语音识别技术,可以获取到第一语音指令所包含的待发送的目标信息的特征信息。

其中,目标信息为待发送的信息。目标信息的特征信息用于描述目标信息的特征,根据目标信息的特征信息可以确定待发送的目标信息。

示例性地,目标信息的特征信息可以包括目标信息的信息类型,是否是已有信息等。

示例性地,目标信息的特征信息可以包括目标信息的信息类型、内容特征、以及是否是已有信息等。

其中,信息类型可以包括以下至少一项:图片、语音、音频、视频、表情、文件等。

是否是已有信息是指要发送的目标信息是否是已存储的信息,如果不是已有信息,则目标信息为需要现场采集的信息,例如,现场拍摄照片,或现场录制语音等。

目标信息的内容特征用于描述目标信息的采集时间、地点,包含的内容等。

示例性地,对于图片,第一语音指令可以包含如下信息“发送昨天拍摄的我和儿子的照片”,其中,“昨天拍摄的”“我和儿子”均是目标信息的内容特征相关的信息。

另外,目标信息的特征信息还可以包括其他用于描述想要发送的目标信息的特征,此处不做具体限定。

步骤S302、获取第一语音指令所包含的待发送的目标信息的特征信息。

本实施例中,该步骤具体可以采用如下方式实现:

获取第一语音指令对应的第一语义信息;根据第一语义信息,确定目标信息的特征信息。

其中,第一语义信息为第一语义指令对应或包含的语义信息。

示例性地,在获取到输入的第一语音指令之后,可以将第一语音指令发送给服务器。服务器识别第一语音指令的语义信息,得到第一语义信息,并将第一语义信息反馈给有屏智能设备。有屏智能设备接收第一语义指令的第一语义信息。

在获取到第一语音指令的第一语义信息之后,通过分析第一语义信息,可以获取第一语音指令所包含的待发送的目标信息的特征信息。

可选地,在获取到第一语音指令的第一语义信息之后,通过分析第一语义信息包含的内容信息,可以确定第一语音指令是否是用于发送信息的信息发送指令。

可选地,可以通过判断第一语义信息是否包含指定关键词;若第一语义信息包含指定关键词,则确定第一语音指令是信息发送指令;若第一语义信息不包含指定关键词,则确定第一语音指令不是信息发送指令。

其中,指定关键词包括至少一个用于表示信息发送意图的关键词,例如,“发送”、“发给”、“向……发”、“传送”、“传给”等,可以根据实际应用场景及经验信息进行设置和调整,本实施例此处不做具体限定。

可选地,可以使用机器学习模型分析第一语义信息的意图信息,并确定第一语义信息是否包含发送信息的意图。如果确定第一语义信息包含发送信息的意图,则确定第一语音指令是信息发送指令。如果确定第一语义信息不包含发送信息的意图,则确定第一语音指令不是信息发送指令。

示例性地,服务器可以提供训练好的用于分析语义信息是否包含信息发送意图的机器学习模型。有屏智能设备可以请求服务器判定第一语义信息是否包含发送信息的意图,服务器使用机器学习模型确定第一语义信息是否包含发送信息的意图,进一步确定第一语音指令是否是信息发送指令,并将第一语音指令是否是信息发送指令的结果反馈给有屏智能设备。

可选地,在确定第一语音指令为用于发送信息的指令后,有屏智能设备通过对第一语义信息进行分析,确定待发送的目标信息的特征信息。

可选地,根据第一语义信息确定目标信息的信息类型,可以采用如下方式实现:

将第一语义信息分别与各信息类型对应的关键语义进行匹配,确定与第一语义信息的匹配度最高的信息类型;将与第一语义信息的匹配度最高的信息类型,作为目标信息的信息类型。

通过这种方式,能够根据第一语音指令的第一语义信息,自动识别用户想要发送的目标信息的信息类型,为后续自动获取对应信息类型的目标信息提供数据基础,无需用户手动选择信息类型。

其中,每一信息类型对应一个或者多个关键语义,不同信息类型对应的关键语义均不相同,也即不同信息类型之间不存在重叠的关键语义。

示例性地,信息类型可以包括图片,图片对应的关键语义可以包括以下至少一项:图片、图像、照片、相片。

示例性地,信息类型可以包括语音,语音对应的关键语义可以包括以下至少一项:语音、录音、一段话、叮嘱、提醒。

另外,在应用于不同的场景时,信息类型对应的关键语义可以不同,信息类型对应的关键语义可以根据实际应用场景及习惯用语等进行设置和调整,本实施例此处不做具体限定。

具体地,根据预设匹配规则,确定第一语义信息与各信息类型对应的关键语义的匹配度;将与第一语义信息的匹配度最高的信息类型,作为目标信息的信息类型。

其中,预设匹配规则可以根据实际应用场景的需要进行设置和调整,此处不做具体限定。

可选地,还可以对第一语义信息进行语义分析,确定用户想要发送的信息类型。

可选地,若第一语义信息仅包含唤醒词,则确定目标信息的信息类型为设置的默认信息类型,通过支持默认信息类型的设置,能够简化用户的语音指令,提高操作的便捷性和可用性。

示例性地,对于即时通信应用软件,在与一用户聊天过程中,会不断地发送语音信息,每次发送语音信息均需要重复指定信息类型为语音,例如,第一语音指令需要包含以下信息:“小X,我要发语音”,其中“小X”表示唤醒词。通过设置默认信息类型为语音,可以简化用户的第一语音指令,用户只需说出唤醒词“小X”,随后即可录制要发的语音信息,并发送语音信息。

另外,还可以采用现有任意一种识别语音指令的语义信息中指定的信息类型的方法实现,此处不做具体限定。

可选地,还可以对第一语义信息进行语义分析,确定第一语义信息包含的目标信息的内容特征,以及是否为已有信息,具体可以采用现有技术中任意一种能够实现类似功能的方法实现,此处不再赘述。

步骤S303、根据目标信息的特征信息,判断目标信息是否是已有信息。

其中,目标信息的特征信息包括:目标信息是否是已有信息。

该步骤中,若确定目标信息是已有信息,则执行步骤S304及后续步骤,从已有信息中获取与特征信息匹配的目标信息。

若确定目标信息不是已有信息,则执行步骤S309-S310,通过语音交互的方式,现场采集目标信息。

步骤S304、若确定目标信息是已有信息,则确定与特征信息匹配的备选对象。

一种可选地实施方式中,目标信息的特征信息包括:信息类型和是否是已有信息。

可选地,该步骤具体可以采用如下方式实现:

根据目标信息的特征信息,若确定目标信息是已有信息,则根据目标信息的信息类型,确定已有的信息类型的备选对象。

示例性地,若待发送的目标信息是已有的图片,则可以确定所有已有的图片作为备选对象。

示例性地,若待发送的目标信息是已有的视频,则可以确定所有已有的视频作为备选对象。

通过这一方式,可以通过纯语音交互的方式,基于第一语音指令所包含的目标信息的信息类型,能够自动匹配和确定目标信息,无需用户手动选择待发送的目标信息,实现通过纯语音交互的方式来确定目标信息。

另一种可选地实施方式中,目标信息的特征信息包括:信息类型、内容特征、以及是否是已有信息。

可选地,该步骤具体可以采用如下方式实现:

根据目标信息的特征信息,若确定目标信息是已有信息,则根据目标信息的信息类型和内容特征,确定已有的信息类型的且与内容特征匹配的备选对象。

示例性地,若待发送的目标信息是已有的图片,且图片的内容特征包括指定时间和指定地点,则可以确定所有已有的图片中在指定时间且在指定地点采集的图片作为备选对象。其中,指定时间和指定地点为根据第一语义信息确定的目标图片的采集时间和采集地点。

示例性地,若待发送的目标信息是已有的图片,且图片的内容特征包括内容具有指定特征,则可以确定所有已有的图片中图片内容具有指定特征的图片作为备选对象。其中,指定特征为根据第一语义信息确定的目标图片的内容所具有的特征,例如,包含指定对象、具有指定颜色等。

通过这一方式,可以通过纯语音交互的方式,基于第一语音指令所包含的目标信息的信息类型和内容特征,能够更加精准地匹配和确定的待发送的目标信息,无需用户手动选择待发送的目标信息,实现通过纯语音交互的方式来确定目标信息。

在确定与特征信息匹配的备选对象之后,根据与特征信息匹配的备选对象的数量,若与特征信息匹配的备选对象的数量等于1,则执行步骤S305,将与特征信息匹配的备选对象作为目标信息,通过通信软件将目标信息发送给信息接收方的设备。

若与特征信息匹配的备选对象的数量大于1,则执行步骤S306-S308,通过语音交互的方式选择至少一个备选对象作为目标信息,并通过通信软件将目标信息发送给信息接收方的设备,以支持用户通过语音交互的方式选择指定待发送的目标信息,提高信息发送功能对用户的友好性,更加贴合实际应用场景和用户需求。

步骤S305、若与特征信息匹配的备选对象的数量等于1,则通过通信软件将备选对象发送给信息接收方的设备。

在确定与特征信息匹配的备选对象之后,根据与特征信息匹配的备选对象的数量,若与特征信息匹配的备选对象的数量等于1,可以将备选对象作为目标信息,通过通信软件将备选对象发送给信息接收方的设备,从而基于纯语音交互的方式,实现目标信息的获取及发送,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

可选地,述特征信息匹配的备选对象的数量等于1,还可以展示备选对象,并提示用户是否发送当前的备选对象。在接收到用户的确认发送语音指令后,发送当前显示的备选对象。

步骤S306、若与特征信息匹配的备选对象的数量大于1,则展示备选对象。

在确定与特征信息匹配的备选对象之后,根据与特征信息匹配的备选对象的数量,若与特征信息匹配的备选对象的数量大于1,则展示所有与特征信息匹配的备选对象,以供用户查看并指定至少一个备选对象作为目标信息。

示例性地,该步骤中可以将与特征信息匹配的备选对象,在显示屏幕的指定区域,按照一定顺序依次排列并展示。其中,指定区域和备选对象的排序规则均可以根据实际应用场景的需要进行设置和调整,本实施例此处不做具体限定。

示例性地,若备选对象为图像数据,该步骤具体可以采用如下方式实现:

若备选对象为图像数据,则展示图像数据集;响应于选定图像数据集的第三语音指令,第三语音指令包含被选定的图像数据集的标识信息;根据被选定的图像数据集的标识信息,展示被选定的图像数据集中的图像数据。

具体地,接收到用于选定图像数据集的第三语音指令之后,可以获取第三语音指令对应的第三语义信息,并从第三语义信息中提取被选定的图像数据集的标识信息。

示例性地,在获取到输入的第三语音指令之后,可以将第三语音指令发送给服务器。服务器识别第三语音指令的语义信息,得到第三语义信息,并将第三语义信息反馈给有屏智能设备。有屏智能设备接收第三语义指令的第三语义信息。

其中,图像数据集可以是有屏智能设备上的相册,例如,本地的相机相册、视频集、截屏相册、收藏相册等,和/或,云端相册等。

图像数据集的标识信息可以是图像数据集的展示位置信息、名称等能够确定图像数据集的信息。其中,图像数据集的展示位置信息可以是用于描述图像数据集在所展示的所有图像数据集中的位置的信息,例如,展示位置信息可以包含以下至少一种:排序位置、在显示屏幕上位置信息。

通过展示所有的图像数据集,使得用户可以查看并通过语音交互的方式选定其中一个图像数据集,并展示该图像数据集中的图像数据,能够支持图像数据集的选择,提高有屏智能设备的信息发送功能对用户的友好性,更加贴合实际应用场景和用户需求。

步骤S307、接收用于选定备选对象的第二语音指令,获取第二语音指令所包含的被选定的至少一个备选对象的标识信息。

在展示备选对象之后,实时采集用户的语音指令,当接收用于选定备选对象的第二语音指令时,获取第二语音指令所包含的被选定的至少一个备选对象的标识信息。

其中,备选对象的标识信息可以是备选对象的展示位置信息、名称等能够确定备选对象的信息。备选对象的展示位置信息可以是用于描述备选对象在所展示的所有备选对象中的位置的信息,例如,展示位置信息可以包含以下至少一种:排序位置、在显示屏幕上位置信息。

示例性地,以目标信息为已有图片为例,在展示多张备选图片之后,接收到的第二语音指令可以包含如下内容:“发送第2张图片”、“选择前三张图片”、“选择最后一排图片”、“选择右上角的一张图片”等。

可选地,该步骤具体可以采用如下方式实现:

获取第二语音指令对应的第二语义信息;根据第二语义信息,获取所包含的被选定的至少一个备选对象的标识信息。

其中,第二语义信息为第二语义指令对应或包含的语义信息。

示例性地,在获取到输入的第二语音指令之后,可以将第二语音指令发送给服务器。服务器识别第二语音指令的语义信息,得到第二语义信息,并将第二语义信息反馈给有屏智能设备。有屏智能设备接收第二语义指令的第二语义信息。

在获取到第二语音指令的第二语义信息之后,通过分析第二语义信息,可以获取第二语音指令所包含的被选定的至少一个备选对象的标识信息。

步骤S308、根据至少一个备选对象的标识信息,通过通信软件将至少一个备选对象发送给信息接收方的设备。

在确定至少一个备选对象的标识信息之后,根据至少一个备选对象的标识信息可以获取到被选定的至少一个备选对象,并将被选定的至少一个备选对象作为目标信息,通过通信软件将目标信息发送给信息接收方的设备。

步骤S309、若确定目标信息不是已有信息,则发出语音提示,语音提示用于提示输入待发送的目标信息。

在上述步骤S303中,若确定目标信息不是已有信息,可以确定目标信息是需要现场采集的信息,有屏智能设备发出语音提示,以提示用户输入待发送的目标信息。

步骤S310、采集目标信息,通过通信软件将目标信息发送给信息接收方的设备。

在发出语音提示之后,有屏智能设备可以实时地采集目标信息,并通过通信软件将目标信息发送给信息接收方的设备,从而通过纯语音交互的方式发送现场采集的目标信息,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

示例性地,采集目标信息包括以下至少一种:

录制待发送的语音、拍摄待发送的照片、录制待发送的视频。

示例性地,目标信息可以是现场录制的语音。该步骤可以采用如下方式实现:采集语音信息;将采集到的语义信息作为目标信息,通过通信软件将目标信息发送给信息接收方的设备。

示例性地,目标信息可以是现场采集的图像数据,如现场拍摄的图片、现场录制的视频等。该步骤可以采用如下方式实现:采集图像数据;将采集的图像数据作为目标信息,通过通信软件将目标信息发送给信息接收方的设备。

示例性地,目标信息可以是文本。该步骤可以采用如下方式实现:

采集输入语音;将输入语音转换为对应的文本信息,将文本信息作为目标信息,通过通信软件将目标信息发送给信息接收方的设备。

示例性地,目标信息可以是通话请求。该步骤可以采用如下方式实现:向服务端发送与接收方设备建立通话连接的请求。

本实施例中,在向信息接收方的设备发送信息之前,还可以自动确定接收方设备的通信地址,具体可以采用如下方式实现:

根据第一语音指令,获取接收方信息;根据接收方信息,获取接收方的设备的通信地址信息,能够根据第一语音指令自动确定接收方信息,进一步确定接收方的设备的通信地址,并向接收方设备发送目标信息,通过纯语音交互的方式实现信息发送的总体流程,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

示例性地,若第一语音指令包含接收方信息,则从第一语音指令中提取接收方信息,能够从第一语音指令中提取到接收方信息,进一步能够确定接收方的设备的通信地址,并向接收方设备发送目标信息,通过纯语音交互的方式实现信息发送的总体流程。

示例性地,若第一语音指令不包含接收方信息,且当前用户处于会话中,则获取当前会话的接收方信息,能够自动获取到当前会话中的接收方信息,进一步能够确定接收方的设备的通信地址,并向接收方设备发送目标信息,通过纯语音交互的方式实现信息发送的总体流程。

示例性地,若第一语音指令不包含接收方信息,且当前用户不处于会话中,则输出语音提示,该语音提示用于提示用户指定接收方;接收第四语音指令,获取第四语音指令的第四语义信息,从第四语义信息中提取接收方信息,能够通过纯语音交互的方式确定接收方信息,从而通过纯语音交互的方式实现信息发送的总体流程,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

可选地,接收到用于指定接收方的第四语音指令之后,可以获取第四语音指令对应的第四语义信息,并从第四语义信息中提取接收方信息。

可选地,在获取到输入的第四语音指令之后,可以将第四语音指令发送给服务器。服务器识别第四语音指令的语义信息,得到第四语义信息,并将第四语义信息反馈给有屏智能设备。有屏智能设备接收第四语义指令的第四语义信息。

本实施例中,有屏智能设备向接收方设备发送目标信息时,可以向服务端发送信息发送请求,信息发送请求包含目标信息以及接收方信息。服务端根据接收方信息,将目标信息发送给接收方的设备,从而实现信息发送的功能。

本公开实施例通过纯语音交互的方式实现信息发送的总体流程,无需用户进行任何手动操作,即使在用户的双手被占用或设备距离用户较远等不具备手动操作条件的情况,也可以及时地进行信息发送,提高了即时通信设备的发送操作的便捷性、及时性和效率。

图4是本公开第三实施例提供的信息处理的设备示意图。本公开实施例提供的信息处理的设备可以执行信息处理的方法实施例的处理流程。如图4所示,该信息处理的设备40包括:语音交互模块401,备选对象展示模块402,和信息发送模块403。

具体地,语音交互模块401,用于在有屏智能设备运行通信软件的过程中,接收用于通过通信软件发送信息的第一语音指令,第一语音指令包含待发送的目标信息的特征信息。

备选对象展示模块402,用于根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量大于1,则展示备选对象。

语音交互模块401还用于:接收用于选定备选对象的第二语音指令,第二语音指令包含被选定的至少一个备选对象的标识信息。

信息发送模块403,用于根据至少一个备选对象的标识信息,通过通信软件将至少一个备选对象发送给信息接收方的设备。

本公开实施例提供的设备可以具体用于执行上述第一实施例所提供的方法流程,所实现具体功能和技术效果此处不再赘述。

图5是本公开第四实施例提供的信息处理的设备示意图。本公开实施例提供的信息处理的设备可以执行信息处理的方法实施例的处理流程。如图5所示,该信息处理的设备50包括:语音交互模块501,备选对象展示模块502,和信息发送模块503。

具体地,语音交互模块501,用于在有屏智能设备运行通信软件的过程中,接收用于通过通信软件发送信息的第一语音指令,第一语音指令包含待发送的目标信息的特征信息。

备选对象展示模块502,用于根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量大于1,则展示备选对象。

语音交互模块501还用于:接收用于选定备选对象的第二语音指令,第二语音指令包含被选定的至少一个备选对象的标识信息。

信息发送模块503,用于根据至少一个备选对象的标识信息,通过通信软件将至少一个备选对象发送给信息接收方的设备。

可选地,目标信息的特征信息包括:信息类型和是否是已有信息。

如图5所示,备选对象展示模块502,包括:

第一备选对象确定单元5021,用于根据目标信息的特征信息,若确定目标信息是已有信息,则根据目标信息的信息类型,确定已有的信息类型的备选对象。

备选对象展示单元5022,用于若备选对象的数量大于1,则展示备选对象。

可选地,目标信息的特征信息包括:信息类型、内容特征、以及是否是已有信息。

如图5所示,备选对象展示模块502,包括:

第二备选对象确定单元5023,用于根据目标信息的特征信息,若确定目标信息是已有信息,则根据目标信息的信息类型和内容特征,确定已有的信息类型的且与内容特征匹配的备选对象;

备选对象展示单元5022,用于若备选对象的数量大于1,则展示备选对象。

可选地,如图5所示,备选对象展示模块502包括:

图像数据集展示单元5024,用于若备选对象为图像数据,则展示图像数据集。

语音交互模块501还用于:接收选定图像数据集的第三语音指令,第三语音指令包含被选定的图像数据集的标识信息。

备选对象展示单元5025,用于根据被选定的图像数据集的标识信息,展示被选定的图像数据集中的图像数据。

可选地,信息发送模块还用于:

根据目标信息的特征信息,若确定目标信息是已有信息,且与特征信息匹配的备选对象的数量等于1,则通过通信软件将备选对象发送给信息接收方的设备。

可选地,如图5所示,该信息处理的设备50还包括:目标信息采集模块504。

语音交互模块501还用于:根据目标信息的特征信息,若确定目标信息不是已有信息,则发出语音提示,语音提示用于提示输入待发送的目标信息。

目标信息采集模块504用于:采集目标信息。

信息发送模块503还用于:通过通信软件将目标信息发送给信息接收方的设备。

其中,目标信息包括以下至少一项:语音、图片、音频、视频。

可选地,如图5所示,该信息处理的设备50还包括:

特征信息确定模块505,用于:

获取第一语音指令对应的第一语义信息;根据第一语义信息,确定目标信息的特征信息。

可选地,如图5所示,该信息处理的设备50还包括:

接收方信息确定模块506,用于根据第一语音指令,获取接收方信息。

接收方通信地址确定模块507,用于根据接收方信息,获取接收方的设备的通信地址信息。

可选地,接收方信息确定模块具体用于:

若第一语音指令包含接收方信息,则从第一语音指令中提取接收方信息;若第一语音指令不包含接收方信息,且当前用户处于会话中,则获取当前会话的接收方信息;若第一语音指令不包含接收方信息,且当前用户不处于会话中,则输出语音提示,语音提示用于提示用户指定接收方;接收第四语音指令,获取第四语音指令的第四语义信息,从第四语义信息中提取接收方信息。

本公开实施例提供的设备可以具体用于执行上述第二实施例所提供的方法流程,所实现具体功能和技术效果此处不再赘述。

本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例,本公开还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如方法XXX。例如,在一些实施例中,方法XXX可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM603并由计算单元601执行时,可以执行上文描述的方法XXX的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法XXX。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术分类

06120113806156