掌桥专利:专业的专利平台
掌桥专利
首页

聊天信息处理方法及装置

文献发布时间:2023-06-19 11:52:33


聊天信息处理方法及装置

技术领域

本发明涉及信息处理领域,具体涉及一种聊天信息处理方法及装置。

背景技术

即时聊天工具可以在两名或多名用户之间传递即时消息,是最流行的互联网通讯工具之一。目前用户使用输入法进行聊天的时候,尤其是群聊的时候,一问一答的情况不多,往往存在用户A连续说了多句话,或是用户A、C、D都在说话后,用户B才回复用户A说的话,在这种情况下,有时会很难分清回复的是哪一句话或是哪个人的哪句话。

在现有技术中,虽然有些聊天工具提供了一些特定标记进行提醒,比如在微信群聊中,“@群友昵称”意味着提醒某个人,其实现方式有以下两种:长按想@的群友头像、或者在输入框输入“@”符号,并选择想提醒的人,但无论哪种实现方式,都需要用户在回复时主动添加相应标记,缺乏智能性。而且,往往有些用户没有使用这些功能的习惯或者不知道如何使用,同样会给其他用户带来不便或困扰。

发明内容

本发明实施例提供一种聊天信息处理方法及装置,以提高聊天场景中信息回复的智能性,提升用户体验。

为此,本发明提供如下技术方案:

一种聊天信息处理方法,所述方法包括:

接收用户在聊天场景中的输入信息;

获取所述聊天场景中的上文信息,所述上文信息包括一个或多个语句;

确定对应每个语句的优选回复文本;

确定所述优选回复文本中与所述输入信息相似的文本,并将相似的文本对应的语句作为待回复语句;

对所述输入信息添加与所述待回复语句相关标记;

接收到用户的发送指令后,发送添加相关标记后的输入信息。

可选地,所述获取聊天场景中的上文信息包括:

利用聊天工具提供的接口获取聊天场景中的上文信息。

可选地,所述获取聊天场景中的上文信息包括:

截取当前聊天场景中的屏幕图像;

对所述图像进行识别得到所述聊天场景中的上文信息。

可选地,对应每个语句的优选回复文本有一个或多个。

可选地,所述聊天场景为两人对话场景或者多人群聊场景。

可选地,所述对所述输入信息添加与所述待回复语句相关标记包括:

在当前输入框中所述输入信息之前或之后添加与所述待回复语句相关标记。

可选地,所述方法还包括:

确定所述多个语句中每个语句对应的用户;

所述对所述输入信息添加与所述待回复语句相关标记包括:

如果所述多个语句对应同一个用户,则对所述输入信息添加回复所述待回复语句的文本信息;

如果所述多个语句对应不同用户,则对所述输入信息添加回复所述待回复语句的文本信息、和/或对所述输入信息添加回复所述待回复语句对应用户的标识信息。

可选地,所述确定对应每个语句的优选回复文本包括:

利用预先建立的问答匹配模型确定对应每个语句的优选回复文本。

一种聊天信息处理装置,所述装置包括:

接收模块,用于接收用户在聊天场景中的输入信息;

信息获取模块,用于获取所述聊天场景中的上文信息,所述上文信息包括一个或多个语句;

匹配模块,用于确定对应每个语句的优选回复文本;

相似文本确定模块,用于确定所述优选回复文本中与所述输入信息相似的文本,并将相似的文本对应的语句作为待回复语句;

标记添加模块,用于对所述输入信息添加与所述待回复语句相关标记;

发送模块,用于接收到用户的发送指令后,发送添加相关标记后的输入信息。

可选地,所述信息获取模块,具体用于利用聊天工具提供的接口获取聊天场景中的上文信息。

可选地,所述信息获取模块包括:

截屏单元,用于截取当前聊天场景中的屏幕图像;

识别单元,用于对所述图像进行识别得到所述聊天场景中的上文信息。

可选地,对应每个语句的优选回复文本有一个或多个。

可选地,所述聊天场景为两人对话场景或者多人群聊场景。

可选地,所述标记添加模块,具体用于在当前输入框中所述输入信息之前或之后添加与所述待回复语句相关标记。

可选地,所述信息获取模块,还用于确定所述多个语句中每个语句对应的用户;

所述装置还包括:

判断模块,用于确定所述多个语句是否对应同一个用户;

所述标记添加模块,具体用于在所述判断模块确定所述多个语句对应同一个用户时,对所述输入信息添加回复所述待回复语句的文本信息;在所述判断模块确定所述多个语句对应不同用户时,对所述输入信息添加回复所述待回复语句的文本信息、和/或对所述输入信息添加回复所述待回复语句对应用户的标识信息。

可选地,所述匹配模块,具体用于利用预先建立的问答匹配模型确定对应每个语句的优选回复文本。

一种计算机设备,包括:一个或多个处理器、存储器;

所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现前面所述的方法。

一种可读存储介质,其上存储有指令,所述指令被执行以实现前面所述的方法。

本发明实施例提供的聊天信息处理方法及装置,在聊天场景中接收到用户的输入信息后不是直接发送,而是根据当前聊天场景中的上文信息,分析用户当前的输入信息所针对的上文中的具体语句,将该语句作为待回复语句,自动对所述输入信息添加与所述待回复语句相关标记,接收到用户的发送指令后,发送添加相关标记后的输入信息,从而能够给用户带来更为清晰、快捷的聊天体验。

进一步地,在对所述输入信息添加与所述待回复语句相关标记时,可以智能地根据当前应用环境添加回复对象的标识信息或者回复具体哪一句聊天内容的标识信息。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1是本发明实施例聊天信息处理方法的一种流程图;

图2是本发明实施例聊天信息处理装置的一种结构框图;

图3是本发明实施例聊天信息处理装置的另一种结构框图;

图4是根据一示例性实施例示出的一种用于聊天信息处理方法的装置的框图;

图5是本发明实施例中服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。

考虑到现有技术中在聊天场景中用户的输入习惯,有时会出现很难分清回复的是哪一句话或是哪个人的哪句话的情况,从而给其他用户带来不便或困扰的问题,本发明实施例提供一种聊天信息处理方法及装置,在聊天场景中接收到用户的输入信息后不是直接发送,而是根据当前聊天场景中的上文信息,分析用户当前的输入信息所针对的上文中的具体语句,将该语句作为待回复语句,自动对所述输入信息添加与所述待回复语句相关标记,接收到用户的发送指令后,发送所述输入信息。

如图1所示,是本发明实施例聊天信息处理方法的一种流程图,包括以下步骤:

步骤101,接收用户在聊天场景中的输入信息。

所述聊天场景可以是两人对话场景或者多人群聊场景,对此本发明实施例不做限定。

步骤102,获取所述聊天场景中的上文信息,所述上文信息包括一个或多个语句。

所述上文信息是指所述用户收到的聊天语句,具体地,可以采用多种方法获取所述上文信息,比如:

一种方式可以是利用聊天工具提供的接口获取聊天场景中的上文信息。

另一种方式可以是截取当前聊天场景中的屏幕图像,然后对所述图像进行识别得到所述聊天场景中的上文信息。截屏和图像识别可以采用现有技术,对此本发明实施例不做限定。

由于所述聊天场景可以是两人对话场景或者多人群聊场景,因此,所述上文信息可以包括针对同一个用户的一个或多个语句,也可以包括针对不同用户的多个语句,对此本发明实施例不做限定。而且,上文语句的具体数量可以预先设定,比如最多不超过3句。

步骤103,确定对应每个语句的优选回复文本。

在本发明实施例中,可以利用现有的问答技术,比如,预先建立问答匹配模型,利用所述问答匹配模型确定对应每个语句的优选回复文本。

需要说明的是,在实际应用中,可以利用所述问答匹配模型为所述上文信息中包含的每个语句确定一个最优的回复文本。当然,为了避免单个回复文本的局限性,还可以为每个语句确定多个优选回复文本,比如按照匹配度由高到低选出两个优选回复文本。

所述问答匹配模型的具体训练过程可以采用现有技术,比如,可以搜集大量的问答数据训练得到。具体地,针对所述问答数据,对同一问题的不同回答进行得分标注,利用所述数据及其标注信息训练问答匹配模型计算问题和答案的匹配度得分。

步骤104,确定所述优选回复文本中与所述输入信息相似的文本,并将相似的文本对应的语句作为待回复语句。

前面提到,对应每个语句的优选回复文本有一个或多个。相应地,在有多个优选回复文本时,需要针对每个语句的所有优选回复文本,计算其与所述输入信息的相似度,选取相似度最大的优选回复文本作为与所述输入信息的相似文本,并将该相似文本对应的语句作为待回复语句。

文本相似度的计算可以根据文本之间的距离来确定,比如余弦距离等。

步骤105,对所述输入信息添加与所述待回复语句相关标记。

比如,可以在当前输入框中所述输入信息之前或之后添加与所述待回复语句相关标记。这样,可以使用户直观地看到待回复对象。当然,在实际应用中,为了避免出错,还可以征求用户意见,比如向用户提供是否接受标记添加结果的提示信息,如果用户选择不接受,则可以去除该标记。

进一步地,在本发明方法另一实施例中,还可以在上述步骤102获取所述上文信息后,确定所述上文信息中的每个语句对应的用户,具体可以利用聊天工具提供的接口得到。相应地,在所述上文信息中的所有语句对应同一个用户时,可以对所述输入信息添加回复所述待回复语句的文本信息;在所述上文信息中的多个语句对应不同用户时,对所述输入信息添加回复所述待回复语句的文本信息、和/或对所述输入信息添加回复所述待回复语句对应用户的标识信息。因为在群聊的场景下,通常不同用户可能对话内容会有所区别,通过标记不同用户,即可使群聊中的其他用户能够清晰地确定当前回复所对应的相应用户的哪个语句,避免在一个语句过长时,标记信息过于冗长。

比如,用户和一个朋友聊天,朋友连续说了三句话,第一句“hello”,第二句“今天天气不错,出去玩吗”,第三句“最近有什么好看的电影”。用户回了两句,第一句“hi”,第二句“最近在看速度与激情”。具有本发明方法提供的相应功能的输入法自动在第一句前添加“回复hello”,在第二句前添加“回复最近有什么好看的电影”。

再比如,用户A说:“今天天气不错,出去玩吗”,用户B说:“最近有什么好看的电影,想去看电影”,用户A说:“最近在看速度与激情”;这时用户C想回复用户B说的“最近有什么好看的电影,想去看电影”,用户C说“中国机长不错”,具有本发明方法提供的相应功能的输入法自动在该句前添加“回复B:最近有什么好看的电影,想去看电影”,或者在该句前添加“回复B”。

另外,在实际应用中,如果所述待回复语句过长,也可以截取所述待回复语句的部分内容作为相应的标记。比如,继续以上面的群聊场景为例,由于用户B说的“最近有什么好看的电影,想去看电影”语句较长,而且主要回复“最近有什么好看的电影”这半句,因此可以在用户C说“中国机长不错”语句前添加“回复B:最近有什么好看的电影”。

步骤106,接收到用户的发送指令后,发送添加相关标记后的输入信息。

可见,本发明实施例提供的聊天信息处理方法,在聊天场景中接收到用户的输入信息后不是直接发送,而是根据当前聊天场景中的上文信息,分析用户当前的输入信息所针对的上文中的具体语句,将该语句作为待回复语句,自动对所述输入信息添加与所述待回复语句相关标记,接收到用户的发送指令后,发送添加相关标记后的输入信息,从而能够给用户带来更为清晰、快捷的聊天体验。进一步地,在对所述输入信息添加与所述待回复语句相关标记时,可以智能地根据当前应用环境添加回复对象的标识信息或者回复具体哪一句聊天内容的标识信息。

相应地,本发明实施例还提供一种聊天信息处理装置,如图2所示,是该装置的一种结构框图。

在该实施例中,所述装置包括以下各模块:

接收模块201,用于接收用户在聊天场景中的输入信息;

信息获取模块202,用于获取所述聊天场景中的上文信息,所述上文信息包括一个或多个语句;

匹配模块203,用于确定对应每个语句的优选回复文本;

相似文本确定模块204,用于确定所述优选回复文本中与所述输入信息相似的文本,并将相似的文本对应的语句作为待回复语句;

标记添加模块205,用于对所述输入信息添加与所述待回复语句相关标记;

发送模块206,用于接收到用户的发送指令后,发送添加相关标记后的输入信息。

在本发明实施例中,所述聊天场景可以是两人对话场景或者多人群聊场景,对此本发明实施例不做限定。

所述上文信息是指所述用户收到的聊天语句,所述信息获取模块202具体可以通过多种方式获取所述上文信息。比如:

在一种实现方式中,所述信息获取模块202可以利用聊天工具提供的接口获取聊天场景中的上文信息。

在另一种实现方式中,所述信息获取模块202可以通过截屏及图像识别技术得到所述上文信息。在该实现方式中,所述信息获取模块202可以包括以下单元:

截屏单元,用于截取当前聊天场景中的屏幕图像;

识别单元,用于对所述图像进行识别得到所述聊天场景中的上文信息。

截屏和图像识别可以采用现有技术,对此本发明实施例不做限定。

需要说明的是,在本发明实施例中,所述匹配模块203可以利用现有的问答技术,确定对应每个语句的优选回复文本,而且,对应每个语句的优选回复文本有一个或多个,对此本发明实施例不做限定。

相应地,在有多个优选回复文本时,所述相似文本确定模块204需要针对每个语句的所有优选回复文本,计算其与所述输入信息的相似度,选取相似度最大的优选回复文本作为与所述输入信息的相似文本,并将该相似文本对应的语句作为待回复语句。

所述标记添加模块205具体可以在当前输入框中所述输入信息之前或之后添加与所述待回复语句相关标记。这样,可以使用户直观地看到待回复对象。当然,在实际应用中,为了避免出错,还可以征求用户意见,比如通过信息提示模块(未图示)向用户提供是否接受标记添加结果的提示信息,如果用户选择不接受,则所述标记添加模块205还可以去除该标记。

在本发明装置另一实施例中,如图3所示,还可以包括:判断模块401。

在该实施例中,所述上文信息包含多个语句。所述信息获取模块202还用于确定所述上文信息中每个语句对应的用户;所述判断模块401用于确定所述多个语句是否对应同一个用户。

相应地,在该实施例中,所述标记添加模块205可以在所述判断模块402确定所述多个语句对应同一个用户时,对所述输入信息添加回复所述待回复语句的文本信息;在所述判断模块402确定所述多个语句对应不同用户时,对所述输入信息添加回复所述待回复语句的文本信息、和/或对所述输入信息添加回复所述待回复语句对应用户的标识信息。

另外,在实际应用中,如果所述待回复语句过长,所述标记添加模块205也可以截取所述待回复语句的部分内容作为相应的标记,对此本发明实施例不做限定。

本发明实施例提供的聊天信息处理装置,可以应用于两人对话的聊天场景,也可以应用于多人群聊场景。在聊天场景中接收到用户的输入信息后不是直接发送,而是根据当前聊天场景中的上文信息,分析用户当前的输入信息所针对的上文中的具体语句,将该语句作为待回复语句,自动对所述输入信息添加与所述待回复语句相关标记,接收到用户的发送指令后,发送添加相关标记后的输入信息,从而能够给用户带来更为清晰、快捷的聊天体验。进一步地,在对所述输入信息添加与所述待回复语句相关标记时,可以智能地根据当前应用环境添加回复对象的标识信息或者回复具体哪一句聊天内容的标识信息。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

需要说明的是,本发明实施例的聊天信息处理装置并不仅限于中文输入,可以适用于任何有类似需求的语种的输入。

另外,需要说明的是,本发明实施例的方法及装置,可以应用于各种终端设备中,比如手机、计算机、笔记本等设备。

图4是根据一示例性实施例示出的一种用于聊天信息处理方法的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。

处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理部件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述聊天信息处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图5是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 聊天系统、聊天装置及聊天服务器的控制方法、信息存储介质
  • 聊天系统、聊天装置及聊天服务器的控制方法、信息存储介质
技术分类

06120113083888