掌桥专利:专业的专利平台
掌桥专利
首页

会话段落推送方法、装置及存储介质

文献发布时间:2023-06-19 16:06:26



技术领域

本文涉及信息处理技术,尤指一种会话段落推送方法、装置及存储介质。

背景技术

随着通信技术的发展,我们越来越依靠从通信软件里获取会话信息,进而进行工作内容的处理。

相关技术中,用户只能在同一个群聊组里通过阅读该群聊组里的全部会话内容以提取对用户有用的会话信息,进而处理相关工作内容。

然而,这种方式需要用户处于所了解的会话内容形成的群聊组中,限制性大且灵活性差,并且需要用户阅读全部的会话内容,十分耗费用户的时间精力。

发明内容

本申请实施例提供了一种会话段落推送方法、装置及存储介质,能够向用户推荐与其相关的会话段落以方便其更快地处理工作内容。

本申请提供了一种会话段落推送方法,包括:

从即时通信软件中获取至少一个会话段落以及该会话段落的所属行业;

将获取的会话段落输入至与其所属行业相同的标签提取模型和关键词提取模型中,得到所述会话段落对应的标签和关键词;

将获取的会话段落的标签、关键词,以及目标用户的预设标签输入至与获取的会话段落所属行业相同的会话段落标签、关键词与用户标签的匹配模型中,得到与所述目标用户的标签相匹配的会话段落的标签、关键词;

向所述目标用户推送与获取的会话段落的标签、关键词相对应的会话段落。

与相关技术相比,本申请提供的会话段落推送方法,由于能够提取会话段落中的标签和关键词,根据用户的标签获取相匹配的标签和关键词,并将匹配得到的标签和关键词对应的会话段落推送给用户,因此实现了与用户相关会话段落的推荐,从而方便了用户处理其工作内容。

本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。

附图说明

附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。

图1为本申请实施例提供的一种会话段落推送方法的流程示意图;

图2为本申请实施例提供的一种卡片的推送示意图;

图3为本申请实施例提供的一种关注标签示意图;

图4为本申请实施例提供的一种所关注的标签对应的消息卡片的列表示意图;

图5为本申请实施例提供的一种所关注的标签对应的消息卡片的具体信息示意图;

图6为本申请实施例提供的一种消息卡片支持转发的示意图;

图7为本申请实施例提供的一种息卡片支持评论和点赞的示意图。

具体实施方式

本文提供了一种会话段落推送方法,如图1所示,包括:

步骤101、从即时通信软件中获取至少一个会话段落以及该会话段落的所属行业。

步骤102、将获取的会话段落输入至与其所属行业相同的标签提取模型和关键词提取模型中,得到会话段落对应的标签和关键词。

在一种示例性实例中,如果一同获取的会话段落的所属行业有多个,则将获取的会话段落分别输入至与其所属行业相同的标签提取模型和关键词提取模型中。

步骤103、将获取的会话段落的标签、关键词,以及目标用户的预设标签输入至与获取的会话段落所属行业相同的会话段落标签、关键词与用户标签的匹配模型中,得到与目标用户的标签相匹配的会话段落的标签、关键词。

在一种示例性实例中,会话段落标签、关键词与用户标签的匹配模型能够根据用户的标签为其匹配相对应的会话段落标签、关键词。

步骤104、向目标用户推送与获取的会话段落的标签、关键词相对应的会话段落。

在一种示例性实例中,即时通信(Instant Messaging,IM)工作场景的最大特点是每个用户都带有职场角色属性,因此就会有不同的关注视角,而现如今信息过载的问题普遍存在,如果能够针对不同的用户职业角色推送用户关注的内容,将会大大提升工作效率和用户的舒适度。从用户的职业角色角度看,其关注的内容可以来自于开放领域,例如互联网新闻,但很大一部分是来自于与同事间的交流以及与客户间的互动而形成的会话数据,然而这些会话数据内容广、且天然没有被结构化,不具备结构化的话题属性或特征信息,所以很难被推荐技术使用,因此需要使用一些技术手段,例如自然语言处理(NaturalLanguage Processing,NLP)技术,做内容的识别、话题的抽取、分类等工作,使得数据被进一步加工成推荐技术可使用、用户可以快速理解的形式。

本申请实施例提供的会话段落推送方法,由于能够提取会话段落中的标签和关键词,根据用户的标签获取相匹配的标签和关键词,并将匹配得到的标签和关键词对应的会话段落推送给用户,因此实现了与用户相关会话段落的推荐,从而方便了用户处理其工作内容。

在一种示例性实例中,将获取的会话段落输入至与其所属行业相同的标签提取模型和关键词提取模型中之前,还包括:

首先,对于预设的每个行业,分别按照以下方式获取该行业的标签提取模型和关键词提取模型。

其次,从即时通信软件的历史消息中获取该行业的多个会话段落,以及针对获取的每个会话段落预先标注的标签和关键词。

再次,将该行业的会话段落作为输入,将对应的标签作为输出对第一预设机器学习模型进行训练,将训练好的第一预设机器学习模型作为该行业的标签提取模型;并将该行业的会话段落作为输入,将对应的关键词作为输出对第二预设机器学习模型进行训练,将训练好的第二预设机器学习模型作为该行业的关键词提取模型。

在一种示例性实例中,会话段落的标签包括以下至少之一:企业名称标签,对当前会话段落出现的负面情绪做出识别和预警的客诉标签、对当前会话段落出现的明确意图做出识别和标记的需求标签。

在一种示例性实例中,用户标签包括以下至少之一:岗位标签、负责或参与的产品名称标签,负责或参与的客户名称标签,负责或参与的项目名称标签。

在一种示例性实例中,向目标用户推送与获取的会话段落的标签、关键词相对应的会话段落,包括:

首先,对相对应的会话段落计算其标签的权重和;其中,权重是预先对会话段落的不同类型标签进行赋值得到的。

其次,按照权重和高低将相对应的会话段落进行排序后,依次推送。

在一种示例性实例中,会话段落的推送采用feed流的卡片形式进行。

在一种示例性实例中,feed流的形式可以作为一个信息出口,想要与他人或资讯建立连接,只需要刷新这一个动作,即可获得大量所需,并且不断在更新,令人沉溺,抓住用户的“注意力”。feed卡片的设计和开发兼容性强,标签等内容可以增加推送内容的可解释性、内容的趣味和可读性,提升用户体验。

在一种示例性实例中,将获取的会话段落的标签、关键词,以及目标用户的预设标签输入获取的会话段落所属行业相同的会话段落标签、关键词与用户标签的至匹配模型中之前,还包括:

首先,对于预设的每个行业,分别按照以下方式获取该行业的匹配模型。

其次,从即时通信软件的历史消息中获取该行业的多个会话段落的标签、关键词,参与形成这些会话段落的用户的标签,以及预先匹配的会话段落的标签、关键词与形成这些会话段落的用户的标签之间的对应关系。

最后,将该行业的会话段落的标签、关键词与参与形成这些会话段落的用户的标签作为输入,将预先匹配的对应关系作为输出对第三预设机器学习模型进行训练,将训练好的第三预设机器学习模型作为该行业的会话段落标签、关键词与用户标签的匹配模型。

在一种示例性实例中,向目标用户推送与获取的会话段落的标签、关键词相对应的会话段落之后,还包括:

首先,获取目标用户所操作的会话段落的标签和关键词。

其次,将获取的会话段落的标签、关键词与目标用户的标签作为输入,将获取的会话段落的标签、关键词与目标用户的标签之间形成的对应关系作为输出对相应行业的会话段落标签、关键词与用户标签的匹配模型进行再训练,将训练好的匹配模型作为该行业的会话段落标签、关键词与用户标签的匹配模型。

在一种示例性实例中,在为用户推荐了会话段落后,可以记录用户针对会话段落的操作(例如点击),因为用户点击的会话段落必然表示用户关注该会话段落,因此可以将这些信息回流进行模型的更新,即根据用户操作的会话段落的标签和关键词再进行模型训练,以使得模型更好地对相应标签的用户进行会话段落的标签和关键词的匹配,从而更好地为用户推荐其关注的会话段落。

本文还提供了一种会话段落推送方法,包括以下步骤:

步骤1、数据准备及物料抽取

步骤1.1、基础数据准备

准备人员汇报关系数据、人员岗位信息、客户关系数据、产品相关数据、项目相关数据等等我们想要聚合的话题或用户可能关心的相关话题,例如对于人形成岗位标签(如产品、销售、技术等),负责或参与的产品名,负责或参与的客户名,负责或参与的项目名等;对内容形成客户名称标签、产品名称标签、项目名称标签等,内容是否提及新需求、是否提及客诉信息等,诸如此类关注点,用作后续的聚类依据。

步骤1.2、话题聚类

使用IM会话数据和NLP技术,结合行业特点,利用模型对工作会话内容进行主题抽取、分类,形成有针对性的不同话题,将话题名称作为该段内容的标签。

步骤2、推荐系统准备

步骤2.1、算法模型搭建与开发

基于业务场景、能够获取的数据量级等实际情况,设计并搭建算法模型。

2.2、物料推荐

对接物料数据、用户行为回流数据做模型训练、调优和上线推送。

2.3、A/B Test(初期非必需)

用来对比测试不同版本模型的效果差异。

3、应用呈现

3.1、feed流的推送形式

操作简单,内容实时性高,能够很好的适应移动端和PC的不同展示特点,框架兼容性强。

3.2、feed内容卡片(信息单元)的设计和开发

将某个相同话题的会话片段,以卡片的形式呈现并推送给用户,不同的话题可以设计成不同的样式,例如#标签、@人等。

3.3、数据埋点采集用户行为

在应用上进行数据埋点,采集用户真实的行为,将行为数据回流到推荐系统用来模型的进一步学习和训练,优化推荐效果;埋点方式可以给予业务需求做前端埋点或后端埋点。

3.4、互动功能

置顶、标记、关注、点赞、评论、转发等功能。

卡片(对应上述实施例中的会话段落)的推送示意图可以如图2所示,当用户进入推荐功能进行“关注标签”操作,即可在“关注”功能下查看到用户关注的标签的消息流,关注标签示意图可以如图3所示,所关注的标签对应的消息卡片的列表示意图可以如图4所示,所关注的标签对应的消息卡片的具体信息示意图可以如图5所示。并且消息卡片支持一键转发、评论和点赞,消息卡片支持转发的示意图可以如图6所示,消息卡片支持评论和点赞的示意图如图7所示。

在一种示例性实例中,向用户推荐会话段落之前,还可以将会话段落提取出小结信息(Summary),在向用户推荐会话段落时将小结信息附在会话段落上并以卡片的形式发送给用户,如图2所示。

本文还提供了一种会话段落推送装置,包括存储器和处理器,存储器存储上保存有计算机程序,存储器上的计算机程序被处理器执行时执行如上述任意一种实施例描述的会话段落推送方法。

本文还提供了一种存储介质,存储介质上存储有计算机可执行命令,计算机可执行命令用于执行以下如上述任意一种实施例描述的会话段落推送方法。

本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。

本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。

此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

技术分类

06120114703366