掌桥专利:专业的专利平台
掌桥专利
首页

用于更新联系人信息识别模型的方法及装置、电子设备、存储介质

文献发布时间:2023-06-19 16:04:54



技术领域

本申请涉及自然语言处理技术领域,例如涉及一种用于更新联系人信息识别模型的方法及装置、电子设备、存储介质。

背景技术

目前,随着社会的进步和通信技术的发展,QQ、微信等IM(Instant Messaging,即时通讯)工具已经成为了人们沟通的工具。在使用即时通讯工具进行沟通时,人们会提及自己或他人的联系人信息,如姓名、电话号码、公司、职位、地址、邮箱地址等。为了对联系人信息进行整理并保存,通常使用联系人信息识别模型来识别并抽取在用户的会话中提及的联系人信息。然而,为了保持联系人信息识别模型的识别效果,需要对联系人信息识别模型进行优化更新,现有技术中通常通过离线的方式采集联系人信息,人工对联系人信息进行筛选,人工对筛选后的联系人信息进行标注,利用标注后的联系人信息训练联系人信息识别模型更新之前的联系人信息识别模型,以保证联系人信息识别模型的识别效果。

在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:现有技术中需要人工对联系人信息进行采集和标注,效率非常低,导致更新联系人信息识别模型的周期非常长。

发明内容

为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。

本公开实施例提供了一种用于更新联系人信息识别模型的方法及装置、电子设备、存储介质,以减少更新联系人信息识别模型的周期。

在一些实施例中,所述用于更新联系人信息识别模型的方法包括:利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;所述第一备选样本数据包括多个携带有信息类型的联系人信息;根据所述第一备选样本数据获取样本数据;根据所述样本数据获取联系人信息识别模型;利用所述联系人信息识别模型对所述初始联系人信息识别模型进行更新。

在一些实施例中,所述用于更新联系人信息识别模型的装置包括:第一获取模块,被配置为利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;所述第一备选样本数据包括多个携带有信息类型的联系人信息;第二获取模块,被配置为根据所述第一备选样本数据获取样本数据;第三获取模块,被配置为根据所述样本数据获取联系人信息识别模型;更新模块,被配置为利用所述联系人信息识别模型对所述初始联系人信息识别模型进行更新。

在一些实施例中,所述用于更新联系人信息识别模型的装置包括处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行上述的用于更新联系人信息识别模型的方法。

在一些实施例中,所述电子设备包括上述的用于更新联系人信息识别模型的装置。

在一些实施例中,所述存储介质,存储有程序指令,所述程序指令在运行时,执行上述的用于更新联系人信息识别模型的方法。

本公开实施例提供的用于更新联系人信息识别模型的方法及装置、电子设备、存储介质,可以实现以下技术效果:通过利用初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,根据第一备选样本数据获取样本数据,根据样本数据获取联系人信息识别模型,利用联系人信息识别模型对初始联系人信息识别模型进行更新。这样,由于使用了初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率,提高了获取样本数据的效率,从而能够减少更新联系人信息识别模型的周期。

以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。

附图说明

一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:

图1是本公开实施例提供的一个用于更新联系人信息识别模型的方法的示意图;

图2是本公开实施例提供的另一个用于更新联系人信息识别模型的方法的示意图;

图3是本公开实施例提供的另一个用于更新联系人信息识别模型的方法的示意图;

图4是本公开实施例提供的另一个用于更新联系人信息识别模型的方法的示意图;

图5是本公开实施例提供的另一个用于更新联系人信息识别模型的方法的示意图;

图6是本公开实施例提供的一个用于更新联系人信息识别模型的装置的示意图;

图7是本公开实施例提供的另一个用于更新联系人信息识别模型的装置的示意图。

具体实施方式

为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。

本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。

除非另有说明,术语“多个”表示两个或两个以上。

本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。

术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。

术语“对应”可以指的是一种关联关系或绑定关系,A与B相对应指的是A与B之间是一种关联关系或绑定关系。

本公开实施例中,利用电子设备利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据,根据第一备选样本数据获取样本数据,根据样本数据获取联系人信息识别模型,然后利用联系人信息识别模型对初始联系人信息识别模型进行更新,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率,提高了获取样本数据的效率,从而能够减少更新联系人信息识别模型的周期。

结合图1所示,本公开实施例提供一种用于更新联系人信息识别模型的方法,包括:

步骤S101,电子设备利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;第一备选样本数据包括多个携带有信息类型的联系人信息。

步骤S102,电子设备根据第一备选样本数据获取样本数据。

步骤S103,电子设备根据样本数据获取联系人信息识别模型。

步骤S104,电子设备利用联系人信息识别模型对初始联系人信息识别模型进行更新。

采用本公开实施例提供的用于更新联系人信息识别模型的方法,通过利用初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,根据第一备选样本数据获取样本数据,根据样本数据获取联系人信息识别模型,利用联系人信息识别模型对初始联系人信息识别模型进行更新。这样,由于使用了初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率,提高了获取样本数据的效率,从而能够减少更新联系人信息识别模型的周期。

初始联系人信息识别模型为上次更新后的联系人信息识别模型。用户的会话为用户在即时通讯工具中会话信息。电子设备利用初始联系人信息识别模型从用户在即时通讯工具中的会话信息中获取多个联系人信息,各联系人信息携带有对应的有信息类型。将获取到的多个联系人信息作为第一备选样本数据。其中,信息类型包括:人名、单位、地址、职位、电话或邮箱地址等中的一种或多种。例如,联系人信息为“人名:李某、电话:188XXXXX1111、职位:经理”。

可选地,电子设备根据第一备选样本数据获取样本数据,包括:电子设备将第一备选样本数据发送给用户交互设备,触发用户交互设备反馈第一备选样本数据对应的用户操作行为;电子设备获取用户交互设备反馈的第一备选样本数据对应的用户操作行为;电子设备根据用户操作行为获取样本数据。这样,通过将第一备选样本数据发送给对应的用户终端,并获取第一备选样本数据对应的用户操作行为,然后根据用户操作行为获取样本数据,从而能够使样本数据符合用户的需求,在提高了获取符合用户需求的样本数据的效率,从而能够在减少更新联系人信息识别模型的周期的情况下,使得更新的联系人信息识别模型更加符合用户的需求。

可选地,用户交互设备包括手机、平板、计算机等能够与用户进行交互的设备。

可选地,电子设备根据用户操作行为获取样本数据,包括:在用户操作行为包括预设的第一操作行为的情况下,电子设备获取第一操作行为对应的第二备选样本数据。电子设备对第二备选样本数据进行随机抽样获得样本数据;预设的第一操作行为为直接保存。则第二备选样本数据即为直接保存的第一备选样本数据。和/或,在用户操作行为包括预设的第二操作行为的情况下,电子设备获取第二操作行为对应的第三备选样本数据,并将第三备选样本数据确定为样本数据;预设的第二操作行为为修改后保存。第三备选样本数据即为修改后的第一备选样本数据。这样,在用户操作行为包括直接保存第一备选样本数据的情况下,对直接保存的第一备选样本数据进行随机抽样获得样本数据,在操作行为包括对第一备选样本数据进行修改,并保存修改后的第一备选样本数据的情况下,将用户修改后的第一备选样本数据确定为样本数据,能够使样本数据符合用户的需求,从而能够在减少更新联系人信息识别模型的周期的情况下,提高了更新的联系人信息识别模型的识别准确率。

可选地,第三备选样本数据通过如下方法获取:从用户交互设备获取第二操作行为对应的第三备选样本数据,即用户修改后的第一备选样本数据。

可选地,电子设备对第二备选样本数据进行随机抽样获得样本数据,包括:电子设备按照预设的第一比例或预设的抽样个数对第二备选样本数据进行随机抽样,获得样本数据。这样,通过随机抽样在打乱第二备选样本数据的顺序的同时,使得样本数据的分布情况与第二备选样本数据相同,从而能够获得与第二备选样本数据的分布情况相同的第一比例或抽样个数的样本数据,使样本数据符合用户的需求,从而能够在减少更新联系人信息识别模型的周期的情况下,使得更新的联系人信息识别模型更加符合用户的需求。

可选地,在用户操作行为包括预设的第三操作行为的情况下,电子设备获取第三操作行为对应的第四备选样本数据;电子设备忽略第三操作行为对应的第四备选样本数据;预设的第三操作行为为忽略。第四备选样本数据为用户忽略的第一备选样本数据。

在一些实施例中,电子设备通过将第一备选样本数据发送给用户,即将携带有信息类型的联系人信息发送给前端交互设备,使用户通过前端交互设备查看第一备选样本数据,然后用户通过前端交互设备直接保存第一备选样本数据、修改第一备选样本数据后保存修改后的第一备选样本数据或忽略第一备选样本数据。在用户对第一备选样本数据进行操作后,电子设备通过前端交互设备获取用户操作行为,在用户操作行为包括预设的第一操作行为,即直接保存第一备选样本数据的情况下,电子设备获取用户直接保存的第一备选样本数据,即第二备选样本数据,并对第二备选样本数据进行随机抽样获得样本数据。在用户操作行为包括预设的第二操作行为,即修改第一备选样本数据后保存修改后的第一备选样本数据的情况下,电子设备获取用户修改后的第一备选样本数据,即第三备选样本数据,将第三备选样本数据确定为样本数据。在用户操作行为包括预设的第三操作行为,即忽略第一备选样本数据的情况下,电子设备忽略第三操作行为对应的第一备选样本数据,即忽略第四备选样本数据。即不将第四备选样本数据确定为样本数据。

可选地,电子设备根据样本数据获取联系人信息识别模型,包括:电子设备获取上次更新联系人信息识别模型的间隔时长;在间隔时长大于或等于预设的时长阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据。或,电子设备获取样本数据的样本数量;在样本数量大于或等于预设的数量阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据。或,电子设备获取上次更新联系人信息识别模型的间隔时长;电子设备获取样本数据的样本数量;在间隔时长大于或等于预设的时长阈值或样本数量大于或等于预设的数量阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据。或,电子设备获取上次更新联系人信息识别模型的间隔时长;电子设备获取样本数据的样本数量;在间隔时长大于或等于预设的时长阈值且样本数量大于或等于预设的数量阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据;电子设备根据训练样本数据和测评样本数据获取联系人信息识别模型。这样,通过上次更新联系人信息识别模型的间隔时长和/或样本数据的样本数量确定是否要根据样本数据获取训练样本数据和测评样本数据,以便于利用训练样本数据和测评样本数据自动获取联系人信息识别模型,减少了更新联系人信息识别模型的周期。同时,通过上次更新联系人信息识别模型的间隔时长作为是否要根据样本数据获取训练样本数据和测评样本数据,以便于利用训练样本数据和测评样本数据自动获取联系人信息识别模型的条件,能够自动地控制更新联系人信息识别模型的周期,并保证样本数据的实时性,从而在增加了更新的联系人信息识别模型对更新时的用户的会话的识别的准确率的同时,减少了更新联系人信息识别模型的周期。

可选地,电子设备根据样本数据获取训练样本数据和测评样本数据,包括:电子设备按照预设的第二比例对样本数据进行抽样;电子设备将抽样出来的样本数据确定为训练样本数据;电子设备将未抽样出来的样本数据确定为测评样本数据。

可选地,预设的时长阈值包括:一天、一周、15天或一个月等。

可选地,电子设备根据训练样本数据和测评样本数据获取联系人信息识别模型,包括:电子设备利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型;电子设备利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的测评分数;电子设备根据测评分数获取联系人信息识别模型。这样,利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型,然后利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的测评分数,并根据测评分数获取联系人信息识别模型,从而能够自动获取测评分数对应的联系人信息识别模型,以便于利用联系人信息识别模型更新初始联系人信息识别模型,减少了更新联系人信息识别模型的周期。

可选地,预设的神经网络模型为CRF(Conditional Random Field,条件随机场)模型或LSTM-CRF(Long short-term memory Conditional Random Field,长短期记忆-条件随机场)模型等用于实体识别的模型。

可选地,电子设备利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型,包括:电子设备利用训练样本数据对预设的神经网络模型中的参数进行迭代训练;在迭代的次数大于或等于预设测试的情况下,电子设备将训练好的神经网络模型确定为备选联系人信息识别模型。

可选地,备选联系人信息识别模型对应的测评分数包括备选联系人信息识别模型对应的F1分数。

可选地,电子设备根据测评分数获取联系人信息识别模型,包括:在测评分数大于或等于预设的分数阈值的情况下,电子设备将备选联系人信息识别模型确定为联系人信息识别模型。这样,使得联系人信息识别模型对应的测评分数大于或等于预设的分数阈值,提高了联系人信息识别模型识别联系人信息的准确率的同时,减少了更新联系人信息识别模型的周期。

在一些实施例中,在备选联系人信息识别模型对应的F1分数大于或等于预设的分数阈值的情况下,电子设备将备选联系人信息识别模型确定为联系人信息识别模型。

结合图2所示,本公开实施例提供一种用于更新联系人信息识别模型的方法,包括:

步骤S201,电子设备利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;第一备选样本数据包括多个携带有信息类型的联系人信息。

步骤S202,电子设备根据第一备选样本数据获取样本数据。

步骤S203,电子设备获取上次更新联系人信息识别模型的间隔时长;

步骤S204,在间隔时长大于或等于预设的时长阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据。

步骤S205,电子设备根据利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型。

步骤S206,电子设备利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的测评分数。

步骤S207,在测评分数大于或等于预设的分数阈值的情况下,电子设备将备选联系人信息识别模型确定为联系人信息识别模型。

步骤S208,电子设备利用联系人信息识别模型对初始联系人信息识别模型进行更新。

采用本公开实施例提供的用于更新联系人信息识别模型的装置,通过初始联系人信息识别模型在用户的会话中获取第一备选样本数据,根据第一备选样本数据获取样本数据,在上次更新联系人信息识别模型的间隔时长大于或等于预设的时长阈值的情况下,根据样本数据获取训练样本数据和测评样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率和实时性,提高了获取样本数据的效率和实时性,然后利用了获取的效率和实时性高的样本数据中的训练样本对预设的神经网络模型进行训练,测评样本数据获取备选联系人信息识别模型的测评分数,以将测评分数大于或等于预设的分数阈值的备选联系人信息识别模型确定为联系人信息识别模型,从而在提高联系人信息识别模型识别联系人信息的准确率的同时,能够减少更新联系人信息识别模型的周期。

结合图3所示,本公开实施例提供一种用于更新联系人信息识别模型的方法,包括:

步骤S301,电子设备利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;第一备选样本数据包括多个携带有信息类型的联系人信息。

步骤S302,电子设备根据第一备选样本数据获取样本数据。

步骤S303,电子设备获取样本数据的样本数量;

步骤S304,在样本数量大于或等于预设的数量阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据。

步骤S305,电子设备根据利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型。

步骤S306,电子设备利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的F1分数。

步骤S307,在F1分数大于或等于预设的分数阈值的情况下,电子设备将备选联系人信息识别模型确定为联系人信息识别模型。

步骤S408,电子设备利用联系人信息识别模型对初始联系人信息识别模型进行更新。

采用本公开实施例提供的用于更新联系人信息识别模型的装置,通过初始联系人信息识别模型在用户的会话中获取第一备选样本数据,根据第一备选样本数据获取样本数据,在样本数量大于或等于预设的数量阈值的情况下,根据样本数据获取训练样本数据和测评样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率和实时性,提高了获取样本数据的效率和数量,然后利用了获取的至少数量阈值个数的样本数据中的训练样本数据对预设的神经网络模型进行训练,测评样本数据获取备选联系人信息识别模型的F1分数,以将F1分数大于或等于预设的分数阈值的备选联系人信息识别模型确定为联系人信息识别模型,从而在提高联系人信息识别模型识别联系人信息的准确率的同时,能够减少更新联系人信息识别模型的周期。

结合图4所示,本公开实施例提供一种用于更新联系人信息识别模型的方法,包括:

步骤S401,电子设备利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;第一备选样本数据包括多个携带有信息类型的联系人信息。

步骤S402,电子设备根据第一备选样本数据获取样本数据。

步骤S403,电子设备获取上次更新联系人信息识别模型的间隔时长;

步骤S404,电子设备获取样本数据的样本数量;

步骤S405,在间隔时长大于或等于预设的时长阈值或样本数量大于或等于预设的数量阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据;

步骤S406,电子设备根据利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型。

步骤S407,电子设备利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的F1分数。

步骤S408,在F1分数大于或等于预设的分数阈值的情况下,电子设备将备选联系人信息识别模型确定为联系人信息识别模型。

步骤S409,电子设备利用联系人信息识别模型对初始联系人信息识别模型进行更新。

采用本公开实施例提供的用于更新联系人信息识别模型的装置,通过初始联系人信息识别模型在用户的会话中获取第一备选样本数据,根据第一备选样本数据获取样本数据,在间隔时长大于或等于预设的时长阈值或样本数量大于或等于预设的数量阈值的情况下,根据样本数据获取训练样本数据和测评样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率的同时,提高了样本数据的数量或实时性,使得利用了样本数据进行训练和测评的联系人信息识别模型的识别准确率更高,从而在提高联系人信息识别模型识别联系人信息的准确率的同时,能够减少更新联系人信息识别模型的周期。

结合图5所示,本公开实施例提供一种用于更新联系人信息识别模型的方法,包括:

步骤S501,电子设备利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;第一备选样本数据包括多个携带有信息类型的联系人信息。

步骤S502,电子设备将第一备选样本数据发送给用户交互设备,触发用户交互设备反馈第一备选样本数据对应的用户操作行为。

步骤S503,电子设备获取用户交互设备反馈的第一备选样本数据对应的用户操作行为。

步骤S504,在用户操作行为包括预设的第一操作行为的情况下,电子设备获取第一操作行为对应的第二备选样本数据;预设的第一操作行为为直接保存;

步骤S505,电子设备对第二备选样本数据进行随机抽样获得样本数据;

步骤S506,在操作行为包括预设的第二操作行为的情况下,电子设备获取第二操作行为对应的的第三备选样本数据;预设的第二操作行为为修改后保存。

步骤S507,电子设备将第三备选样本数据确定为样本数据。

步骤S508,电子设备获取上次更新联系人信息识别模型的间隔时长;

步骤S509,电子设备获取样本数据的样本数量;

步骤S510,在间隔时长大于或等于预设的时长阈值且样本数量大于或等于预设的数量阈值的情况下,电子设备根据样本数据获取训练样本数据和测评样本数据;

步骤S511,电子设备根据利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型。

步骤S512,电子设备利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的F1分数。

步骤S513,在F1分数大于或等于预设的分数阈值的情况下,电子设备将备选联系人信息识别模型确定为联系人信息识别模型。

步骤S514,电子设备利用联系人信息识别模型对初始联系人信息识别模型进行更新。

采用本公开实施例提供的用于更新联系人信息识别模型的装置,通过初始联系人信息识别模型在用户的会话中获取第一备选样本数据,根据第一备选样本数据获取样本数据,在间隔时长大于或等于预设的时长阈值且样本数量大于或等于预设的数量阈值的情况下,根据样本数据获取训练样本数据和测评样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率的同时,提高了样本数据的数量和实时性,使得利用了样本数据进行训练和测评的联系人信息识别模型的识别准确率更高,从而在提高联系人信息识别模型识别联系人信息的准确率的同时,能够减少更新联系人信息识别模型的周期。

通过初始联系人信息识别模型在用户的会话中获取第一备选样本数据,并根据第一备选样本数据获取样本数据,运用了深度学习技术,利用样本数据对神经网络模型进行深度训练和测评,获得联系人信息识别模型,以利用联系人信息识别模型对初始联系人信息识别模型进行更新。这样,更新后的联系人信息识别模型能够对用户在即时通讯工具中会话的文本进行自然语言处理,从而能够对用户的会话中的联系人信息进行识别,从而利于用户对联系人进行进行整理,拓展人脉。

结合图6所示,本公开实施例提供一种用于更新联系人信息识别模型的装置,包括:第一获取模块1、第二获取模块2、第三获取模块3和更新模块4。第一获取模块1被配置为利用初始联系人信息识别模型在用户的会话中获取第一备选样本数据;第一备选样本数据包括多个携带有信息类型的联系人信息;第二获取模块2被配置为根据第一备选样本数据获取样本数据;第三获取模块3被配置为根据样本数据获取联系人信息识别模型;更新模块4被配置为利用联系人信息识别模型对初始联系人信息识别模型进行更新。

采用本公开实施例提供的用于更新联系人信息识别模型的装置,通过利用初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,根据第一备选样本数据获取样本数据,根据样本数据获取联系人信息识别模型,利用联系人信息识别模型对初始联系人信息识别模型进行更新。这样,由于使用了初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率,提高了获取样本数据的效率,从而能够减少更新联系人信息识别模型的周期。

可选地,第二获取模块被配置为通过如下方法根据第一备选样本数据获取样本数据:将第一备选样本数据发送给用户交互设备,触发所述用户交互设备反馈所述第一备选样本数据对应的用户操作行为;获取用户交互设备反馈的第一备选样本数据对应的用户操作行为;根据用户操作行为获取样本数据。

第二获取模块被配置为通过如下方法根据用户操作行为获取样本数据:在用户操作行为包括预设的第一操作行为的情况下,获取第一操作行为对应的第一备选样本数据;对第一操作行为对应的第一备选样本数据进行随机抽样获得样本数据;预设的第一操作行为为直接保存;和/或,在操作行为包括预设的第二操作行为的情况下,获取用户修改后的第一备选样本数据,并将用户修改后的第一备选样本数据确定为样本数据;预设的第二操作行为为修改后保存。

可选地,第三获取模块被配置为通过如下方法根据样本数据获取联系人信息识别模型:获取上次更新联系人信息识别模型的间隔时长;在间隔时长大于或等于预设的时长阈值的情况下,根据样本数据获取训练样本数据和测评样本数据;或,获取样本数据的样本数量;在样本数量大于或等于预设的数量阈值的情况下,根据样本数据获取训练样本数据和测评样本数据;或,获取上次更新联系人信息识别模型的间隔时长;获取样本数据的样本数量;在间隔时长大于或等于预设的时长阈值或样本数量大于或等于预设的数量阈值的情况下,根据样本数据获取训练样本数据和测评样本数据;或,获取上次更新联系人信息识别模型的间隔时长;获取样本数据的样本数量;在间隔时长大于或等于预设的时长阈值且样本数量大于或等于预设的数量阈值的情况下,根据样本数据获取训练样本数据和测评样本数据;根据训练样本数据和测评样本数据获取联系人信息识别模型。

可选地,第三获取模块被配置为通过如下方法根据训练样本数据和测评样本数据获取联系人信息识别模型:利用训练样本数据对预设的神经网络模型进行训练,获得备选联系人信息识别模型;利用测评样本数据对备选联系人信息识别模型进行测评,获得备选联系人信息识别模型对应的测评分数;根据测评分数获取联系人信息识别模型。

可选地,第三获取模块被配置为通过如下方法根据测评分数获取联系人信息识别模型:在测评分数大于或等于预设的分数阈值的情况下,将备选联系人信息识别模型确定为联系人信息识别模型。

结合图7所示,本公开实施例提供一种用于更新联系人信息识别模型的装置,包括处理器(processor)100和存储器(memory)101。可选地,该装置还可以包括通信接口(Communication Interface)102和总线103。其中,处理器100、通信接口102、存储器101可以通过总线103完成相互间的通信。通信接口102可以用于信息传输。处理器100可以调用存储器101中的逻辑指令,以执行上述实施例的用于更新联系人信息识别模型的方法。

此外,上述的存储器101中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

存储器101作为一种存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器100通过运行存储在存储器101中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于更新联系人信息识别模型的方法。

存储器101可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器101可以包括高速随机存取存储器,还可以包括非易失性存储器。

采用本实施例提供的用于更新联系人信息识别模型的装置,通过利用初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,根据第一备选样本数据获取样本数据,根据样本数据获取联系人信息识别模型,利用联系人信息识别模型对初始联系人信息识别模型进行更新。这样,由于使用了初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率,提高了获取样本数据的效率,从而能够减少更新联系人信息识别模型的周期。

本公开实施例提供了一种电子设备,包含上述的用于更新联系人信息识别模型的装置。

该电子设备通过利用初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,根据第一备选样本数据获取样本数据,根据样本数据获取联系人信息识别模型,利用联系人信息识别模型对初始联系人信息识别模型进行更新。这样,由于使用了初始联系人信息识别模型在用户的会话中获取包括多个携带有信息类型的联系人信息的第一备选样本数据,不用人工采集联系人信息并对联系人信息标志其对应的信息类型,提高了获取第一备选样本数据的效率,提高了获取样本数据的效率,从而能够减少更新联系人信息识别模型的周期。

可选地,电子设备包括服务器或计算机等。

可选地,在电子设备为服务器的情况下,电子设备通过计算机上传获得用户的会话。

本公开实施例提供了一种存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为执行上述用于更新联系人信息识别模型的的方法。

上述的存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。

以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。

本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

相关技术
  • 用于更新联系人信息识别模型的方法及装置、电子设备、存储介质
  • 语音识别模型更新方法、装置、存储介质及电子设备
技术分类

06120114698796