掌桥专利:专业的专利平台
掌桥专利
首页

一种基于语义模型的手写输入的优化方法、系统及介质

文献发布时间:2023-06-19 12:22:51


一种基于语义模型的手写输入的优化方法、系统及介质

技术领域

本发明涉及手写输入技术领域,特别是涉及一种基于语义模型的手写输入的优化方法、系统及介质。

背景技术

现有的技术方案通过计算文本的编辑距离、相似系数或TF-IDF(term frequency–inverse document frequency)信息检索数据挖掘的常用加权技术计算等。

编辑距离,英文叫做Edit Distance,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同,许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

相似系数,用于比较有限样本集之间的相似性与差异性,相似系数值越大,样本相似度越高。计算方式非常简单,两个样本的交集除以并集得到的数值,当两个样本完全一致时,结果为1,当两个样本完全不同时,结果为0。

第三种方案就是直接计算TF矩阵中两个向量的相似度了,实际上就是求解两个向量夹角的余弦值,就是点乘积除以二者的模长。

现有的计算文本相似都是基于词的相似度计算方法,没有对文字输入的用于的工作情况、个人喜好或者家庭因素进行参考的语义理解,仅基于句子表层的关键词信息,不能区别在语义或句法结构上相似的句子,在各种办公或者高校的智能屏幕中,基于语义模型的手写输入的优化方法对于加快文字输入的速度及关联字推荐有重要的影响。

发明内容

本发明主要解决的是现有的手写输入没有参照使用者的使用情况、工作因素和个人喜好推荐关联字的问题。

为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于语义模型的手写输入的优化方法,包括以下步骤:

获取个体语音输入的数据和应用场景,根据个体语音输入的数据创建语义模型;

将所述个体语音输入的应用场景与所述语义模型建立映射关系;

根据所述映射关系对所述语义模型执行分类操作,根据所述分类操作结果提取若干句向量;

配置权重关系,并根据权重关系,对所述句向量拆分,生成若干词向量;

获取个体手写操作,根据所述词向量与所述句向量的权重关系,对所述个体手写操作执行关联推荐。

优选地,所述获取个体语音输入的数据和应用场景,根据个体语音输入的数据创建语义模型的步骤进一步包括:

配置第一阈值和阈值区间,对所述个体语音输入的数据执行数据特性解析操作,将满足所述第一阈值的所述数据作为特性向量;

提取所述特性向量创建语义模型。

优选地,所述将所述个体手写输入的应用场景与所述语义模型建立映射关系的步骤进一步包括:

获取所述应用场景的所述特性向量,将所述特性向量及对应的应用场景和语义模型建立映射关系。

优选地,所述根据所述映射关系对所述语义模型执行分类操作,根据所述分类操作结果提取若干句向量的步骤进一步包括:

在时间域和空间域内计算所述句向量的使用次数,根据所述句向量的使用次数所在的阈值区间执行分类操作;

所述阈值区间包括第一区间、第二区间和第三区间,根据所述句向量的阈值区间所在的区间,分类执行句向量推荐策略、词向量推荐策略或者联想推荐策略操作。

优选地,所述执行句向量推荐策略的步骤进一步包括:若所述句向量的阈值区间为第一区间,则将所述句向量作为高频句向量,标识所述高频句向量的句首的为高频词向量,当所述个体手写输入触发所述高频词向量时,为所述个体推荐所述句首对应的所述高频句向量。

优选地,所述执行词向量推荐策略的步骤进一步包括:若所述句向量的阈值区间为第二区间,则将所述句向量作为中频句向量,将所述中频句向量拆分为若干词向量并作为中频词向量,当所述个体手写输入触发所述中频词向量时,为所述个体推荐对应所述中频句向量的所述中频词向量。

优选地,所述联想推荐策略的步骤进一步包括:若所述句向量的阈值区间为第三区间,则将所述句向量作为低频句向量,将所述低频句向量拆分为若干词向量并作为低频词向量,当所述个体手写输入触发所述低频词向量时,为所述个体推荐与所述低频词向量关联的所述中频词向量。

优选地,所述分别执行句向量推荐策略、词向量推荐策略或者联想推荐策略的步骤进一步包括:根据执行所述句向量推荐策略、词向量推荐策略或者联想推荐策略的次数对所述语义模型执行无监督自适应训练。

本发明还提供一种基于语义模型的手写输入的优化系统,包括:获取模块、语义模块、语音识别模块、映射模块、分类模块、拆分模块、手写识别模块和推荐模块;

所述获取模块用于获取个体语音输入的数据并将所述数据发送至语义模块;

所述语义模块用于根据所述数据创建语义模型;

所述语音识别模块用于在应用场景中识别所述个体的语音输入;

所述映射模块用于将所述语义模型与所述应用场景建立映射关系;

所述分类模块用于根据所述映射关系对所述应用场景执行分类,提取若干句向量;

所述拆分模块用于根据权重关系,对所述句向量拆分,生成若干词向量;

所述手写识别模块用于识别所述个体的手写输入,并将手写输入识别结果发送至所述推荐模块;

所述推荐模块用于根据所述词向量和所述句向量的权重关系,对所述个体执行关联推荐。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现任一项所述的基于语义模型的手写输入的优化方法步骤。

本发明的有益效果是:

1、本发明所述的基于语义模型的手写输入的优化方法,可以实现通过个性化的语音输入生成和训练模型,提取句向量,区分句向量的出现频率,并在个体手写输入时,根据时间域和空间域为个体推荐句向量或词向量,可以提升手写输入的准确率,并大大提升手写输入的效率。

2、本发明所述的基于语义模型的手写输入的优化系统,可以实现创建语义模型,并获取语音输入,并在获取后将应用场景与语音输入建立映射关系。

3、本发明所述的基于语义模型的手写输入的优化介质,可以实现区分阈值区间,并在区分后执行相应区间的推荐策略。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例1所述的基于语义模型的手写输入的优化方法的示意图;

图2是本发明实施例2所述的基于语义模型的手写输入的优化系统的示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明的描述中,“个体”;“语义模型”;“语音输入”;“应用场景”;“分类操作”;“权重关系”;“句向量”;“词向量”;“关联推荐”;“数据特性解析”;“特性向量”;“时间域”;“空间域”;“阈值区间”;“第一区间”;“第二区间”;“第三区间”;“句向量推荐策略”;“词向量推荐策略”;“联想推荐策略”;“高频句向量”;“高频词向量”;“中频句向量”;“中频词向量”;“低频句向量”;“获取模块”;“语义模块”;“语音识别模块”;“映射模块”;“分类模块”;“拆分模块”;“手写识别模块”;“推荐模块”,不应限制于文字含义,根据本领域技术人员的所能达到的技术手段应作广义理解。

实施例1

本发明实施例提供一种基于语义模型的手写输入的优化方法,请参阅图1,包括以下步骤:

S100、获取个体语音输入的数据和应用场景,根据个体语音输入的数据创建语义模型;

步骤S100具体包括:

对个体输入的数据执行数据特性解析操作,将满足使用次数阈值的数据作为特性向量,例如,用户作为个体,多次在语音输入中提到了同一段话,为了详细的说明,本实施例体提供一个例子“当时光的列车缓缓驶过酋长球场,32岁的亨利就在那里,深情的目光望过去都是自己22岁的影子,还是那辆列车随着时光送走了匆匆过客。静静开往另一片大陆,33岁的亨利就在那里,深情的目光望去依稀浮现自己25岁的模样,远方的期许固然美好,而列车的短暂停留更好像岁月的美丽回眸,当时光奏出回家的天籁,35岁的亨利就在那里,深情的目光望去勾勒出自己29岁的动人画面,渐行渐远的车辙默默带走了属于四座城市的喧嚣,却指引着一路跟随的人们去追寻着那段逝去的时光。当岁月含泪悄悄转身,37岁的亨利就在那里,深情的目光望过去试图回到原点,那个出发的站台记起自己背起行囊时,那十七岁的样子”例如在高校中,老师多次强调上述的一段话,那么就可以将此段的数据特性进行解析,在本段话中多次出现亨利两个字,那么就可以将该亨利作为特征向量,围绕该特征向量创建或者补充语义模型。

S200、将个体语音输入的应用场景与语义模型建立映射关系;

步骤S200具体包括:

因为上述步骤S100中,我们提出了一个语义模型的应用场景,因此可以得知,应用场景对于语义模型的相关操作是十分重要的,所在提取完成特征向量后,需要区分该特征向量的应用场景,即将“亨利”与“高校的某一课堂”建立映射关系,且该语义模型中,映射关系是带有空间域和时间域的,即在某一时间段,其映射关系才适用。

S300、根据映射关系对语义模型执行分类操作,根据分类操作结果提取若干句向量;

S301、在时间域内计算句向量的使用次数,例如,老师经常会强调一大段中的一句话作为中心思想或者作为总结,所以在时间域内要计算句向量的使用次数,统计其使用频率,例如,在时间域为16:00-16:30时,老师强调了三次“远方的期许固然美好,而列车的短暂停留更好像岁月的美丽回眸”这句话,那么就可以认定该句向量的使用次数的阈值区间,需要说明的是本实施例中在时间域内半小时时间区间中,若句向量出现了三次,那么就可以认定该句向量的阈值区间在第一区间,若句向量出现了两次,那么就可以认定该句向量的阈值区间在第二区间,若句向量出现了一次,那么就可以认定该句向量的阈值区间在第三区间。

S302、若句向量在第一区间内,则执行句向量推荐策略;若句向量在第二区间内,则执行词向量推荐策略;若句向量在第三区间内,则执行联想推荐策略。

S400、配置权重关系,并根据权重关系,对句向量拆分,生成若干词向量;

步骤S400具体包括:需要说明的是在本实施例中,在个体手写输入时,是单个汉字进行输入,所以在语义识别中,需要将句向量分解为若干词向量,即可以是步骤S100中的“亨利”“时光”“球场”“列车”等作为词向量,例如在步骤S100中的一段,“亨利”作为出现频率最高的词向量,即可以作为这段话的代表。

S500、获取个体手写操作,根据所述词向量与所述句向量的权重关系,对所述个体手写操作执行关联推荐;

步骤S500具体包括:

S501、执行句向量推荐策略;

若句向量的阈值为第一区间,则将该句向量作为高频句向量,例如,“当时光的列车缓缓驶过酋长球场,32岁的亨利就在那里,深情的目光望过去都是自己22岁的影子,还是那辆列车随着时光送走了匆匆过客”。这句话中的句首为“当时光”,即当高校的老师使用手写触发这个句首时,根据句向量推荐策略会自动推荐后面的一段话为句首补齐,通过这种方法,实现了对于教学过程中的经典语句的一次性书写,减少了板书时间。

S502、执行词向量推荐策略;

若句向量为第二区间,则将该句向量作为中频句向量,例如“静静开往另一片大陆,33岁的亨利就在那里,深情的目光望去依稀浮现自己25岁的模样,远方的期许固然美好,而列车的短暂停留更好像岁月的美丽回眸”这段话为中频句向量,将这个句向量的拆分为若干并列权重的词向量,当高校的老师使用手写触发其中的一个词向量时,为高校的老师推荐其并列的词向量,通过这种方法,实现了对于教学过程中的相关联的中频词向量的联想书写,减少了板书时间。

S503、执行联想推荐策略;

若句向量为第三区间,则将该句向量作为低频句向量,例如“当岁月含泪悄悄转身,37岁的亨利就在那里,深情的目光望过去试图回到原点,那个出发的站台记起自己背起行囊时,那十七岁的样子”将此低频句向量拆分为若干低频词向量,当高校的老师使用手写触发低频词汇时,例如“转身”“远端”“行囊”“亨利”等,会推荐与“转身”“远端”“行囊”“亨利”关联的中频词向量。

S504、通过不断的执行句向量推荐策略、词向量推荐策略或者联想推荐策略完善语义模型,对语义模型进行无监督的自适应学习。

实施例2

本发明实施例提供一种基于语义模型的手写输入的优化系统,请参阅图2,包括:获取模块、语义模块、语音识别模块、映射模块、分类模块、拆分模块、手写识别模块和推荐模块。

获取模块用于获取个体语音输入的数据并将数据发送至语义模块。

语义模块用于根据数据创建语义模型。

获取模块对个体输入的数据执行数据特性解析操作,获取模块将满足使用次数阈值的数据作为特性向量,例如,用户作为个体,多次在语音识别模块中提到了同一段话,为了详细的说明,本实施例体提供一个例子“当时光的列车缓缓驶过酋长球场,32岁的亨利就在那里,深情的目光望过去都是自己22岁的影子,还是那辆列车随着时光送走了匆匆过客。静静开往另一片大陆,33岁的亨利就在那里,深情的目光望去依稀浮现自己25岁的模样,远方的期许固然美好,而列车的短暂停留更好像岁月的美丽回眸,当时光奏出回家的天籁,35岁的亨利就在那里,深情的目光望去勾勒出自己29岁的动人画面,渐行渐远的车辙默默带走了属于四座城市的喧嚣,却指引着一路跟随的人们去追寻着那段逝去的时光。当岁月含泪悄悄转身,37岁的亨利就在那里,深情的目光望过去试图回到原点,那个出发的站台记起自己背起行囊时,那十七岁的样子”例如在高校中,老师多次通过语音识别模块强调上述的一段话,那么就可以将此段的数据特性进行解析,在本段话中多次出现亨利两个字,那么就可以将该亨利作为特征向量,语义模块围绕该特征向量创建或者补充语义模型。

映射模块将个体语音识别模块获取的语音输入的应用场景与语义模型建立映射关系。

因为我们提出了一个语义模型的应用场景,因此可以得知,应用场景对于语义模型的相关操作是十分重要的,所在提取完成特征向量后,需要区分该特征向量的应用场景,映射模块将“亨利”与“高校的某一课堂”建立映射关系,且该语义模型中,映射模块的映射关系是带有空间域和时间域的,即在某一时间段,映射模块中的映射关系才适用。

分类模块根据映射关系对语义模型执行分类操作,提取若干句向量;

分类模块在时间域内计算句向量的使用次数,例如,老师经常会强调一大段中的一句话作为中心思想或者作为总结,所以在时间域内要计算句向量的使用次数,分类模块统计其使用频率,例如,在时间域为16:00-16:30时,老师强调了三次“远方的期许固然美好,而列车的短暂停留更好像岁月的美丽回眸”这句话,分类模块就可以认定该句向量的使用次数的阈值区间,需要说明的是本实施例中在时间域内半小时时间区间中,若句向量出现了三次,分类模块就可以认定该句向量的阈值区间在第一区间,若句向量出现了两次,分类模块就可以认定该句向量的阈值区间在第二区间,若句向量出现了一次,分类模块就可以认定该句向量的阈值区间在第三区间。

若句向量在第一区间内,推荐模块执行句向量推荐策略;若句向量在第二区间内,推荐模块执行词向量推荐策略;若句向量在第三区间内,推荐模块执行联想推荐策略。

拆分模块根据权重关系,对所述句向量拆分,生成若干词向量;

需要说明的是在本实施例中,在个体对手写识别模块手写输入时,是单个汉字进行输入,所以在语义识别中,手写识别模块需要将句向量分解为若干词向量,即可以是“亨利”“时光”“球场”“列车”等作为词向量,例如“亨利”作为出现频率最高的词向量,即可以作为这段话的代表。

当个体向手写识别模块手写输入时,根据词向量与句向量的权重关系,推荐模块对个体执行关联推荐;

推荐模块执行句向量推荐策略;

若句向量的阈值为第一区间,则将该句向量作为高频句向量,例如,“当时光的列车缓缓驶过酋长球场,32岁的亨利就在那里,深情的目光望过去都是自己22岁的影子,还是那辆列车随着时光送走了匆匆过客”。这句话中的句首为“当时光”,即当高校的老师使用手写识别模块触发这个句首时,推荐模块根据句向量推荐策略会自动推荐后面的一段话为句首补齐,通过这种方法,实现了对于教学过程中的经典语句的一次性书写,减少了板书时间。

推荐模块执行词向量推荐策略;

若句向量为第二区间,则将该句向量作为中频句向量,例如“静静开往另一片大陆,33岁的亨利就在那里,深情的目光望去依稀浮现自己25岁的模样,远方的期许固然美好,而列车的短暂停留更好像岁月的美丽回眸”这段话为中频句向量,将这个句向量的拆分为若干并列权重的词向量,当高校的老师手写识别模块触发其中的一个词向量时,推荐模块为高校的老师推荐其并列的词向量,通过这种方法,实现了对于教学过程中的相关联的中频词向量的联想书写,减少了板书时间。

推荐模块执行联想推荐策略;

若句向量为第三区间,则将该句向量作为低频句向量,例如“当岁月含泪悄悄转身,37岁的亨利就在那里,深情的目光望过去试图回到原点,那个出发的站台记起自己背起行囊时,那十七岁的样子”将此低频句向量拆分为若干低频词向量,当高校的老师使用手写识别模块触发低频词汇时,例如“转身”“远端”“行囊”“亨利”等,会推荐与“转身”“远端”“行囊”“亨利”关联的中频词向量。

语义模块通过不断的执行句向量推荐策略、词向量推荐策略或者联想推荐策略完善语义模型,对语义模型进行无监督的自适应学习。

实施例3

本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时执行如上方法的计算机程序。

最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,监控软件的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。

此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。

此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。

此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 一种基于语义模型的手写输入的优化方法、系统及介质
  • 一种基于省外购电的省内购电成本优化方法、系统及介质
技术分类

06120113269600