掌桥专利:专业的专利平台
掌桥专利
首页

文本内容识别的方法、装置、可读存储介质和电子设备

文献发布时间:2023-06-19 11:39:06


文本内容识别的方法、装置、可读存储介质和电子设备

技术领域

本发明涉及计算机技术领域,具体涉及一种文本内容识别的方法、装置、可读存储介质和电子设备。

背景技术

随着互联网应用的发展,在线教学改变了人们的传统的教学方式,在人们的日常生活使用越来越广泛,在线教学平台有大量的用户并设置了大量的课程,不同的用户由于需求不同,需要的课程也不同,但是用户自己很难在大量的课程中筛选出适合自己的课程,进而需要在线教学平台的工作人员向用户推荐适合用户的课程;在线教学平台需要对工作人员的工作进行监测,确保工作人员向用户推荐了某一门适合用户的课程;现有技术中,通过工作人员与用户的通话记录确定工作人员是否向用户推荐了某一门课程,具体的,判断在通话记录中是否提及该课程对应的至少一个关键词,若提及则判断为工作人员向用户推荐了该课程,若未提及,则判断为工作人员未向用户推荐了该课程;现有技术的方法存在较大的误差,例如,虽然提及了关键词,但实际上并未推荐该课程的情况。

综上所述,如何准确地判断工作人员是否向用户推荐了适合用户的课程是目前需要解决的问题。

发明内容

有鉴于此,本发明实施例提供了一种文本内容识别的方法、装置、可读存储介质和电子设备,提高了判断工作人员是否向用户推荐了适合用户的课程的准确率。

第一方面,本发明实施例提供了一种文本内容识别的方法,该方法包括:获取待分类文本信息;获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率;根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词;根据所述待分类文本信息的关键词对应的出现概率确定所述待分类文本信息与所述分类主题关联的分类概率;根据所述分类概率确定所述分类文本信息与所述分类主题的相关性。

优选地,所述分类概率用于表征所述待分类文本信息与所述分类主题正相关,所述根据所述出现概率确定所述待分类文本信息与所述分类主题关联的分类概率,具体包括:

确定多个第一差值,其中,每个所述第一差值为1与所述待分类文本信息的关键词的出现概率的差;

将所述多个第一差值的连乘积确定为所述分类概率。

优选地,所述根据所述分类概率确定所述分类文本信息与所述分类主题的相关性,具体包括:

响应于所述分类概率小于预先设置的阈值,确定所述分类文本信息与所述分类主题正相关。

优选地,所述分类概率用于表征所述待分类文本信息与所述分类主题负相关,所述根据所述出现概率确定所述待分类文本信息与所述分类主题关联的分类概率,具体包括:

将所述待分类文本信息的关键词的出现概率的连乘积确定为所述分类概率。

优选地,所述根据所述分类概率确定所述分类文本信息与所述分类主题的相关性,具体包括:

响应于所述分类概率小于预先设置的阈值,确定所述分类文本信息与所述分类主题负相关。

优选地,所述关键词列表的确定过程包括:

获取分类主题对应的历史样本数据集合,以及所述历史样本数据集合对应的至少一个候选关键词,其中,所述历史样本数据包括历史正样本数据和历史负样本数据;

根据所述历史样本数据确定每个所述候选关键词在所述历史正样本数据与所述历史负样本数据中的出现概率;

根据所述出现概率确定关键词;

根据所述关键词与所述出现概率生成所述关键词列表。

优选地,所述根据所述出现概率确定关键词,具体包括:

将所述历史正样本数据中的出现概率大于所述历史负样本数据中的出现概率设定倍数的所述候选关键词确定为所述关键词。

优选地,所述阈值根据受试者工作特征ROC曲线预先确定。

优选地,所述阈值根据受试者工作特征ROC曲线预先确定,具体包括:

确定所述ROC曲线的第一比例与第二比例,其中,所述第一比例为在所有实际为正样本时,被正确地判断为正样本的比率,所述第二比例为在所有实际为负样本时,被错误地判断为正样本段比率;

将所述第一比例与第二比例差的最大值确定为所述阈值。

优选地,该方法还包括:

获取待处理音频数据;

将所述音频数据输入到自动语音识别模型,输出所述待处理文本信息。

第二方面,本发明实施例提供了一种文本内容识别的装置,该装置包括:

获取单元,用于获取待分类文本信息;

所述获取单元还用于,获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率;

第一确定单元,用于根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词;

第二确定单元,用于根据所述待分类文本信息的关键词对应的出现概率确定所述待分类文本信息与所述分类主题关联的分类概率;

第三确定单元,用于根据所述分类概率确定所述分类文本信息与所述分类主题的相关性。

优选地,所述分类概率用于表征所述待分类文本信息与所述分类主题正相关,所述第二确定单元具体用于:

确定多个第一差值,其中,每个所述第一差值为1与所述待分类文本信息的关键词的出现概率的差;

将所述多个第一差值的连乘积确定为所述分类概率。

优选地,所述第三确定单元具体用于:

响应于所述分类概率小于预先设置的阈值,确定所述分类文本信息与所述分类主题正相关。

优选地,所述分类概率用于表征所述待分类文本信息与所述分类主题负相关,所述第二确定单元具体还用于:

将所述待分类文本信息的关键词的出现概率的连乘积确定为所述分类概率。

优选地,所述第三确定单元具体还用于:

响应于所述分类概率小于预先设置的阈值,确定所述分类文本信息与所述分类主题负相关。

优选地,所述关键词列表的确定过程中,所述获取单元还用于:

获取分类主题对应的历史样本数据集合,以及所述历史样本数据集合对应的至少一个候选关键词,其中,所述历史样本数据包括历史正样本数据和历史负样本数据;

所述第一确定单元还用于:根据所述历史样本数据确定每个所述候选关键词在所述历史正样本数据与所述历史负样本数据中的出现概率;

所述第一确定单元还用于:根据所述出现概率确定关键词;

生成单元,用于根据所述关键词与所述出现概率生成所述关键词列表。

优选地,所述第一确定单元具体用于:

将所述历史正样本数据中的出现概率大于所述历史负样本数据中的出现概率设定倍数的所述候选关键词确定为所述关键词。

优选地,所述阈值根据受试者工作特征ROC曲线预先确定。

优选地,所述阈值根据受试者工作特征ROC曲线预先确定,具体包括:

所述第三确定单元还用于,确定所述ROC曲线的第一比例与第二比例,其中,所述第一比例为在所有实际为正样本时,被正确地判断为正样本的比率,所述第二比例为在所有实际为负样本时,被错误地判断为正样本段比率;

所述第三确定单元还用于,将所述第一比例与第二比例差的最大值确定为所述阈值。

优选地,所述获取单元还用于:

获取待处理音频数据;

处理单元,用于将所述音频数据输入到自动语音识别模型,输出所述待处理文本信息。

第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面或第一方面任一种可能中任一项所述的方法。

第四方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面或第一方面任一种可能中任一项所述的方法。

本发明实施例通过获取待分类文本信息;获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率;根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词;根据所述待分类文本信息的关键词的出现概率确定所述待分类文本信息与所述分类主题关联的分类概率;根据所述分类概率确定所述分类文本信息与所述分类主题的相关性。通过上述方法,假设分类文本信息为工作人员与用户的沟通记录,分类主题为设定课程时,根据所述分类概率确定所述分类文本信息与所述分类主题的相关性,即根据所述分类概率判断工作人员是否向用户推荐了适合用户的设定课程,提高了判断工作人员是否向用户推荐了适合用户的课程的准确率。

附图说明

通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:

图1是本发明实施例的一种文本内容识别的方法流程图;

图2是本发明实施例的一种文本内容识别的方法流程图;

图3是本发明实施例的一种阈值确定的方法流程图;

图4是本发明实施例的一种文本内容识别的方法流程图;

图5是本发明实施例的一种确定关键词列表的方法流程图;

图6是本发明实施例的一种文本内容识别的方法流程图;

图7是本发明实施例的一种文本内容识别的装置示意图;

图8是本发明实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明公开进行描述,但是本发明公开并不仅仅限于这些实施例。在下文对本发明公开的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明公开。为了避免混淆本发明公开的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。

此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。

除非上下文明确要求,否则整个申请文件中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。

在本发明公开的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。

在线教学平台有大量的用户,并为用户设置了大量的课程,不同的用户由于需求不同,需要的课程也不同,但是用户自己很难在大量的课程中筛选出适合自己的课程,进而需要在线教学平台的工作人员向用户推荐适合用户的课程;在线教学平台需要对工作人员的工作进行监测,确保工作人员向用户推荐了某一门适合用户的课程;现有技术中,通过工作人员与用户的通话记录确定工作人员是否向用户推荐了某一门课程,具体的,判断在通话记录中是否提及该课程对应的至少一个关键词,若提及则判断为工作人员向用户推荐了该课程,若未提及,则判断为工作人员未向用户推荐了该课程;但是现有技术的方法存在较大的误差,例如,虽然提及了谋一门课程的关键词,但实际上并未推荐该课程的情况;并且现有技术中,在判断工作人员是否向用户推荐了某一课程的结论只有绝对的是或者绝对的否,缺乏统计数据上的支撑,也会影响判断的准确性。

本发明实施例中,通过一种文本内容识别的方法,判断分类文本信息与分类主题的相关性,假设分类文本信息为工作人员与用户的沟通记录,分类主题为设定课程时,根据所述分类概率确定所述分类文本信息与所述分类主题的相关性,即根据所述分类概率判断工作人员是否向用户推荐了适合用户的设定课程,提高了判断工作人员是否向用户推荐了适合用户的课程的准确率。

本发明实施例中,图1是本发明实施例的一种文本内容识别的方法流程图。如图1所示,具体包括如下步骤:

步骤S100、获取待分类文本信息。

在一种可能的实现方式中,所述待分类文本信息可以为通话记录信息,例如,工作人员向用户进行课程介绍时的通话记录,或者,其它需要对文本信息进行分类的情况。

举例说明,具体的通话记录可以为:“用户:您好!请问初中一年级对应的课程有哪些?工作人员:您好!初中一年级全部学科的课程都有,例如,初一语文、初一数学、和初一英语等。用户:哪一个学科的授课教师是高级教师呢?工作人员:我们的英语教师是一位有丰富教学经验的高级英语教师,并且我们的英语课程设置的非常合理...”;假设现有技术中初一语文、初一数学、和初一英语都是关键词,则上述通话记录可以认为是推荐初一语文、初一数学、和初一英语三种课程的对话,但实际上并未对初一语文和初一数学做进一步的推荐,只是重点推荐了初一英语这一门课程,因此,需要通过后续的处理过程对所述通话记录进行合理准确的判断。

步骤S101、获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率。

在一种可能的实现方式中,当所述通话记录为工作人员向用户进行课程介绍时的通话记录时,所述分类主题为不同的课程,例如,初一英语课程、初一数学课程、初二英语课程等等;或者,在其他应用场景,例如,所述分类主题为文学、艺术、科技等等,本发明实施例对具体的应用场景不做限定,根据实际使用情况确定。

在一种可能的实现方式中,假设分类主题为不同的课程,不同的课程对应不同的关键词类列表,例如,初一英语课程对应的关键词列表中包括的关键词为:初一英语、初一英语课程、英语、英语教师、高级英语教师、初一英语教师等等,并且每个关键词对应其出现概率,其中,所述出现概率是根据历史数据统计获得的,例如,初一英语的出现概率为0.6,初一英语课程的出现概率为0.5,英语课程出现的概率为0.7、高级英语教师的出现概率为0.4等等,此处仅仅为示例性的说明,具体的数据根据实际情况确定。

步骤S102、根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词。

具体的,根据所述关键词列表中的关键词在所述待分类文本信息出现情况即确定待分类文本信息中包含的所述关键词列表中的关键词,例如,步骤S100中具体的举例中,通话记录为:“用户:您好!请问初中一年级对应的课程有哪些?工作人员:您好!初中一年级全部学科的课程都有,例如,初一语文、初一数学、和初一英语等。用户:哪一个学科的授课教师是高级教师呢?工作人员:我们的英语教师是一位有丰富教学经验的高级英语教师,并且我们的英语课程设置的非常合理...”,初一英语课程对应的关键词列表中包括的关键词为:初一英语、初一英语课程、英语、英语教师、高级英语教师、初一英语教师等等;由此可知通话记录中包括的关键词包括:初一英语、英语高级教师和英语课程。

步骤S103、根据所述待分类文本信息的关键词对应的出现概率确定所述待分类文本信息与所述分类主题关联的分类概率。

在一种可能的实现方式中,在具体处理过程中会出现两种假设,一种是假设所述分类文本信息为正样本,即假设所述分类文本信息对应的通话记录中推荐了设定课程;另一种是假设所述分类文本信息为负样本,即假设所述分类文本信息对应的通话记录中未推荐设定课程。针对上述两种情况,下面通过图2和图3两个具体实施例进行详细说明。

步骤S104、根据所述分类概率确定所述分类文本信息与所述分类主题的相关性。

具体的,在步骤S103的两种情况下,都采用分类概率与阈值比较的方式确定所述分类文本信息与所述分类主题的相关性,具体的判断方式通过图2和图3两个具体实施例进行详细说明。

本发明实施例中,假设所述分类文本信息为正样本时,假设检验其不属于正样本却属于负样本的概率,即图2是本发明实施例的一种文本内容识别的方法流程图。如图2所示,具体包括如下步骤:

步骤S200、获取待分类文本信息。

步骤S201、获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率。

步骤S202、根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词。

步骤S203、确定多个第一差值,其中,每个所述第一差值为1与所述待分类文本信息的关键词的出现概率的差。

具体的,假设所述出现概率通过α

步骤S204、将所述多个第一差值的连乘积确定为所述分类概率。

具体的,所述分类概率为:

假设,上述步骤S203中包括4个第一差值,分别为1-α

步骤S205、响应于所述分类概率小于预先设置的阈值,确定所述分类文本信息与所述分类主题正相关。

具体的,所述正相关即所述分类文本信息为正样本,假设所述分类文本信息为是否推荐某一设定课程,由于所述分类文本信息与所述分类主题正相关,即所述分类分别信息中推荐了某一设定课程。

在一种可能的实现方式中,若所述分类概率大于预先设置的阈值,确定所述分类文本信息与所述分类主题负相关,所述负相关即所述分类文本信息为负样本,假设所述分类文本信息为是否推荐某一设定课程,由于所述分类文本信息与所述分类主题负相关,即所述分类分别信息中未推荐某一设定课程。

在一种可能的实现方式中,所述阈值根据受试者工作特征(receiver operatingcharacteristic curve,ROC)曲线预先确定,具体的,所述又称为感受性曲线(sensitivitycurve),原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在两种不同的判定标准下所得的结果。受试者工作特征曲线就是以假阳性概率(Falsepositive rate)为横轴,真阳性概率(True positive rate)为纵轴所组成的坐标图,和受试者在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。

在一种可能的实现方式中,当所述阈值根据受试者工作特征ROC曲线预先确定时,处理过程如图3所示,图3为一种阈值确定的方法流程图,具体包括:

步骤S300、确定所述ROC曲线的第一比例与第二比例。

具体的,所述第一比例为在所有实际为正样本时,被正确地判断为正样本的比率,所述第二比例为在所有实际为负样本时,被错误地判断为正样本段比率。

在一种可能的实现方式中,所示第一比例可以称为TPR,在所有实际为阳性的样本中,被正确地判断为阳性之比率,TPR=TP/(TP+FN),其中,所示阳性的样本为正样本,所述TP为正样本预测正确的比率,所述FN为负样本预测错误的比率。所述第二比例还可以称为FPR,在所有实际为阴性的样本中,被错误地判断为阳性之比率,FPR=FP/(FP+TN)其中,所示阴性的样本为负样本,所述FP为正样本预测错误的比率,所述TN为负样本预测正确的比率。

步骤S301、将所述第一比例与第二比例差的最大值确定为所述阈值。

具体的,所述第一比例与第二比例差的最大值为max(TPR-FPR)所述阈值作为ε。

本发明实施例中,假设所述分类文本信息为负样本时,假设检验其不属于负样本却属于正样本的概率,即图4是本发明实施例的一种文本内容识别的方法流程图。如图4所示,具体包括如下步骤:

步骤S400、获取待分类文本信息。

步骤S401、获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率。

步骤S402、根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词。

步骤S403、将所述待分类文本信息的关键词的出现概率的连乘积确定为所述分类概率。

具体的,假设所述出现概率通过α

步骤S404、响应于所述分类概率小于预先设置的阈值,确定所述分类文本信息与所述分类主题负相关。

具体的,所述负相关即所述分类文本信息为负样本,假设所述分类文本信息为是否推荐某一设定课程,由于所述分类文本信息与所述分类主题负相关,即所述分类分别信息中未推荐某一设定课程。

在一种可能的实现方式中,若所述分类概率大于预先设置的阈值,确定所述分类文本信息与所述分类主题正相关,所述正相关即所述分类文本信息为正样本,假设所述分类文本信息为是否推荐某一设定课程,由于所述分类文本信息与所述分类主题正相关,即所述分类分别信息中推荐了某一设定课程。

本发明实施例中,所述阈值的确定方式与上述步骤S205中的具体实现方式相同,此处不在赘述。

本发明实施例中,图5是本发明实施例的一种确定关键词列表的方法流程图。如图5所示,具体包括如下步骤:

步骤S500、获取分类主题对应的历史样本数据集合,以及所述历史样本数据集合对应的至少一个候选关键词。

具体的,所述历史样本数据包括历史正样本数据和历史负样本数据。

举例说明,假设分类主题为是否向用户推荐了数学课程,获取用户与工作人员的对话的文字信息后,工作人员向用户推荐过数学课程的则对应的文字信息标志为1,划分为历史正样本数据,工作人员向用户未推荐过数学课程的则对应的文字信息标志为0,划分为历史负样本数据;其中,所述标记仅为示例,实际使用过程中不做限定。

假设,确定出的候选关键词为word1、word2、word3……word n;其中,所述word n为根据不同的分类主题确定的,假设分类主题为课程,则候选关键词为相应课程的总价格,上课模式,课程时长,课程单价以及介绍课程的习惯用语等,例如,上文中的初一英语课程、高级英语教师等词汇,此处仅为示例性说明,具体根据实际情况确定。

步骤S501、根据所述历史样本数据确定每个所述候选关键词在所述历史正样本数据与所述历史负样本数据中的出现概率。

在一种可能的实现方式中,历史正样本数据的出现概率用α

表1

步骤S502、根据所述出现概率确定关键词。

具体的,将所述历史正样本数据中的出现概率大于所述历史负样本数据中的出现概率设定倍数的所述候选关键词确定为所述关键词。

举例说明,将将所述历史正样本数据中的出现概率大于所述历史负样本数据中的出现概率3倍的所述候选关键词确定为所述关键词。例如,word1、word2和word4在历史正样本数据中的出现概率是在历史正样本数据中的出现概率的3倍及以上,则将word1、word2和word4确定为关键词。

步骤S503、根据所述关键词与所述出现概率生成所述关键词列表。

具体的,假设所述关键词列表为两列,一列为所述关键词,另一列为所述关键词对应的出现概率。

本发明实施例中,图6是本发明实施例的一种文本内容识别的方法流程图。如图6所示,具体包括如下步骤:

步骤S600、获取待处理音频数据。

步骤S601、将所述音频数据输入到自动语音识别模型,输出所述待处理文本信息。

具体的,所述自动语音识别(Automatic Speech Recognition,ASR)模型,目的在于将人类的语音中的词汇内容转换为计算机可读的输入,并且与计算机进行交互,例如,按键、二进制编码或者字符序列。

步骤S602、获取待分类文本信息。

步骤S603、获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率。

步骤S604、根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词。

步骤S605、根据所述待分类文本信息的关键词对应的出现概率确定所述待分类文本信息与所述分类主题关联的分类概率。

步骤S606、根据所述分类概率确定所述分类文本信息与所述分类主题的相关性。

图7是本发明实施例的一种文本内容识别的装置示意图。如图7所示,本实施例的装置包括获取单元701、第一确定单元702、第二确定单元703和第三确定单元704。

其中,获取单元701,用于获取待分类文本信息;所述获取单元701还用于,获取分类主题对应的关键词列表,所述关键词列表包括预先确定的多个关键词以及每个关键词的出现概率;第一确定单元702,用于根据所述关键词列表确定所述待分类文本信息的关键词,所述待分类文本信息的关键词为关键词列表中在所述待分类文本信息中出现的关键词;第二确定单元703,用于根据所述待分类文本信息的关键词的出现概率确定所述待分类文本信息与所述分类主题关联的分类概率;第三确定单元704,用于根据所述分类概率确定所述分类文本信息与所述分类主题的相关性。

本发明实施例中,假设分类文本信息为工作人员与用户的沟通记录,分类主题为设定课程时,根据所述分类概率确定所述分类文本信息与所述分类主题的相关性,即根据所述分类概率判断工作人员是否向用户推荐了适合用户的设定课程,提高了判断工作人员是否向用户推荐了适合用户的课程的准确率。

图8是本发明实施例的电子设备的示意图。图8所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器81和存储器82。处理器81和存储器82通过总线83连接。存储器82适于存储处理器81可执行的指令或程序。处理器81可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器81通过执行存储器82所存储的指令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线83将上述多个组件连接在一起,同时将上述组件连接到显示控制器84和显示装置以及输入/输出(I/O)装置85。输入/输出(I/O)装置85可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置85通过输入/输出(I/O)控制器86与系统相连。

如本领域技术人员将意识到的,本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此,本发明实施例的各个方面可以采取如下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外,本发明实施例的各个方面可以采取如下形式:在一个或多个计算机可读介质中实现的计算机程序产品,计算机可读介质具有在其上实现的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置,或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项:具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中,计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。

计算机可读信号介质可以包括传播的数据信号,所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式,包括但不限于:电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质:不是计算机可读存储介质,并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。

可以使用包括但不限于无线、有线、光纤电缆、RF等或前述的任意适当组合的任意合适的介质来传送实现在计算机可读介质上的程序代码。

用于执行针对本发明实施例各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写,所述编程语言包括:面向对象的编程语言如Java、Smalltalk、C++等;以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行;部分地在用户计算机上且部分地在远程计算机上执行;或者完全地在远程计算机或服务器上执行。在后一种情况下,可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机,或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。

上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图图例和/或框图描述了本发明实施例的各个方面。将要理解的是,流程图图例和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器,以产生机器,使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。

还可以将这些计算机程序指令存储在可以指导计算机、其它可编程数据处理设备或其它装置以特定方式运行的计算机可读介质中,使得在计算机可读介质中存储的指令产生包括实现在流程图和/或框图块或块中指定的功能/动作的指令的制品。

计算机程序指令还可以被加载至计算机、其它可编程数据处理设备或其它装置上,以使在计算机、其它可编程设备或其它装置上执行一系列可操作步骤来产生计算机实现的过程,使得在计算机或其它可编程设备上执行的指令提供用于实现在流程图和/或框图块或块中指定的功能/动作的过程。

以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 文本内容识别的方法、装置、可读存储介质和电子设备
  • 文本识别方法、装置、电子设备及可读存储介质
技术分类

06120113008087