掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本申请涉及智慧教育领域中的信息确定技术,尤其涉及一种信息确定方法、装置和电子设备。

背景技术

随着光学字符识别(Optical Character Recognition,OCR)技术的成熟,OCR技术成为试题电子化、试题录入题库的重要手段。目前,OCR技术普遍采用字、词的置信度来提示哪些字词可能识别不准确;但是,目前的这种识别方式中OCR提示置信度低的字词未必是用户想关注的,而用户比较关注的字词出现错误时并未提示。对于这种情况,若进行复检的人对此试题对应的专业领域不够了解和敏感,容易出现错误漏检的情况,从而导致试题电子化中存在错误。

发明内容

本申请实施例期望提供一种信息确定方法、装置和电子设备,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题。

本申请的技术方案是这样实现的:

一种信息确定方法,所述方法包括:

对待识别图片进行处理,得到第一试题文本;

对所述第一试题文本进行分析,得到所述第一试题文本所属的科目信息和所述第一试题文本中的题的题型;

基于所述科目信息和所述题型对所述第一试题文本进行分析,确定与所述科目信息和所述题型匹配的关键词。

上述方案中,所述对所述第一试题文本进行分析,得到所述第一试题文本所属的科目信息和所述第一试题文本中的题的题型,包括:

采用自然语言处理技术对所述第一试题文本进行分词处理,得到所述第一试题文本中的词;

基于所述第一试题文本中的词对所述第一试题文本进行分析,得到所述第一试题文本所属的科目信息和所述第一试题文本中的题的题型。

上述方案中,所述基于所述第一试题文本中的词对所述第一试题文本进行分析,得到所述第一试题文本所属的科目信息和所述第一试题文本中的题的题型,包括:

获取试题对应的目标语料库;

基于所述第一试题文本中的词和所述目标语料库对所述第一试题文本进行分析,确定所述科目信息和所述题型。

上述方案中,所述基于所述科目信息和所述题型对所述第一试题文本进行分析,确定与所述科目信息和所述题型匹配的关键词,包括:

确定所述第一试题文本中的词的类型;其中,不同类型的词显示出来的形式不同;

基于所述词的类型、所述第一试题文本所属的科目信息和所述题型,从所述第一试题文本的词中确定出所述关键词。

上述方案中,所述基于所述词的类型、所述第一试题文本所属的科目信息和所述题型,从所述第一试题文本的词中确定出所述关键词,包括:

从所述第一试题文本的词中,提取所述词的类型与所述第一试题文本所属的科目信息匹配的词,以及所述词的类型与所述词所处的题的题型匹配的词,得到第一关键词;其中,所述关键词包括所述第一关键词。

上述方案中,所述基于所述科目信息和所述题型对所述第一试题文本进行分析,确定与所述科目信息和所述题型匹配的关键词,包括:

采用自然语言处理技术对所述第一试题文本进行分析,得到所述第一试题文本的句意信息;

基于所述第一试题文本的所述科目信息和所述题型,确定所述第一试题文本的句意信息中存在错误的句意信息对应的目标语句;

从所述第一试题文本的词中,提取与所述目标语句中的词匹配的词得到第二关键词;其中,所述关键词还包括所述第二关键词。

上述方案中,所述方法还包括:

以目标显示方式,在所述第一试题文本和所述待识别图片中包括的第二试题文本中显示所述关键词,以提醒用户关注所述关键词;其中,所述第一试题文本和所述第二试题文本对应同一试题信息。

上述方案中,所述对待识别图片进行处理,得到第一试题文本,包括:

确定对待识别图片中包括的第二试题文本进行了编辑处理且需要对所述第二试题文本进行复核处理的情况下,对所述待识别图片进行处理,得到所述第一试题文本;其中,所述复核处理能够再次确定所述第二试题文本中是否存在错误文本信息。

一种信息确定装置,所述装置包括:

处理单元,用于对待识别图片进行处理,得到第一试题文本;

第一分析单元,用于对所述第一试题文本进行分析,得到所述第一试题文本所属的科目信息和所述第一试题文本中的题的题型;

第二分析单元,用于基于所述科目信息和所述题型对所述第一试题文本进行分析,确定与所述科目信息和所述题型匹配的关键词。

一种电子设备,所述电子设备包括:处理器、存储器和通信总线;

所述通信总线用于实现处理器和存储器之间的通信连接;

所述处理器用于执行存储器中的信息确定程序,以实现以下步骤:

对待识别图片进行识别处理,得到第一试题文本;

对所述第一试题文本进行分析,得到所述第一试题文本所属的科目信息和所述第一试题文本中的题的题型;

基于所述科目信息和所述题型对所述第一试题文本进行分析,确定与所述科目信息和所述题型匹配的关键词。

本申请的实施例所提供的信息确定方法、装置和电子设备,对待识别图片进行处理得到第一试题文本,对第一试题文本进行分析得到第一试题文本所属的科目信息和第一试题文本中的题的题型,基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词,如此,可以根据试题文本的科目信息和题型,确定出试题文本中的与科目信息和题型匹配的关键词,而不仅仅是采用OCR技术来确定试题文本中的关键词,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题,提高了试题电子化的准确性。

附图说明

图1为本申请的实施例提供的一种信息确定方法的流程示意图;

图2为本申请的实施例提供的另一种信息确定方法的流程示意图;

图3为本申请的实施例提供的又一种信息确定方法的流程示意图;

图4为本申请的实施例提供的一种信息确定方法中显示关键词的示意图;

图5为本申请的实施例提供的一种信息确定装置的结构示意图;

图6为本申请的实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。

应理解,说明书通篇中提到的“本申请实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“本申请实施例中”或“在前述实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中应。在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在未做特殊说明的情况下,电子设备执行本申请实施例中的任一步骤,可以是电子设备的处理器执行该步骤。还值得注意的是,本申请实施例并不限定电子设备执行下述步骤的先后顺序。另外,不同实施例中对数据进行处理所采用的方式可以是相同的方法或不同的方法。还需说明的是,本申请实施例中的任一步骤是电子设备可以独立执行的,即电子设备执行下述实施例中的任一步骤时,可以不依赖于其它步骤的执行。

应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。

本申请的实施例提供一种信息确定方法,该方法可以应用于电子设备中,参照图1所示,该方法包括以下步骤:

步骤101、对待识别图片进行处理,得到第一试题文本。

其中,待识别图片可以是需要对图片中的信息进行识别处理,且图片中包括需要进行识别处理的第二试题文本的图片;在对待识别图片进行处理之前可以先获取待识别图片,当然待识别图片可以是直接存储在电子设备本地的,也可以是从其他电子设备中获取得到的。在一种可行的实现方式中,可以通过对待处理的第二试题文本进行采集来得到对待识别图片;需要说明的是,可以是使用电子设备自身的图像采集器来进行采集的,也可以是使用其他电子设备的图形采集器来进行采集的。

在本申请实施例中,第一试题文本可以是通过对待识别图片进行识别处理后得到的;其中,对待识别图片进行识别处理可以是采用OCR识别技术来实现的。

步骤102、对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型。

在本申请实施例中,可以根据第一试题文本中的词对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型。

其中,第一试题文本所属的科目信息可以指的是第一试题文本所对应的试题科目,在一种可行的实现方式中,科目信息可以包括:数学、英语、语文、物理、化学、历史和地理等学科;第一试题文本中的题的题型可以指的是不同学科的试题所能包括的试题的题型,在一种可行的实现方式中,题型可以包括:填空题、选择题、应用题、判断题和作文题等。

步骤103、基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词。

在本申请实施例中,关键词可以是基于科目信息和题型对第一试题文本进行分析后,从第一试题文本的词中筛选出来的。其中,关键词可以是根据词与第一试题文本所属的科目信息之间的关系,以及词与词所在的题的题型之间的关系,从第一试题文本的词中确定出来的;或者,关键词也可以是先根据第一试题文本的科目信息和题型得到第一试题文本中的句子的句意信息,之后根据第一试题文本中的句子的句意信息从第一试题文本的词中确定出来的。

本申请的实施例所提供的信息确定方法,对待识别图片进行处理得到第一试题文本,对第一试题文本进行分析得到第一试题文本所属的科目信息和第一试题文本中的题的题型,基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词,如此,可以根据试题文本的科目信息和题型,确定出试题文本中的与科目信息和题型匹配的关键词,而不仅仅是采用OCR技术来确定试题文本中的关键词,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题,提高了试题电子化的准确性。

基于前述实施例,本申请的实施例提供一种信息确定方法,参照图2所示,该方法包括以下步骤:

步骤201、电子设备确定对待识别图片中包括的第二试题文本进行了编辑处理且需要对第二试题文本进行复核处理的情况下,对待识别图片进行处理,得到第一试题文本。

其中,复核处理能够再次确定第二试题文本中是否存在错误文本信息。

在本申请实施例中,对待识别图片中包括的第二试题文本进行了编辑处理,编辑处理完成后需要对第二试题文本进行复核处理的情况下,此时可以对该待识别图片进行OCR识别处理得到第一试题文本。其中,编辑处理可以指的是学生针对第二试题文本进行了答题处理,此时复核处理可以指的是老师需要对学生答复的试题进行批阅处理;或者,编辑处理可以指的是对第二试题文本进行了第一次电子录入处理,此时复核处理可以指的是确认第一次电子录入的试题文本中是否存在错误。当然,编辑处理和复核处理也可以指的是其他符合本申请的限定的处理。

步骤202、电子设备采用自然语言处理技术对第一试题文本进行分词处理,得到第一试题文本中的词。

其中,自然语言处理技术可以包括自然语言处理(Natural LanguageProcessing,NPL);词可以指的是第一试题文本中包括的词;需要说明的是,直接采用NPL技术对第一试题文本进行分词处理就可以得到第一试题文本中包括的词。

步骤203、电子设备基于第一试题文本中的词对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型。

其中,第一试题文本所属的科目信息和第一试题文本中的题的题型,可以是基于第一试题文本中的词与试题对应的目标语料库之间的关系得到的。

其中,步骤203可以通过以下方式来实现:

步骤203a、电子设备获取试题对应的目标语料库。

其中,目标语料库可以是所有科目的试题对应的;也就是说,所有科目的试题对应一个目标语料库,即目标语料库可以是所有科目的试题的语料库。

在本申请实施例中,目标语料库可以是通过对各种不同科目的试题进行分析后得到的;当然,目标语料库可以是基于每一种科目的大量试题进行训练后得到的。其中,目标语料库中可以包括各种不同科目和题型对应的词。

步骤203b、电子设备基于第一试题文本中的词和目标语料库对第一试题文本进行分析,确定第一试题文本所属的科目信息和第一试题文本中的题的题型。

在本申请实施例中,可以将第一试题文本中的词与目标语料库中包括的词进行匹配分析,得到第一试题文本的科目信息和题的题型。其中,可以根据目标语料库中与第一试题文本中的词匹配的词所对应的科目,确定出第一试题文本所属的科目;同时,可以根据目标语料库中与第一试题文本中的词匹配的词所对应的题型,确定出第一试题文本中包括的题的题型。相应的,可以根据确定出来的所有题型所对应的词所属的题,分别确定第一试题文本中每一题是什么题型。

需要说明的是,若目标语料库中与第一试题文本的词匹配的词所对应的科目是数学,那么第一试题文本的科目就是数学;若目标语料库中与第一试题文本的词匹配的词所对应的题型为选择题,那么确定该词所在的题的题型是选择题。

步骤204、电子设备确定第一试题文本中的词的类型。

其中,不同类型的词显示出来的形式不同。

其中,词的类型可以指的是词是哪种类型的词;在本申请实施例中词的类型可以包括数字、汉字、英文字符、化学字符等各种不同科目所对应的词的类型。

步骤205、电子设备基于词的类型、第一试题文本所属的科目信息和题型,从第一试题文本的词中确定出关键词。

在本申请实施例中,可以从第一试题文本包括的词中,提取与第一试题文本的科目信息和题型匹配的词,从而得到关键词;其中,可以是从第一试题文本包括的词中,分别提取与第一试题文本的科目信息匹配的词和与第一试题文本的题型匹配的词来得到关键词。

需要说明的是,采用本申请中的这种基于试题文本中的词的类型、第一试题文本的科目信息和第一试题文本的题型来获取与科目信息和题型匹配的关键词,确定出来的关键词与试题文本的信息相关,进而使得确定出来的关键词更能表征用户所关注的信息,更保证了试题电子化的准确性。

需要说明的是,本实施例与其他实施例中相同或相应步骤的说明可以参照其他实施例中的描述,此处不再赘述。

本申请的实施例所提供的信息确定方法,可以根据试题文本的科目信息和题型,确定出试题文本中的与科目信息和题型匹配的关键词,而不仅仅是采用OCR技术来确定试题文本中的关键词,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题,提高了试题电子化的准确性。

基于前述实施例,本申请的实施例提供一种信息确定方法,参照图3所示,该方法包括以下步骤:

步骤301、电子设备确定对待识别图片中包括的第二试题文本进行了编辑处理且需要对第二试题文本进行复核处理的情况下,对待识别图片进行处理,得到第一试题文本。

其中,复核处理能够再次确定第二试题文本中是否存在错误文本信息。

步骤302、电子设备采用自然语言处理技术对第一试题文本进行分词处理,得到第一试题文本中的词。

步骤303、电子设备获取试题对应的目标语料库。

步骤304、电子设备基于第一试题文本中的词和目标语料库对第一试题文本进行分析,确定第一试题文本所属的科目信息和第一试题文本中的题的题型。

步骤305、电子设备确定第一试题文本中的词的类型。

其中,不同类型的词显示出来的形式不同。

步骤306、电子设备从第一试题文本的词中,提取词的类型与第一试题文本所属的科目信息匹配的词,以及词的类型与词所处的题的题型匹配的词,得到第一关键词。

其中,关键词包括第一关键词。

在本申请实施例中,可以从第一试题文本的词中筛选出词的类型与第一试题文本所属的科目信息匹配的词得到第一子关键词,同时,从第一试题文本的词中筛选出词的类型与第一试题文本中题所处的题的题型匹配的词得到第二子关键词;其中,第一关键词包括第一子关键词和第二子关键词。也就是说,如果第一试题文本所属的科目信息是物理,那么从第一试题文本的词中筛选得到的第一子关键词可以包括与物理学科匹配的词,在一种可行的实现方式中,第一子关键词可以包括物理公式中的式子、物理符号等;如果第一试题文本中的词所处的提的题型是判断题,那么第二子关键词可以包括与判断题匹配的词,在一种可行的实现方式中,第二子关键词可以包括是否、对不对、确定等词。

步骤307、电子设备采用自然语言处理技术对第一试题文本进行分析,得到第一试题文本的句意信息。

其中,第一试题文本的句意信息可以是先采用NPL技术对第一试题文本进行断句处理,得到第一试题文本中包括的句子,进而对每一句子进行分析得到第一试题文本的句意信息。

步骤308、电子设备基于第一试题文本的科目信息和题型,确定第一试题文本的句意信息中存在错误的句意信息对应的目标语句。

在本申请实施例中,可以结合第一试题文本的科目信息和题型确定第一试题文本的句意信息的准确性,进而根据句意信息的准确性获取第一试题文本的目标语句。其中,可以根据句意信息与第一试题文本的科目信息和题型匹配度,来确定语句信息的准确性;若句意信息与第一试题文本的科目信息和题型不匹配,则认为句意信息存在错误,若句意信息与第一试题文本的科目信息和题型匹配则认为句意信息准确。在一种可行的实现方式中,若第一试题文本的科目信息是英语,题型是判断题,确定出来的句意信息是关于化学公式属于下面哪一项,此时可以认为该句意信息存在错误,那么该句子就是目标语句。

需要说明的是,也可以根据第一试题文本的科目信息和题型,以及确定出来的句子中的词的置信度来确定第一试题文本的句意信息的准确性。如此,因为确定第一试题文本的句意信息的准确性的时候结合了词的置信度,使得根据句意信息的准确性确定出来的第二关键词更加符合用户的关注度,进而保证了试题电子化的准确性。

步骤309、电子设备从第一试题文本的词中,提取与目标语句中的词匹配的词得到第二关键词。

其中,关键词还包括第二关键词。

在本申请实施例中,第二关键词可以是从第一试题文本的词中筛选出与目标语句中的词匹配的词得到的。并且,本申请实施例中还可以根据第一试题文本的句意信息确定第一试题文本中的第二关键词,使得确定出来的关键词的范围更广,更加减少了试题电子化中的错误信息。

需要说明的是,步骤307~309可以是在步骤305~306之后执行的,也可以是与步骤305~306同时执行的;当然,307~309与步骤305~306在执行上也可以是或的关系,即可以只执行步骤307~309,不执行步骤305~306,或者,只执行步骤305~306,不执行步骤307~309;也就是说,基于词的类型、科目信息和题型从第一试题文本的词中确定第一关键词的第一种方案,与基于第一试题文本的句意信息、科目信息和题型从第一试题文本的词中确定第二关键词的第二种方案可以是同时执行,也可以是第一种方案和第二种方案只执行其中的一种;也可以是执行完第一种方案后执行第二种方案。

基于前述实施例,在本申请的其他实施例中,该方法还包括以下步骤:

步骤310、电子设备以目标显示方式,在第一试题文本和待识别图片中包括的第二试题文本中显示关键词,以提醒用户关注关键词。

其中,第一试题文本和第二试题文本对应同一试题信息。

在本申请实施例中,第一试题文本和第二试题文本针对的是相同的试题信息,第一试题文本可以是对第二试题文本所属的待识别图片进行识别处理后得到的。

在本申请其他实施例中,可以在第一试题文本和第二试题文本中以目标显示方式显示确定出来的关键词,从而更明确的提醒用户关注这些关键词。其中,目标显示方式可以包括高亮的方式、加粗的方式、不同颜色标注的方式等,目标显示方式可以使得关键词在第一试题文本和第二试题文本中显著显示出来,让用户一眼就可以注视到关键词。并且,可以保证用户在对第一试题文本和第二试题文本进行复核时一眼就可以关注到这些关键词,提高了复核效率,进而提高了电子化的准确性和效率。

需要说明的是,本实施例与其他实施例中相同或相应步骤的说明可以参照其他实施例中的描述,此处不再赘述。

本申请的实施例所提供的信息确定方法,可以根据试题文本的科目信息和题型,确定出试题文本中的与科目信息和题型匹配的关键词,而不仅仅是采用OCR技术来确定试题文本中的关键词,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题。

基于前述实施例,在本申请的其他实施例中,以第一试题文本和第二试题文本是关于化学的同一试题信息;此时,对第一试题文本进行分词后得到词可以包括化学公式和化学符号,根据这些词(化学公式和公式符号)结合目标语料库确定出第一试题文本的科目信息是化学;同时,根据词“计算”、“选项”“判断”等可以确定题型包括计算题、填空题、选择题、判断题等;并且,确定词的类型是化学符号,之后可以根据这些词的类型、科目信息和题型从第一试题文本的词中确定出关于化学公式和化学符号的词作为第一关键词;同时,可以根据该第一试题文本的句意信息、科目信息(化学)和题型(选择题),确定出第二关键词;在一种可行的实现方式中,如图4所示,第一关键词可以包括“CaC

基于前述实施例,本申请的实施例提供一种信息确定装置,该装置可以应用于图1~3对应的实施例提供的信息确定方法中,参照图5所示,该装置4可以包括:处理单元41、第一分析单元42和第二分析单元43,其中:

处理单元41,用于对待识别图片进行处理,得到第一试题文本;

第一分析单元42,用于对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型;

第二分析单元43,用于基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词。

在本申请其他实施例中,第一分析单元42还用于执行以下步骤:

采用自然语言处理技术对第一试题文本进行分词处理,得到第一试题文本中的词;

基于第一试题文本中的词对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型。

在本申请其他实施例中,第一分析单元42还用于执行以下步骤:

获取试题对应的目标语料库;

基于第一试题文本中的词和目标语料库对第一试题文本进行分析,确定第一试题文本所属的科目信息和第一试题文本中的题的题型。

在本申请其他实施例中,第二分析单元43还用于执行以下步骤:

确定第一试题文本中的词的类型;

其中,不同类型的词显示出来的形式不同;

基于词的类型、第一试题文本所属的科目信息和第一试题文本中的题的题型,从第一试题文本的词中确定出关键词。

在本申请其他实施例中,第二分析单元43,还用于从第一试题文本的词中,提取词的类型与第一试题文本所属的科目信息匹配的词,以及词的类型与词所处的题的题型匹配的词,得到第一关键词;

其中,关键词包括第一关键词。

在本申请其他实施例中,第二分析单元43,还用于执行以下步骤:

采用自然语言处理技术对第一试题文本进行分析,得到第一试题文本的句意信息;

基于第一试题文本的科目信息和第一试题文本中的题的题型,确定第一试题文本的句意信息中存在错误的句意信息对应的目标语句;

从第一试题文本的词中,提取与目标语句中的词匹配的词得到第二关键词;其中,关键词还包括第二关键词。

在本申请其他实施例中,该信息确定装置4还包括:显示单元44,其中:

显示单元44,用于以目标显示方式,在第一试题文本和待识别图片中包括的第二试题文本中显示关键词,以提醒用户关注关键词;

其中,第一试题文本和第二试题文本对应同一试题信息。

在本申请其他实施例中,处理单元41,还用于确定对待识别图片中包括的第二试题文本进行了编辑处理且需要对第二试题文本进行复核处理的情况下,对待识别图片进行处理,得到第一试题文本;

其中,复核处理能够再次确定第二试题文本中是否存在错误文本信息。

需要说明的是,本实施例中各个模块之间的交互过程可以参照图1~3对应的实施例提供的信息确定方法中的实现过程,此处不再赘述。

本申请的实施例所提供的信息确定装置,可以根据试题文本的科目信息和题型,确定出试题文本中的与科目信息和题型匹配的关键词,而不仅仅是采用OCR技术来确定试题文本中的关键词,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题。

基于前述实施例,本申请的实施例提供一种电子设备5,该电子设备可以应用于图1~3对应的实施例提供的信息确定方法中,参照图6所示,该电子设备5可以包括:处理器51、存储器52和通信总线53,其中:

通信总线53用于实现处理器51和存储器52之间的通信连接;

处理器51用于执行存储器52中存储的信息确定程序,以实现以下步骤:

对待识别图片进行识别处理,得到第一试题文本;

对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型;

基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词。

在本申请的其他实施例中,处理器51用于执行存储器52中存储的对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型,以实现以下步骤:

采用自然语言处理技术对第一试题文本进行分词处理,得到第一试题文本中的词;

基于第一试题文本中的词对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型。

在本申请的其他实施例中,处理器51用于执行存储器52中存储的基于第一试题文本中的词对第一试题文本进行分析,得到第一试题文本所属的科目信息和第一试题文本中的题的题型,以实现以下步骤:

获取试题对应的目标语料库;

基于第一试题文本中的词和目标语料库对第一试题文本进行分析,确定第一试题文本所属的科目信息和第一试题文本中的题的题型。

在本申请的其他实施例中,处理器51用于执行存储器52中存储的基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词,以实现以下步骤:

从第一试题文本的词中,提取词的类型与第一试题文本所属的科目信息匹配的词,以及词的类型与词所处的题的题型匹配的词,得到第一关键词;

其中,关键词包括第一关键词。

在本申请的其他实施例中,处理器51用于执行存储器52中存储的基于科目信息和题型对第一试题文本进行分析,确定与科目信息和题型匹配的关键词,以实现以下步骤:

采用自然语言处理技术对第一试题文本进行分析,得到第一试题文本的句意信息;

基于第一试题文本的科目信息和第一试题文本中的题的题型,确定第一试题文本的句意信息中存在错误的句意信息对应的目标语句;

从第一试题文本的词中,提取与目标语句中的词匹配的词得到第二关键词;

其中,关键词还包括第二关键词。

在本申请的其他实施例中,处理器71用于执行存储器72中存储的信息确定程序还可以实现以下步骤:

以目标显示方式,在第一试题文本和待识别图片中包括的第二试题文本中显示关键词,以提醒用户关注关键词;

其中,第一试题文本和第二试题文本对应同一试题信息。

在本申请的其他实施例中,处理器51用于执行存储器52中存储的对待识别图片进行处理得到第一试题文本,以实现以下步骤:

确定对待识别图片中包括的第二试题文本进行了编辑处理且需要对第二试题文本进行复核处理的情况下,对待识别图片进行处理,得到第一试题文本;

其中,复核处理能够再次确定第二试题文本中是否存在错误文本信息。

需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的信息确定方法中的实现过程,此处不再赘述。

本申请的实施例所提供的电子设备,可以根据试题文本的科目信息和题型,确定出试题文本中的与科目信息和题型匹配的关键词,而不仅仅是采用OCR技术来确定试题文本中的关键词,解决了相关技术中进行试题电子化时无法准确的对用户关注的信息进行错误提示,导致试题电子化中存在错误的问题。

基于前述实施例,本申请的实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现图1~3对应的实施例提供的信息确定方法中的步骤。

需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的信息确定方法中的实现过程,此处不再赘述。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

相关技术
  • 属性信息确定方法、属性信息确定装置及电子设备
  • 深度信息确定方法、深度信息确定装置及电子设备
技术分类

06120113066203