掌桥专利:专业的专利平台
掌桥专利
首页

一种题库生成方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 19:58:26


一种题库生成方法、装置、电子设备及存储介质

技术领域

本申请涉及计算机技术领域,具体而言,涉及一种题库生成方法、装置、电子设备及存储介质。

背景技术

对话系统是一种软件系统或机器人,能够与用户进行自然而流畅的对话,通过语言理解和生成技术来理解用户的意图和生成合适的回应。对话系统通过自然语言交互,即与用户进行自然、直观的语言对话。用户可以使用自然语言表达意图、提出问题、提供信息等,而不需要学习特定的命令或语法。但现有技术中对话数据是连续的,难以将数据进行结构化的输出,导致面对一些业务问题无法快速响应。

发明内容

本申请实施例的目的在于一种题库生成方法、装置、电子设备及存储介质,从待处理数据中解析出业务问题和业务问题对应的答案,并确定每一业务问题和对应的答案的展示样式,基于表单布局、业务问题和业务问题对应的答案,生成表单题库。使得对话数据可以以表单题库的形式进行结构化的输出,便于数据的复用,通过表单题库对业务问题进行快速响应,提高对话数据处理的有效性和效率。

第一方面,本申请实施例提供了一种题库生成方法,包括:获取待处理数据;将待处理数据输入预设的神经网络模型,从待处理数据中解析出业务问题和业务问题对应的答案;根据业务问题和业务问题对应的答案,生成表单布局;表单布局用于确定每一业务问题和对应的答案的展示样式;基于表单布局、业务问题和业务问题对应的答案,生成表单题库。

在上述的实现过程中,从待处理数据中解析出业务问题和业务问题对应的答案,并确定每一业务问题和对应的答案的展示样式,基于表单布局、业务问题和业务问题对应的答案,生成表单题库。使得对话数据可以以表单题库的形式进行结构化信息的输出,提高了对数据的管理能力,以及便于数据的复用,通过表单题库对业务问题进行快速响应,提高对话数据处理的有效性和效率。

可选的,在本申请实施例中,待处理数据包括图片数据或文本数据;神经网络模型包括语言理解模型和图片识别模型,将待处理数据输入预设的神经网络模型,从待处理数据中解析出业务问题和业务问题对应的答案,包括:若待处理数据为图片数据,则将待处理数据输入图片识别模型,以使通过图片识别模型对待处理数据进行图像识别,对待处理数据中的信息进行标注,基于标注后的信息,获得业务问题以及业务问题对应的答案;若待处理数据为文本数据,则将待处理数据输入语言理解模型,以使通过语言理解模型对待处理数据进行语言解析处理,从待处理数据中解析出业务问题和业务问题对应的答案。

在上述的实现过程中,根据待处理数据的类型将其输入到对应的神经网络模型中,利用神经网络模型对待处理数据进行处理,从待处理数据中解析出业务问题和答案,提高数据处理的效率。

可选的,在本申请实施例中,获取待处理数据,包括:获得预设的用户数据以及待填写表单图像;基于待填写表单图像,获得待填写表单图像的填写策略;填写策略包括用户数据中的参数项与待填写表单图像中的待填项的对应关系;根据填写策略,将用户数据中的参数项,填写至待填写表单图像中对应的待填项,获得待处理数据。

在上述的实现过程中,基于待填写表单图像,获得待填写表单图像的填写策略;根据填写策略,将用户数据中的参数项,填写至待填写表单图像中对应的待填项,获得待处理数据,实现自动化填写待填写表单图像,提高表单填写的效率,同时丰富了待处理数据的多样性。

可选的,在本申请实施例中,基于待填写表单图像,获得待填写表单图像的填写策略,包括:对待填写表单图像进行图像识别,获得结构化数据;对结构化数据中每一项参数信息进行标注,获得标注信息;标注信息包括每一项参数信息的位置信息和属性信息;将标注信息输入预设的表单模型,获得待填写表单图像的填写策略。

在上述的实现过程中,对待填写表单图像进行图像识别,获得结构化数据;对结构化数据中每一项参数信息进行标注,将标注信息输入预设的表单模型,获得待填写表单图像的填写策略。实现利用计算机视觉技术自动化填写待填写表单图像,提高表单填写的效率,同时丰富了待处理数据的多样性。

可选的,在本申请实施例中,获取待处理数据,包括:获取目标翻译语言和待翻译数据;基于目标翻译语言和待翻译数据,向服务器发起翻译请求;接收服务器发送的翻译后数据;翻译后数据为服务器基于翻译请求生成的;将翻译后数据作为待处理数据。

在上述的实现过程中,用户可以选择自己的目标翻译语言,并获得即时的翻译结果,将翻译后数据作为待处理数据,改善现有的翻译服务可能存在精准度不高且效率较低的问题,提高表单题库的准确性和效率。并且其他语言的数据也可以通过翻译作为待处理数据,从而提高了表单题库的可用性。

可选的,在本申请实施例中,其中,翻译后数据为服务器在接收到翻译请求之后,基于翻译请求中的目标翻译语言,调用目标翻译语言对应的翻译接口,对待翻译数据进行翻译获得。

在上述的实现过程中,服务器在接收到翻译请求之后,触发翻译服务。服务器从翻译请求中提取出目标翻译语言和待翻译数据,调用目标翻译语言对应的翻译接口,实现实时翻译,提高翻译的效率。

可选的,在本申请实施例中,在基于表单布局、业务问题和业务问题对应的答案,生成表单题库之后,方法还包括:获取对表单题库进行修正的修正数据;基于修正数据对表单题库进行修正更新,获得更新表单题库;在获取到用户提问请求之后,基于更新表单题库,查询提问请求对应的业务答案。

在上述的实现过程中,基于修正数据对表单题库进行修正更新,获得更新表单题库;在获取到用户提问请求之后,基于更新表单题库,查询提问请求对应的业务答案,使得用户获取到的始终是修正更新后的回答,提高对话数据处理的有效性和质量。

第二方面,本申请实施例还提供了一种题库生成装置,包括:获取模块,用于获取待处理数据;解析模块,用于将待处理数据输入预设的神经网络模型,从待处理数据中解析出业务问题和业务问题对应的答案;布局模块,用于根据业务问题和业务问题对应的答案,生成表单布局;表单布局用于确定每一业务问题和对应的答案的展示样式;题库生成模块,用于基于表单布局、业务问题和业务问题对应的答案,生成表单题库。

第三方面,本申请实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。

第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上面描述的方法。

采用本申请提供题库生成方法、装置、电子设备及存储介质,从待处理数据中解析出业务问题和业务问题对应的答案,并确定每一业务问题和对应的答案的展示样式,基于表单布局、业务问题和业务问题对应的答案,生成表单题库。使得对话数据可以以表单题库的形式进行结构化信息的输出,提高了对数据的管理能力,以及便于数据的复用,通过表单题库对业务问题进行快速响应,提高对话数据处理的有效性和效率。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种题库生成方法的流程示意图;

图2为本申请实施例提供的一种题库生成结构示意图;

图3为本申请实施例提供的题库生成装置的结构示意图;

图4为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。

在本申请实施例的描述中,技术术语“第一”、“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。在本申请实施例的描述中,“多个”的含义是两个及以上,除非另有明确具体的限定。

请参见图1示出的本申请实施例提供的一种题库生成方法的流程示意图。本申请实施例提供的题库生成方法可以应用于电子设备,该电子设备可以包括终端以及服务器;其中终端具体可以为智能手机、平板电脑、计算机、个人数字助理(Personal DigitalAssitant,PDA)等;服务器具体可以为应用服务器,也可以为Web服务器。该题库生成方法可以包括:

步骤S110:获取待处理数据。

步骤S120:将待处理数据输入预设的神经网络模型,从待处理数据中解析出业务问题和业务问题对应的答案。

步骤S130:根据业务问题和业务问题对应的答案,生成表单布局;表单布局用于确定每一业务问题和对应的答案的展示样式。

步骤S140:基于表单布局、业务问题和业务问题对应的答案,生成表单题库。

在上述步骤S110中,待处理数据可以为图片数据或文本数据;其中,图像数据可以为预先采集的包括对话数据或文本内容的图像;文本数据可以包括群聊、论坛中的对话数据,还可以包括填写好的表单数据等。

在上述步骤S120中,根据待处理数据的类型,将待处理数据输入对应的神经网络模型,对待处理数据中的内容进行解析,获得待处理数据中的业务问题和业务问题对应的答案。

例如,若待处理数据是图片数据,则可以将待处理数据输入图片识别模型,利用图片识别模型对图片数据进行OCR(光学字符识别,Optical Character Recognition)处理,即对文本资料进行扫描后对图像文件进行分析处理,获取文字及版面信息。然后从识别出的文字信息中提取出业务问题和业务问题对应的答案。

若待处理数据是文本数据,将待处理数据输入语言理解模型,以使通过语言理解模型对待处理数据进行语言解析处理,从待处理数据中解析出业务问题和业务问题对应的答案。

在上述步骤S130中,解析出业务问题和业务问题对应的答案之后,获取业务问题和业务问题对应的答案之间的关联性,关联性例如业务问题是否为“是否类问题”,或业务问题的答案由几个部分组成等。是否类问题通常被视为客观性问题,其答案为“是”或“否”。

基于上述业务问题和业务问题对应的答案之间的关联性,生成该业务问题的表单布局。例如,若业务问题为是否类问题,那么业务问题的答案可以通过在答案“是”或“否”前加一个勾选框,通过勾选的方式进行展示。再例如,业务问题的答案由两个或多个部分组成,则在对每一部分答案进行编号和排序。

表单布局还可以包括每一业务问题和对应的答案文本颜色、字体样式、对话框颜色、对话框样式等。

在上述步骤S140中,基于上述生成的表单布局,以及解析获得的业务问题和业务问题对应的答案,生成表单题库。一个问题以及对应的答案可以为表单题库中的一条数据,表单题库可以包括多个问题以及对应的答案。

在一个可选的实施例中,如果用户发起提问,可以在表单题库中查询是否包含该问题和对应的答案,若查询到该问题以及对应的答案,则基于表单布局中业务问题和对应的答案的展示样式,将该问题和对应的答案进行展示。

在上述的实现过程中,从待处理数据中解析出业务问题和业务问题对应的答案,并确定每一业务问题和对应的答案的展示样式,基于表单布局、业务问题和业务问题对应的答案,生成表单题库。使得对话数据可以以表单题库的形式进行结构化信息的输出,提高了对数据的管理能力,以及便于数据的复用,通过表单题库对业务问题进行快速响应,提高对话数据处理的有效性和效率。

可选的,在本申请实施例中,待处理数据包括图片数据或文本数据;神经网络模型包括语言理解模型和图片识别模型,将待处理数据输入预设的神经网络模型,从待处理数据中解析出业务问题和业务问题对应的答案,包括:若待处理数据为图片数据,则将待处理数据输入图片识别模型,以使通过图片识别模型对待处理数据进行图像识别,对待处理数据中的信息进行标注,基于标注后的信息,获得业务问题以及业务问题对应的答案;若待处理数据为文本数据,则将待处理数据输入语言理解模型,以使通过语言理解模型对待处理数据进行语言解析处理,从待处理数据中解析出业务问题和业务问题对应的答案。

在具体的实现过程中:待处理数据包括图片数据或文本数据;神经网络模型包括语言理解模型和图片识别模型,根据待处理数据的类型将其输入到对应的神经网络模型中,利用神经网络模型对待处理数据进行处理,从待处理数据中解析出业务问题和答案。

具体例如,若待处理数据为图片数据,则将待处理数据输入图片识别模型,图片识别模型用于通过图像处理和机器学习方法从图像中提取文本信息。利用图片识别模型对待处理数据中的字符通过检测暗、亮模式的变化,确定待处理数据图片中的形状,然后用字符识别方法将图片中的形状翻译成文字。

然后可以对文字中的信息进行标注,例如问题和答案分别标注为两类信息,基于标注后的信息,可以从待处理数据中业务问题以及业务问题对应的答案。标注的过程可以通过计算机视觉等技术实现。

语言理解模型的作用是可以确定文本中哪些内容属于业务问题,哪些内容属于答案。若待处理数据为文本数据,则将待处理数据输入语言理解模型,解析出业务问题和业务问题对应的答案。具体例如,通过语言理解模型输出文本内容属于业务问题的概率值或输出文本内容属于答案的概率值,基于概率值确定输入语言理解模型的文本是业务问题或答案。

作为一种实施方式,语言理解模型的训练方式可以包括finetuning和zero-shotlearning等方式。将标注问题标签或答案标签的文本内容作为语言理解模型的训练数据,使得语言理解模型学习业务问题和答案的特征,从而能够区分文本内容属于业务问题还是答案。

在一个可选的实施例中,在将待处理数据输入语言理解模型之前,所述方法还包括:将待处理数据进行预处理操作,预处理操作包括清洗数据和标准化原始数据。标准化原始数据是指采用正则表达式等将待处理数据整理为标准格式的数据,标准格式的数据可以是QA(QUALITY ASSURANCE,质量保证)形式的数据。清洗数据是指采用重复值处理、空缺值处理或异常值处理等将数据中的无关信息进行去除,提高待处理数据的质量,从而减少题库中存在的无关信息,使得生成的题库更加准确。

在上述的实现过程中,根据待处理数据的类型将其输入到对应的神经网络模型中,利用神经网络模型对待处理数据进行处理,从待处理数据中解析出业务问题和答案,提高数据处理的效率。

可选的,在本申请实施例中,获取待处理数据,包括:获得预设的用户数据以及待填写表单图像;基于待填写表单图像,获得待填写表单图像的填写策略;填写策略包括用户数据中的参数项与待填写表单图像中的待填项的对应关系;根据填写策略,将用户数据中的参数项,填写至待填写表单图像中对应的待填项,获得待处理数据。

在具体的实现过程中:预设的用户数据可以为包含用户信息的数据或用户自定义的数据。用户数据中包括参数项,以用户信息为例,用户信息中的姓名可以作为一项参数项。

待填写表单图像为未填写的表单图像,待填写表单图像包括一项或多项待填项。例如一张空的录取通知书可以为一个待填写表单图像,其中录取通知书中的学生姓名、专业、入学日期等信息可以作为待填项。

基于待填写表单图像,获得待填写表单图像的填写策略,填写策略包括用户数据中的参数项与待填写表单图像中的待填项的对应关系,例如用户数据中的真实姓名这一参数项,与待填写表单图像中的“姓名”这一待填项是相对应的。对应关系还包括用户数据中的参数项与待填写表单图像中的待填项的位置关系。

在确定填写策略之后,可以根据填写策略,将用户数据中的参数项,填写至待填写表单图像中对应的待填项,获得待处理数据。例如将用户数据中的“真实姓名”填写至录取通知书中的学生姓名的待填项对应的横线或空格中。

在上述的实现过程中,基于待填写表单图像,获得待填写表单图像的填写策略;根据填写策略,将用户数据中的参数项,填写至待填写表单图像中对应的待填项,获得待处理数据,实现自动化填写待填写表单图像,提高表单填写的效率,同时丰富了待处理数据的多样性。

可选的,在本申请实施例中,基于待填写表单图像,获得待填写表单图像的填写策略,包括:对待填写表单图像进行图像识别,获得结构化数据;对结构化数据中每一项参数信息进行标注,获得标注信息;标注信息包括每一项参数信息的位置信息和属性信息;将标注信息输入预设的表单模型,获得待填写表单图像的填写策略。

在具体的实现过程中:填写策略包括用户数据中的参数项与待填写表单图像中的待填项的对应关系,也就是说用户数据中的参数项应该填写至待填写表单图像中的哪一待填项。

确定表单图像的填写策略的过程例如,利用计算机视觉图像识别技术,对待填写表单图像进行图像识别,获得结构化数据,结构化数据为二维表结构来逻辑表达和实现的数据,主要通过关系型数据库进行存储和管理。

对结构化数据中每一项参数信息进行标注,获得标注信息;例如对录取通知书中的“学生姓名”以及学生姓名的横线都可以作为参数信息,对参数信息进行标注,标注的内容包括每一项参数信息的位置信息和属性信息。位置信息可以为参数信息的位置,例如“学生姓名”以及学生姓名的横线的坐标数据,属性信息可以为每一项参数信息的属性。

将标注信息输入预设的表单模型,获得待填写表单图像的填写策略。表单模型可以为深度学习模型,具体例如卷积神经网络或者预训练的BERT模型。表单模型用于学习和理解被标注后的结构化数据,并根据这些信息生成填写策略。

下面通过实施例进行描述,例如一个录取通知书,该录取通知书包含了学生姓名、专业、入学日期等信息。现有技术中这些信息需要由专门的人员手动填写,耗时而且容易出错。

本申请实施例中获得待填写表单图像的填写策略的方法为使用计算机视觉技术识别表单布局和样式模版,然后通过预训练的深度学习模型,生成填写策略,根据数据库的学生信息,自动填写每一个空格。

例如,系统会识别到“姓名”标签旁边的空格,然后查找相应的学生姓名信息,并填入。同理,对于其他的专业、入学日期等空格也是类似的自动填写过程。这样就大大减轻了人工劳动,提高了效率和准确性。

深度学习模型的输入主要是由数据预处理器处理后的结构化数据,这些数据表示了原始表单的布局、样式模版和各项控件的位置等信息。各项控件即各项待填项。

填写策略可以包括但不限于:表单的整体布局和结构、表单中各个字段(例如:“姓名”,“日期”)的位置、表单中空格的位置、如果可获取,每个字段应填入的数据类型(如文本,日期等)、输出则是针对不同控件的填写策略。这些策略基于模型学习到的布局和样式模版的理解,决定了如何填写各个字段。

填写的内容可以包括:针对每个空格的填写内容(例如:“张三”,“2023-09-01”)、填写的顺序(例如:先填姓名,再填日期)、以及特别的填写规则(例如:如果某个字段标记为"可选",则可能不填写)。

在上述的实现过程中,对待填写表单图像进行图像识别,获得结构化数据;对结构化数据中每一项参数信息进行标注,将标注信息输入预设的表单模型,获得待填写表单图像的填写策略。实现利用计算机视觉技术自动化填写待填写表单图像,提高表单填写的效率,同时丰富了待处理数据的多样性。

可选的,在本申请实施例中,获取待处理数据,包括:获取目标翻译语言和待翻译数据;基于目标翻译语言和待翻译数据,向服务器发起翻译请求;接收服务器发送的翻译后数据;翻译后数据为服务器基于翻译请求生成的;将翻译后数据作为待处理数据。

在具体的实现过程中:目标翻译语言为用户根据翻译需求确定的翻译语言。待翻译数据为需要进行翻译的文本数据。基于目标翻译语言和待翻译数据,向服务器发起翻译请求,翻译请求可以是JSON格式的数据。

服务器在接收到翻译请求之后,会响应于翻译请求,对待翻译数据进行翻译,并向系统返回翻译后数据。系统接收服务器发送的翻译后数据,将翻译后数据作为待处理数据。

在上述的实现过程中,用户可以选择自己的目标翻译语言,并获得即时的翻译结果,将翻译后数据作为待处理数据,改善现有的翻译服务可能存在精准度不高的问题,提高表单题库的准确性。并且其他语言的数据也可以通过翻译作为待处理数据,从而提高了表单题库的可用性。

可选的,在本申请实施例中,其中,翻译后数据为服务器在接收到翻译请求之后,基于翻译请求中的目标翻译语言,调用目标翻译语言对应的翻译接口,对待翻译数据进行翻译获得。

在具体的实现过程中:服务器在接收到翻译请求之后,触发翻译服务。服务器从翻译请求中提取出目标翻译语言和待翻译数据,调用目标翻译语言对应的翻译接口,对待翻译数据进行翻译获得。其中,不同目标翻译语言对应的翻译接口可以相同,也可以不同。翻译接口具体可以为谷歌翻译API和科大讯飞翻译API等。

作为一个可选地实施例,翻译后数据以及题库表单等,可以根据用户的需求,动态生成适合的布局和样式模版。例如在前端界面,用户可以选择不同的布局和样式模版,如展示样式、颜色或形状等。在后端服务器,系统根据用户选择的模版,调用相应的CSS(Cascading Style Sheets,层叠样式表)框架,生成对应的HTML(HyperText MarkupLanguage,超文本标记语言)和CSS代码,最后显示在用户界面上。

在上述的实现过程中,服务器在接收到翻译请求之后,触发翻译服务。服务器从翻译请求中提取出目标翻译语言和待翻译数据,调用目标翻译语言对应的翻译接口,实现实时翻译,提高翻译的效率。

可选的,在本申请实施例中,在基于表单布局、业务问题和业务问题对应的答案,生成表单题库之后,方法还包括:获取对表单题库进行修正的修正数据;基于修正数据对表单题库进行修正更新,获得更新表单题库;在获取到用户提问请求之后,基于更新表单题库,查询提问请求对应的业务答案。

在具体的实现过程中:在表单题库生成之后,可以基于表单题库为用户提供业务问题的答案,将查询数据复用,提高答疑的效率和质量。

为了确保表单题库中数据的准确性,可以对表单题库中的数据需要进行更新和修正。具体例如,获取对表单题库进行修正的修正数据,基于修正数据对表单题库进行修正更新,获得更新表单题库。更新表单题库是利用修正数据对原始数据进行替换之后的题库。在获取到用户提问请求之后,在更新表单题库中查询提问请求对应的业务答案。

请参见图2示出的本申请实施例提供的一种题库生成结构示意图。

下面进行举例描述,一位公司的员工在内部群聊中询问“请问新员工入职需要准备哪些文件?”。工作人员回答“新员工需要准备个人身份证原件、学历证明和前公司离职证明等”。

通过ChatGPT系统分析后,可以生成相应的表单题库。布局包括:问题—“新员工入职准备材料”,解答项目包括:“身份证原件”,“学历证明”,“前公司离职证明”。

样式模板可以包括:问题部分用蓝色突出,解答部分用灰色列表呈现,每一项解答对应一个勾选框。

样式模板选择模块:根据布局和问题答案特性,选择合适的样式模板,设定表单外观。采用基于规则的方法或者算法挑选方法选择合适的样式模板。

获取对表单题库进行修正的修正数据为,“新员工需要准备个人身份证复印件、学历证明和前公司离职证明等”。基于修正数据对表单题库进行修正更新,那么更新表单题库中业务问题为“新员工入职准备材料”,对应的回答为“身份证复印件”、“学历证明”和“前公司离职证明”。当下一位用户提问相同或类似问题时,系统可以直接展示更新表单题库中的回答,提高答疑的效率和质量。

在上述的实现过程中,基于修正数据对表单题库进行修正更新,获得更新表单题库;在获取到用户提问请求之后,基于更新表单题库,查询提问请求对应的业务答案,使得用户获取到的始终是修正更新后的回答,提高对话数据处理的有效性和质量。

请参见图3示出的本申请实施例提供的题库生成装置的结构示意图;本申请实施例提供了一种题库生成装置200,包括:

获取模块210,用于获取待处理数据;

解析模块220,用于将待处理数据输入预设的神经网络模型,从待处理数据中解析出业务问题和业务问题对应的答案;

布局模块230,用于根据业务问题和业务问题对应的答案,生成表单布局;表单布局用于确定每一业务问题和对应的答案的展示样式;

题库生成模块240,用于基于表单布局、业务问题和业务问题对应的答案,生成表单题库。

可选地,在本申请实施例中,题库生成装置,待处理数据包括图片数据或文本数据;神经网络模型包括语言理解模型和图片识别模型,题库生成模块,具体用于若待处理数据为图片数据,则将待处理数据输入图片识别模型,以使通过图片识别模型对待处理数据进行图像识别,对待处理数据中的信息进行标注,基于标注后的信息,获得业务问题以及业务问题对应的答案;若待处理数据为文本数据;则将待处理数据输入语言理解模型,以使通过语言理解模型对待处理数据进行语言解析处理,从待处理数据中解析出业务问题和业务问题对应的答案。

可选地,在本申请实施例中,题库生成装置,获取模块包括填写表单单元,用于获得预设的用户数据以及待填写表单图像;基于待填写表单图像,获得待填写表单图像的填写策略;填写策略包括用户数据中的参数项与待填写表单图像中的待填项的对应关系;根据填写策略,将用户数据中的参数项,填写至待填写表单图像中对应的待填项,获得待处理数据。

可选地,在本申请实施例中,题库生成装置,填写表单单元,还用于对待填写表单图像进行图像识别,获得结构化数据;对结构化数据中每一项参数信息进行标注,获得标注信息;标注信息包括每一项参数信息的位置信息和属性信息;将标注信息输入预设的表单模型,获得待填写表单图像的填写策略。

可选地,在本申请实施例中,题库生成装置,获取模块包括翻译单元,用于获取目标翻译语言和待翻译数据;基于目标翻译语言和待翻译数据,向服务器发起翻译请求;接收服务器发送的翻译后数据;翻译后数据为服务器基于翻译请求生成的;将翻译后数据作为待处理数据。

可选地,在本申请实施例中,题库生成装置,翻译单元,其中,翻译后数据为服务器在接收到翻译请求之后,基于翻译请求中的目标翻译语言,调用目标翻译语言对应的翻译接口,对待翻译数据进行翻译获得。

可选地,在本申请实施例中,题库生成装置,还包括修正单元,用于获取对表单题库进行修正的修正数据;基于修正数据对表单题库进行修正更新,获得更新表单题库;在获取到用户提问请求之后,基于更新表单题库,查询提问请求对应的业务答案。

应理解的是,该装置与上述的题库生成方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。

请参见图4示出的本申请实施例提供的电子设备的结构示意图。本申请实施例提供的一种电子设备300,包括:处理器310和存储器320,存储器320存储有处理器310可执行的机器可读指令,机器可读指令被处理器310执行时执行如上的方法。

本申请实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上的方法。

其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-OnlyMemory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。

本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请实施例各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。

相关技术
  • 一种区块链ID生成及使用方法、装置、电子设备以及存储介质
  • 一种视频集锦的生成方法、装置、电子设备及存储介质
  • 一种浴室加热装置和用于控制浴室加热装置的方法、设备、电子设备及计算机可读存储介质
  • 类文件生成方法、装置、电子设备及存储介质
  • 无人机迁移轨迹生成方法、装置、电子设备和存储介质
  • 生成定制题库方法、装置、计算机设备和存储介质
  • 题库的生成方法、装置、计算机可读存储介质及处理器
技术分类

06120116493189