掌桥专利:专业的专利平台
掌桥专利
首页

一种基于已有习题自动合成新的几何证明题的方法及系统

文献发布时间:2024-04-18 20:01:55


一种基于已有习题自动合成新的几何证明题的方法及系统

技术领域

本发明涉及信息处理技术领域,尤其涉及一种基于已有习题自动合成新的几何证明题的方法及系统。

背景技术

习题是人类开展教育活动的重要载体。教学研究、学科考试等各种应用场景对新习题一直保持有较大的需求量。

目前,新习题通常需要专家根据相关知识点进行手工编制,这一过程工作量庞大且效率较低,需要投入大量时间和精力。例如每年中考、高考使用的习题,都需要大量的专家共同研究几个月才能够编制出来。因此,探索一种能够自动生成新习题的人工智能技术,以代替或者辅助人类完成新习题的编制,具有重要的研究与应用价值。

不同知识领域的习题在呈现形态和内在特征上存在着较大的差异。几何证明题综合了几何、代数以及逻辑推理等多个领域的知识,涉及的知识领域较为广泛,设计能够满足实际教学需求的几何证明题的自动生成技术面临巨大的挑战。现有几何证明题的自动生成方法主要有搜索法、代数消元法和数值验证法。

搜索法是基于输入习题的原始几何关系,即已知一道习题的已知条件和待求结论中的关系,利用欧式几何中的推理方法,搜索发现新的几何关系,最后将新发现的几何关系与输入习题的原始几何关系相结合从而形成新习题。代数消元法是利用解析几何或者向量几何的方法,将一道输入习题中的原始几何关系转换为方程组,然后通过消元操作发现新的几何关系,最后基于新发现的几何关系与输入习题的原始几何关系合成新习题。数值验证法是以一道习题的几何图形为输入,运用图形解析的相关技术识别图中的几何对象并计算它们的几何量,例如线段长度、角度大小等,然后通过寻找几何量之间的等量关系形成候选定理,但候选定理并不一定都能成立,还需要利用几何证明题的自动解答方法进行验证筛选,最后才输出新习题。

可知,现有的几何证明题的自动生成方法都以一个已有习题为输入对象,利用几何推理手段来挖掘输入习题中除了原始几何关系以外的其他新关系,并以此为基础合成新的习题,从而使新生成的习题所包含的几何关系全都可以基于这一道输入习题的原始几何关系推理得出。导致最终生成的新习题与输入习题比较相似,缺乏新颖性,无法满足实际教学的需求。

发明内容

本发明提供一种基于已有习题自动合成新的几何证明题的方法及系统,用以解决现有方法生成的新习题与输入习题比较相似,缺乏新颖性的问题。

一方面,本发明提供一种基于已有习题自动合成新的几何证明题的方法,其特征在于,该方法包括:

分别获取多道已有几何证明题中每道几何证明题的原始几何关系,得到二元组集合;每个二元组包括几何关系和向量方程,所述向量方程由所述几何关系推理得到;

基于所述二元组集合,筛选出可以重组的几何关系,以生成多道新的几何证明题;

其中,所述可以重组的几何关系来自多道不同的已有几何证明题。

进一步的,所述二元组中的几何关系同时包括直接几何关系和间接几何关系;或,仅包括直接几何关系。

进一步的,所述二元组集合中几何关系的获取包括:

将一个已有几何证明题的原始几何关系依次转换为向量方程的形式,并将方程中的每个向量转换为以原点为起点的向量,得到向量方程组;

令所述向量方程组的线性组合等于零并求解,若方程组存在一组不全为零的系数解,则获得由直接几何关系及其向量方程组成的二元组集合、和由间接几何关系及其向量方程组成的二元组集合;

反之,则仅获得直接几何关系及其向量方程组成的二元组集合。

进一步的,可以重组的几何关系的筛选方式包括:

满足E

满足

满足

其中,R

进一步的,判断E

将E

利用表达式嵌入方法分别获取F

其中,E

进一步的,所述表达式嵌入方法是基于图神经网络将数学表达式转换为包括其语义特征的向量表达;

所述表达式嵌入方法的步骤包括:构建表达式树、嵌入模型设计、以及嵌入模型训练。

进一步的,判断

利用解析几何的方法,将

进一步的,所述可以重组的几何关系分别来自两道不同的已有几何证明题。

进一步的,合成新的几何证明题的内容包括:题干文本、几何图形以及解答文本。

另一方面,本发明还提供一种基于已有习题自动合成新的几何证明题的系统,其特征在于,该系统至少包括几何关系提取模块和几何关系重组模块,其用于执行上述任一项方法的步骤。

总体而言,通过本发明所构思的技术方案,与现有技术相比能够取得下列有益效果:

本发明提供一种基于已有习题自动合成新的几何证明题的方法及系统,通过重组多个已有几何证明题的几何关系以生成多道新的几何证明题,使新生成的几何证明题所包含的几何关系无法基于原先单个几何证明题的原始几何关系推理得到,因而具有较高的新颖性。此外,本发明能够生成一些现有方法所无法生成的更具新颖性的习题,为通用新习题生成技术的研究提供了一些新的思路。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的方法流程示意图;

图2是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的二元组集合的获取方法流程示意图;

图3是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的例1和例2的几何图形;

图4是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的A

图5是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的A

图6是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的表达式嵌入模型的训练过程示意图;

图7是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的生成新习题的几何图形。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或系统中还存在另外的相同要素。

为了实现重组多道已有习题的几何关系以生成新习题目的,本发明首先从多道不同习题中分别获取几何关系,然后对它们进行重组整合。也即是,本发明基于向量恒等式设计,主要包括几何关系提取和几何关系重组,以此实现利用多道已有几何证明题生成多道新的几何证明题的目的。下面结合图1~图7描述本发明实施例所提供的一种基于已有习题自动合成新的几何证明题的方法及系统。

图1是本发明提供的一种基于已有习题自动合成新的几何证明题的方法及系统的方法流程示意图,如图1所示,包括但不限于以下步骤:

步骤101:分别获取多道已有几何证明题中每道几何证明题的原始几何关系,得到二元组集合。

针对已有几何证明题,几何关系提取环节的主要任务是获取其中的几何关系,并将它们表示成向量方程的形式。基于向量恒等式提出几何关系的自动提取方法,尽可能多地从输入的已有几何证明题中获取几何关系,进而增加新习题的生成数量。

需要说明是的,本文提出的向量恒等式,也即是,令{R

由向量恒等式的定义可以看出,

基于向量恒等式获取二元组集合。其中,每个二元组包括一组几何关系和一个向量方程,且向量方程由几何关系推到得到。

需要说明的是,二元组中的几何关系同时包括直接几何关系和间接几何关系;或,仅包括直接几何关系。

其中,二元组集合中几何关系的获取包括:

将一个已有几何证明题的原始几何关系依次转换为向量方程的形式,并将方程中的每个向量转换为以原点为起点的向量,得到向量方程组;

令向量方程组的线性组合等于零并求解,若方程组存在一组不全为零的系数解,则获得由直接几何关系及其向量方程组成的二元组集合、和由间接几何关系及其向量方程组成的二元组集合;反之,则仅获得直接几何关系及其向量方程组成的二元组集合。

更具体的步骤如图2所示:

步骤201:获取原始几何关系;也即是,解析习题题干和图形的语义,得到基础几何关系,然后基于基础几何关系进一步挖掘得到隐含几何关系。例如,利用搜索法挖掘隐含几何关系。其中,从已有几何证明题中获得的已知条件的基础几何关系和待求结论中的隐含几何关系分别用{R

步骤202:将原始几何关系依次转换为向量方程的形式,并将方程中的每个向量转换为以原点为起点的向量,得到向量方程组;也即是,将{R

如表1所示,为常见的几种几何关系以及它们所对应的向量方程表达形式。

表1常见的几何关系及其对应的向量方程

步骤203:令向量方程的线性组合等于零;也即是

步骤204:展开

步骤205:令θ

由于存在某些几何证明题的题意未被正确解析或算法运行超时等情况,则向量恒等式的求解有时可能会失败,即步骤205中的方程组不存在满足要求的解,则此时只获取获得直接几何关系及其向量方程组成的二元组集合。

以输入的几何证明题例1为例,提取其几何关系,得到二元组集合Ω。其中,例1:如图3,在△ABC中,AB=AC,D在BC上,E在AB上,且DB=DE,求证,A、E、D、C四点共圆。

首先,获取例1包含的几何关系,分别将它们表示成向量方程的形式,并将方程中的所有向量转换为以原点“O”为起点的向量,结果如表2所示。其中,表中第1、2、5行的几何关系是例1题干中的基础几何关系,而第3、4行的几何关系是基于基础几何关系通过搜索法推理得到隐含几何关系。

表2例1中的原始几何关系及其对应的向量方程

接着,令表2中向量方程的线性组合为零。为了方便展示,以原点“O”为起点的向量由它们的终点表示,并斜体加粗,例如

然后,展开

最后,令

求解该方程组,得到一组不全为零的解,即k

将该方程组的解带入

以此得到如表3所示的几何证明题例1的二元组集合。其中,每个二元组包括一组几何关系和一个向量方程,其中,所述向量方程由所述几何关系组推理得到。为了直观呈现,表中将同一个向量方程对应的直接几何关系和间接几何关系写在了同一行。

表3例1与例2的二元组集合

同理,例2:如图3所示,由△ABC的两边向外做正方形ABED、BCGF,P是平面内的一点,满足PD⊥BC、PG⊥AB,求证:PB⊥AC。利用该方法从例2中提取的几何关系,得到如表3所示的几何证明题例2的二元组集合。其中,第6个向量方程的推导过程:由△ABC的两边向外做正方形ABED、BCGF,可得

步骤102:基于二元组集合,筛选出可以重组的几何关系,以生成多道新的几何证明题。其中,可以重组的几何关系来自多道不同的已有几何证明题。

对于已有几何证明题,如果能够求解出它的向量恒等式,就实现了基于已知条件证明待求结论的目标。也即是说,一个已有几何证明题所包含的几何关系,之所以能够组成这个习题,是因为基于这些几何关系可以建立一个向量恒等式。因此,对于源自不同已有几何证明题的几何关系,可以通过验证能否由不同已有几何证明题的几何关系建立向量恒等式来判定它们重组为新的几何证明题的可行性。

然而,源自不同已有几何证明题的几何关系中点的命名序列不一致,会导致它们所对应的向量方程中的变量名称不一致。而向量恒等式的建立过程涉及符号运算,且对变量名称非常敏感,若不消除点命名序列不一致的影响,将直接导致源自不同已有几何证明题的几何关系建立向量恒等式的成功率较低。例如,如果不统一点的命名序列,则只基于例1和例2则无法合成新的习题。另外,几何关系的语义信息不受点命名序列的影响,一组几何关系可以在保持几何语义不变的情况下,对应有多组不同的点的命名序列。例如“三角形ABC中,AB=AC。”与“三角形DEF中,DE=DF。”的几何语义完全相同,它们都表示了一个等腰三角形。因此,在判定源自不同已有几何证明题的几何关系重组为新的已有几何证明题的可行性时,需要通过验证它们对应的向量方程是否同构,以消除点命名序列不一致的影响。

总之,需要基于二元组集合,筛选出可以重组的几何关系,以生成多道新的几何证明题。具体而言,可以重组的几何关系的筛选方式包括:

(1)满足E

(2)满足

(3)满足

其中,R

只有满足以上三个必要条件,R

将提取的几何关系两两组合,然后筛选出能重组的几何关系并合成新的几何证明题。具体的,以两组几何关系R

具体而言,首先判断两组向量方程是否同构,然后两组向量方程是否相容,最后判断是否满足上述条件(3);其具体步骤包括:

步骤301:将E

步骤302:令

步骤303:利用表达式嵌入方法中的嵌入模型分别获取F

需要说明的是,判断

步骤304:令X、Y分别为E

步骤305:基于f替换E

其中,E

步骤306:联立

步骤307:基于步骤305中构建的坐标方程,寻找存在

步骤308:无法合成新习题,结束。

几何证明题的几何关系被提取之后,获得二元组集合,再从中筛选出可以重组的几何关系并生成新的几何证明题。两组几何关系可以重组为新的几何证明题的前提是它们对应的向量方程同构。而判断两个向量方程是否同构最直接的方法,是遍历它们变量集合之间所有可能的映射,然后依据每一组映射,替换方程中的变量并验证对应的多项式是否线性相关。然而,这种方法的时间复杂度为O(n

而本发明中的进一步发明,是设计了基于图神经网络的表达式的嵌入方法,以快速判断向量方程是否同构。

作为本发明的一个优选实施例,表达式嵌入方法是基于图神经网络将数学表达式转换为包括其语义特征的向量表达;而表达式嵌入方法的步骤包括:构建表达式树、嵌入模型设计、以及嵌入模型训练。

第一步:构建表达式树;

数学表达式的语义信息不受变量命名序列的影响,一个表达式可以在保持其语义不变的情况下,对应有多组不同的变量命名序列。为了消除变量命名序列对表达式语义的影响,本发明未采用常规的表达式树,而是在其基础上,将其中的变量节点进行了合并。

以A

可知,在修改后的表达式树结构中,为每个节点设置了属性向量,以表示运算符和运算数的信息。更具体的,节点的属性向量由3部分组成:前3位为第一部分,表示运算符的信息,由运算类型的独热编码组成;第4位为第二部分,表示变量运算数的信息,数值等于相应节点的度;第5位为第三部分,表示数字运算数的信息,为其真实值。

一颗表达式树可以形式化地表示为G=(V,A,X),其中V={v

第二步:嵌入模型设计;

因为图卷积神经网络(Graph Convolutional Networks,GCN)易于实现且具有较强的图数据表征能力,本发明基于GCN设计了的表达式的嵌入模型,以修改后的表达式树的邻接矩阵A和节点属性矩阵X为输入,以表达式树中所有节点的向量表示为输出,其中,节点即表达式运算符和运算数。

嵌入模型由3层GCN堆叠而成,每一层GCN以上层网络的输出以及原始表达式树的邻接矩阵为输入,输出为节点的新表示。第i层GCN的实现过程为:

其中,

E(X,A)=GC

嵌入模型的输出为表达式中运算符和运算数的嵌入。为了获取整个表达式的嵌入,需要进行池化操作,也称为采样。

需要说明的是,池化操作可以通过多种方式实现,作为本发明的一个实施例,采用简单且有效的均值方法。更具体的,设

第三步:嵌入模型训练;

本发明采用预训练-微调的方式训练表达式的嵌入模型,其实现过程如图6所示,包括预训练阶段和微调阶段。

在预训练的阶段,采用对比学习的方式训练嵌入模型。针对表达式树,本发明采用了两种数据扰动策略:节点属性扰动和拓扑结构扰动。

节点属性扰动通过将节点属性矩阵X中的一部分元素随机置换为0,实现对节点属性信息的随机修改,形式化表示为

拓扑结构扰动通过将邻接矩阵A中的一部分元素随机置换为0,实现对表达式树拓扑结构的随机修改,形式表示为

获取扰动数据之后,就可以设计对比辅助任务来训练嵌入模型。文发明设计了节点级别的对比辅助任务。令

其中,n为G中节点的个数;θ(u,v)=s(g(u),g(v)),s(·,·)是余弦相似度计算函数,g(·)是非线性映射函数;α是温度参数。g(·)和α的引入可以提升模型的表征能力;分母中,k>i是为了避免视图内负样本对间的相似度不被重复计算。

在微调阶段,引入了一个有监督的表达式关系预测任务对模型进行微调。本发明搜集了一批表达式并对它们的关系进行了标注,每对表达式之间可能存在三种关系:同构、相似与不相似。

具体而言,对于两个表达式,如果一个表达式的变量经过替换后可以与另一个表达式相同,那么这两个表达式同构;如果两个不同构的表达式,在将它们展开式中各项的系数都替换为1后,它们变得同构,那么这两个表达式相似;上述情况都不满足则为不相似。

例如A

当关系预测任务在测试集上的准确率达到最优时,也即是实际实验中同构关系预测的准确率达了到100%时,微调结束。关系预测任务基于一个二层的线性分类器实现。需要说明的是,在进行关系预测之前,需要对嵌入模型的输出结果进行池化操作以获取整个表达式的嵌入。

作为本发明的一个实施例,以输入的几何证明题例1和例2为例,进一步说明其合成新习题的过程。

首先通过验证,可以发现表3中的向量方程3、6同构,且它们变量之间的一一映射为{A→A;B→B;C→C;D→D;E→G}。

然后利用解析几何的方法,将向量方程3(其变量名称被替换)、向量方程3的直接几何关系(其点的名称被替换)以及向量方程6的间接几何关系都转换为坐标方程的形式;需要说明的是,在转换前,需要为每个点设置坐标,如点A、B、C、D、G、P的坐标依次为(0,0)、(x

表4由向量方程或集合关系转换后的坐标方程

在表4中,方程组②~⑦存在解,所以相关几何关系都相容。基于方程①、⑤、⑥可以推导出⑦成立,所以“A、C、D、G四点共圆;AG交CD于B;PD⊥BC;PG⊥AB”和“PB⊥AC”将分为作为新习题的已知条件和待求结论。

最后将上述几何关系通过一些连词(如“求证”等)连接即可以形成题干文本。得到新习题1:,A、C、D、G四点共圆;AG交CD于B,P是平面内一点,满足PD⊥BC;PG⊥AB,求证,PB⊥AC。为了使生成的题干文本更规范,可以使用Chat-GPT对其进行润色。

此外,在生成几何图形时,只需选取方程组②~⑥的一个解,就可以确定图形中各个节点的坐标,进而可绘制出几何图形,如图7中的习题1。为了使生成的图形更美观,可以在方程组②~⑥的基础上增加不等式,限制图形中点之间的最大距离与最小距离的比值不大于设定值,例如不大于10:1。

而解答文本的生成与向量恒等式的求解过程类似,只需将待求结论的向量方程表示成已知条件向量方程的线性组合,即可以得到如下解答过程:

∵A、C、D、G四点共圆,且AG交CD于B;

∵PD⊥BC;

∵PG⊥AB;

综上可得:

即:PB⊥AC。

对于两个同构的向量方程A和B,如果它们都对应有间接几何关系,那么基于A的直接几何关系与B的直接几何关系、A的直接几何关系与B的间接几何关系、A的间接几何关系与B的直接几何关系、A的间接几何关系与B的间接几何关系有可能合成4个新习题。

然而,由于表3中的向量方程3的间接几何关系与向量方程6的直接几何关系互不相容,因此无法由它们合成新习题,所以由例1和例2只生成了3个新习题,如图7,新习题1、新习题2和新习题3。

需要说明的是,可以重组的几何关系分别来自两道不同的已有几何证明题。

另一方面,本发明还提供一种基于已有习题自动合成新的几何证明题的系统,该系统至少包括几何关系提取模块和几何关系重组模块,其用于执行上述任一项所述方法的步骤。该系统与上述方法的技术特征一致,此处不再一一赘述。

总之,本发明以多个已有几何证明题为输入,通过重组它们的几何关系来生成新的几何证明题,从而使新的几何证明题所包含的一些几何关系无法基于单个输入习题的几何关系推理得到。所以,在相同输入的条件下,本发明能生成一些现有同类方法无法生成的更具新颖性习题。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或实施例某些部分的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术分类

06120116571336