掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本文件涉及计算机技术领域,尤其涉及一种专利信息生成方法和装置。

背景技术

随着文字内容提取技术的发展,用户在进行各类文章阅读的过程中,需要尽快获取文章内容的摘要信息或是概述信息,来缩减用户用于阅读文章内容的时间,提高文章信息的获取效率。

目前并没有专门针对专利信息的概述生成方法。现有的针对新闻、通知和报告的概述生成方法只能提取关键句,但无法从文章中获取关键句之间的关联,使得关键句相互之间较为独立,从而不适用于专利信息的概述生成。

发明内容

本发明的目的在于提供一种专利信息生成方法和装置,旨在解决现有技术中的上述问题。

本发明提供一种专利信息生成方法,包括:

响应于接收到的专利信息生成请求,基于所述专利信息生成请求,将相应专利文档作为输入通过预先训练的第一人工智能模型从中提取专利详细信息,其中,所述专利详细信息具体包括以下至少之一:专利名称信息、技术方案信息、技术领域信息、技术效果信息;

将所述第二人工智能模型被训练基于专利名称信息、技术方案信息、技术领域信息和/或技术效果信息对所述专利文档进行概述;通过预先训练的第二人工智能模型根据所述专利详细信息生成专利概述信息并显示,其中,其中,所述通过预先训练的第二人工智能模型根据所述专利详细信息生成专利概述信息并显示具体包括:

通过预先训练的第二人工智能模型根据专利名称信息和技术方案信息生成专利概述信息并显示;或者,

通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息以及技术效果信息生成专利概述信息并显示;或者,

通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息、技术领域信息以及技术效果信息生成专利概述信息并显示。

本发明提供一种专利信息生成装置,包括:

提取模块,用于响应于接收到的专利信息生成请求,基于所述专利信息生成请求,将相应专利文档作为输入通过预先训练的第一人工智能模型从中提取专利详细信息,其中,所述专利详细信息具体包括以下至少之一:专利名称信息、技术方案信息、技术领域信息、技术效果信息;

生成模块,用于将所述第二人工智能模型被训练基于专利名称信息、技术方案信息、技术领域信息和/或技术效果信息对所述专利文档进行概述;通过预先训练的第二人工智能模型根据所述专利详细信息生成专利概述信息并显示,其中,其中,所述通过预先训练的第二人工智能模型根据所述专利详细信息生成专利概述信息并显示具体包括:

通过预先训练的第二人工智能模型根据专利名称信息和技术方案信息生成专利概述信息并显示;或者,

通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息以及技术效果信息生成专利概述信息并显示;或者,

通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息、技术领域信息以及技术效果信息生成专利概述信息并显示。

本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述专利信息生成方法的步骤。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述专利信息生成方法的步骤。

采用本发明实施例,能够提高对专利文档的阅读效率并提高了基于该专利概述信息进行检索的精准性。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例的专利信息生成方法的流程图;

图2是本发明实施例的专利信息生成装置的示意图;

图3是本发明实施例的电子设备的示意图。

具体实施方式

下面将结合附图详细地对示例性实施例进行描述说明。

应当指出,相关实施例及附图仅为描述说明本公开所提供的示例性实施例,而非本公开的全部实施例,也不应理解本公开受相关示例性实施例的限制。

应当指出,本公开中所用术语“第一”、“第二”等仅用于区别不同步骤、设备或模块等。相关术语既不代表任何特定技术含义,也不表示它们之间的顺序或者相互依存关系。

应当指出,本公开中所用术语“一个”、“多个”、“至少一个”的修饰是示意性而非限制性的。除非在上下文另有明确指出,否则应该理解为“一个或多个”。

应当指出,本公开中所用术语“和/或”,用于描述关联对象之间的关联关系,一般表示至少存在三种关联关系。例如,A和/或B,至少可以表示:单独存在A,同时存在A和B,单独存在B这三种关联关系。

应当指出,本公开的方法实施例中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。除非特别说明,本公开的范围不受相关实施例中步骤的描述顺序限制。

需要说明的是,本公开中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。

方法实施例

根据本发明实施例,提供了一种专利信息生成方法,图1是本发明实施例的专利信息生成方法的流程图,如图1所示,根据本发明实施例的专利信息生成方法具体包括:

步骤101,响应于接收到的专利信息生成请求,基于所述专利信息生成请求,将相应专利文档作为输入通过预先训练的第一人工智能模型从中提取专利详细信息;所述专利详细信息具体包括以下至少之一:专利名称信息、技术方案信息、技术领域信息、技术效果信息。所述第一人工智能模型为抽取模型。

具体地,第一人工智能模型可以是一种机器学习模型(例如分类任务模型)。上述第一人工智能模型通过如下步骤训练得到:

第一,获取训练正样本的集合和训练负样本的集合。

其中,训练正样本可以是样本专利文档中之前通过句法分析,词性分析,指代消解等语法分析方式获取的准确的、与技术问题强相关的句子。训练负样本可以是上述样本专利文档中与技术问题弱相关或不相关的句子。

第二,基于上述训练正样本的集合和训练负样本的集合,对初始的机器学习模型进行训练,得到第一人工智能模型。

得到的第一人工智能模型可以从训练样本中学习负面情感表达的不同特征,以及学习问题表达的不同形式,从而达到泛化的能力。

在一些实施例中,作为示例,上述执行主体可以将预定义类别的各条候选语句进行组合,生成技术问题信息。

步骤102,通过预先训练的第二人工智能模型根据所述专利详细信息生成专利概述信息并显示。所述第二人工智能模型被训练基于专利名称信息、技术方案信息、技术领域信息和/或技术效果信息对专利文档进行概述。

以下对本发明实施例的上述技术方案进行详细说明。

在本发明实施例中,通过第一人工智能模型,使用各种语法分析方式从专利文档中提取出与技术问题相关的至少一个候选语句。其中,上述的语法分析方式包括但不限于以下至少一项:句法分析,词性分析,指代消解。

在本发明实施例中,第一人工智能模型可以从专利文档的权利要求部分和/或说明书部分中提取出至少一个候选技术方案信息,确定上述候选技术方案信息的显性特征组,并根据上述显性特征组确定的技术方案语句,生成技术方案信息。同理,可以通过上述相同的方式提取出专利名称信息、技术领域信息和/或技术效果信息。

提取后,可以通过预先训练的第二人工智能模型根据专利名称信息和技术方案信息生成专利概述信息并显示;或者通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息以及技术效果信息生成专利概述信息并显示;或者通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息、技术领域信息以及技术效果信息生成专利概述信息并显示。

装置实施例一

根据本发明实施例,提供了一种专利信息生成装置,图2是本发明实施例的专利信息生成装置的示意图,如图2所示,根据本发明实施例的专利信息生成装置具体包括:

提取模块20,用于响应于接收到的专利信息生成请求,基于所述专利信息生成请求,将相应专利文档作为输入通过预先训练的第一人工智能模型从中提取专利详细信息;所述专利详细信息具体包括以下至少之一:专利名称信息、技术方案信息、技术领域信息、技术效果信息。

生成模块22,用于通过预先训练的第二人工智能模型根据所述专利详细信息生成专利概述信息并显示。

所述生成模块22进一步用于:

将所述第二人工智能模型训练为基于专利名称信息、技术方案信息、技术领域信息和/或技术效果信息对专利文档进行概述。

所述生成模块22具体用于:

通过预先训练的第二人工智能模型根据专利名称信息和技术方案信息生成专利概述信息并显示;或者

通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息以及技术效果信息生成专利概述信息并显示;或者

通过预先训练的第二人工智能模型根据专利名称信息、技术方案信息、技术领域信息以及技术效果信息生成专利概述信息并显示。

本发明实施例是与上述方法实施例对应的装置实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。

装置实施例二

本发明实施例提供一种电子设备,如图3所示,包括:存储器30、处理器32及存储在所述存储器30上并可在所述处理器32上运行的计算机程序,所述计算机程序被所述处理器32执行时实现如方法实施例中所述的步骤。

装置实施例三

本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器32执行时实现如方法实施例中所述的步骤。

除了上述方法和装置以外,本公开的示例性实施例还可以是计算机程序产品或存储有该计算机程序产品的计算机可读存储介质。该计算机产品中包括计算机程序指令,该计算机程序指令可被处理器执行,以实现上述示例性实施例中任一方法中描述的全部或部分步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言以及脚本语言(例如Python)。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行或者完全在远程计算设备或服务器上执行。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括:具有一个或多个导线电连接的静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘,或者上述的任意合适的组合。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

技术分类

06120116336678