掌桥专利:专业的专利平台
掌桥专利
首页

一种专利文件空间索引实现方法、系统、设备及存储介质

文献发布时间:2023-06-19 18:58:26


一种专利文件空间索引实现方法、系统、设备及存储介质

技术领域

本申请涉及数据索引的技术领域,尤其是涉及一种专利文件空间索引实现方法、系统、设备及存储介质。

背景技术

目前,部分专利检索网站允许用户建立自己的个人专利数据库,然而,让每一用户使用一个独立的个人专利数据库需要设计大量数据的复制,需要大量的存储空间,且对网络带宽、数据接口都会带来严重的性能问题,因而从成本上来说难以承受。

因此,现有的专利检索网站在进行专利文件的检索时,通常是采用跨库检索的方式,步骤如下:

1、当用户在专利检索网站发起检索时,根据用户输入的检索式从用于存储专利文件的专利文件数据库中进行一次查询,以获取对应的检索标识信息并存储于关系数据库中;

2、根据用户设置的自定义条件对关系数据库中的检索标识信息进行二次查询,得到自定义标识信息;

3、基于自定义标识信息三次查询专利文件数据库,获取对应的专利文件,应用层根据自定义标识信息和对应的专利文件关联后生成检索结果数据并呈现给用户。

当一次查询获取的检索标识信息数据量很大时,一次查询的耗时和带宽占用都较大,且基于检索标识信息和自定义条件进行二次查询时所需查询的参数也很多,同样造成耗时和带宽占用较大的问题,使系统性能受到影响,且用户体验较差。

根据上述相关技术易知,现有的专利文件检索方式存在效率较低的问题。

发明内容

为了提高从专利文件数据库中检索专利文件的效率,本申请提供一种专利文件空间索引实现方法、系统、设备及存储介质。

本申请的发明目的一采用如下技术方案实现:

一种专利文件空间索引实现方法,包括:

获取用户输入的检索信息,通过语法解析引擎对所述检索信息进行解析,生成检索查询语句,所述检索信息包括检索式信息和自定义条件信息;

基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块;

通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端。

通过采用上述技术方案,当用户需要进行专利文件的检索时,获取用户所输入的检索信息,其中包括检索式信息和自定义条件信息,以便获知用户所需检索的专利文件的特征,通过语法解析引擎对检索信息进行解析,以生成与专利索引文件相应格式的检索查询语句,以便后续查询对应的专利文件;将检索查询语句与专利索引文件进行匹配,以确定检索信息对应的专利文件在专利文件数据库中的存储位置信息为专利文件位置信息,直接使用检索查询语句对专利文件数据库进行检索,因而无需跨库检索,数据库系统无需维护两套语法解析规则,减少了开发工作量与数据库系统的维护成本;将获取到的专利文件位置信息发送至应用层处理模块,通过应用层处理模块对利文件位置信息和对应的属性信息进行关联处理,生成检索结果展示信息并发送至用户端,便于用户查看检索结果;从而提高从专利文件数据库中检索专利文件的效率。

本申请在一较佳示例中:基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块的步骤之前,还包括:

基于专利文件数据库建立专利索引文件;

创建自定义信息字段,获取用户的自定义条件信息,进行扁平化处理后,添加至自定义信息字段中,所述自定义信息字段存储于专利索引文件中;

基于自定义信息字段更新专利索引文件。

通过采用上述技术方案,基于专利文件数据库建立专利索引文件,便于后续从专利文件数据库中快速找到所需的专利文件;创建自定义信息字段,用于存储用户的自定义条件信息,获取用户每次进行专利文件检索时输入的自定义条件信息,对自定义条件信息进行扁平化处理后添加至自定义信息字段中,以便降低字段爆炸的可能性;自定义信息字段存储于专利索引文件中,并定期基于更新后的自定义信息字段更新专利索引文件,将自定义信息字段嵌套于专利索引文件中,便于通过单次查询检索到检索信息所对应的专利文件,无需跨库检索,且当用户收录的自定义条件信息数据较多时,性能也优于现有的跨库查询系统。

本申请在一较佳示例中:创建自定义信息字段,获取用户的自定义条件信息,进行扁平化处理后,添加至自定义信息字段中的步骤中,包括:

在专利索引文件中创建自定义信息字段;当接收到用户的自定义条件信息时,对所述自定义条件信息进行扁平化处理;

更新专利索引文件的API接口,将扁平化处理后的自定义条件信息更新至自定义信息字段中。

通过采用上述技术方案,在专利索引文件中创建自定义信息字段,将自定义信息字段设置于专利索引文件中,便于通过单次查询检索到检索信息所对应的专利文件,无需跨库检索;当接收到用户的自定义条件信息时,对自定义条件信息进行扁平化处理,便于减少存储空间占用,降低字段爆炸的可能性;更新专利索引文件的API接口,便于接收经扁平化处理后的自定义条件信息,将扁平化处理后的自定义条件信息更新至自定义信息字段中,以便后续对用户的历史自定义信息进行快速匹配和调取。

本申请在一较佳示例中:创建自定义信息字段,获取用户的自定义条件信息,进行扁平化处理后,添加至自定义信息字段中的步骤之后,还包括:

根据预设评估周期评估自定义信息字段的字段数量信息,将所述字段数量信息与文件扩展阈值进行对比;

若字段数量信息大于文件扩展阈值,基于自定义信息字段生成新的索引集群。

通过采用上述技术方案,根据预设的评估周期评估自定义信息字段的字段数量,生成字段数量信息,并将字段数量信息与文件扩展阈值进行对比,以便判断字段数量是否达到需要进行文件扩展的程度,若字段数量信息大于文件扩展阈值,则基于自定义信息字段生成新的索引集群,从而实现对自定义信息字段的水平扩展,提高用户检索专利文件时的检索效率。

本申请在一较佳示例中:基于自定义信息字段更新专利索引文件的步骤之后,包括:

分析专利索引文件中各字段的功能,并进行功能类型定义,所述功能类型包括索引字段和非索引字段;

将非索引字段添加至其他字段文件中,并将非索引字段从专利索引文件中删除。

通过采用上述技术方案,将专利索引文件中各字段的功能进行分析,以确定各字段的功能类型,包括用于执行专利文件索引工作的索引字段和其他不用于执行专利文件索引工作的非索引字段,对各字段的功能类型进行定义,便于后续进行区分;将非用于执行专利文件索引工作的非索引字段添加至其他字段文件中,以便对不同类型的字段数据进行分类存放,同时,将非索引字段从专利索引文件中删除,以便减少专利索引文件的数据量,降低存储负担。

本申请在一较佳示例中:基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块的步骤中,包括:

基于检索查询语句作为关键词,通过文本匹配算法对专利索引文件进行匹配,从而确定专利文件的存储位置;

基于专利文件的存储位置查询专利文件数据库,生成专利文件位置信息,获取对应的属性信息;

将专利文件位置信息和对应的属性信息发送至应用层处理模块。

通过采用上述技术方案,根据检索查询语句生成关键词,便于后续查询用户所需的专利文件,基于生成的关键词通过文本匹配算法对专利索引文件进行匹配,从专利索引文件中确定用户所需检索的专利文件在专利文件数据库中的存储位置;基于专利文件的存储位置查询专利文件数据库,以对专利文件的存储位置进行验证,并基于验证成功的存储位置信息生成专利文件位置信息,基于每一专利文件位置信息获取对应专利文件的属性信息,便于后续将专利文件的属性信息进行展示,以便用户查看专利文件的基本信息;将专利文件位置信息和对应的属性信息发送至应用层处理模块,便于后续将专利文件位置信息和对应专利文件的属性信息进行一并展示。

本申请在一较佳示例中:通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端的步骤中,包括:

基于专利文件位置信息生成对应的超链接;

将专利文件的属性信息填入对应的预设展示模板中,所述属性信息包括专利标题和著录信息,将所述超链接与专利标题关联;

基于预设的展示顺序规则信息将填充后的展示模板进行排序,生成检索结果展示信息。

通过采用上述技术方案,基于专利文件位置信息生成对应的超链接,便于后续用户在应用层通过超链接的形式阅读专利文件,降低获取完整数量众多的专利文件并上传至应用层所需消耗的计算机资源和网络资源;将专利文件的属性信息填充入预设的展示模板中,其中属性信息包括专利标题和著录信息,便于后续用户通过专利标题和著录信息判断各专利文件是否为自己感兴趣的专利文件,以便提高用户的专利检索效率,将专利文件的超链接与专利标题关联,便于后续用户点击专利标题阅读完整专利文件;基于预设的展示顺序规则信息将填充后的展示模板进行排序,从而生成检索结果展示信息,便于后续根据预设的展示顺序规则信息对检索结果的多个专利文件进行展示。

本申请的发明目的二采用如下技术方案实现:

一种专利文件空间索引实现系统,包括:

检索信息解析模块,用于获取用户输入的检索信息,通过语法解析引擎对所述检索信息进行解析,生成检索查询语句,所述检索信息包括检索式信息和自定义条件信息;

专利文件索引模块,用于基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块;

应用层展示模块,用于通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端。

通过采用上述技术方案,当用户需要进行专利文件的检索时,获取用户所输入的检索信息,其中包括检索式信息和自定义条件信息,以便获知用户所需检索的专利文件的特征,通过语法解析引擎对检索信息进行解析,以生成与专利索引文件相应格式的检索查询语句,以便后续查询对应的专利文件;将检索查询语句与专利索引文件进行匹配,以确定检索信息对应的专利文件在专利文件数据库中的存储位置信息为专利文件位置信息,直接使用检索查询语句对专利文件数据库进行检索,因而无需跨库检索,数据库系统无需维护两套语法解析规则,减少了开发工作量与数据库系统的维护成本;将获取到的专利文件位置信息发送至应用层处理模块,通过应用层处理模块对利文件位置信息和对应的属性信息进行关联处理,生成检索结果展示信息并发送至用户端,便于用户查看检索结果;从而提高从专利文件数据库中检索专利文件的效率。

本申请的发明目的三采用如下技术方案实现:

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述专利文件空间索引实现方法的步骤。

本申请的发明目的四采用如下技术方案实现:

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述专利文件空间索引实现方法的步骤。

综上所述,本申请包括以下至少一种有益技术效果:

1. 当用户需要进行专利文件的检索时,获取用户所输入的检索信息,其中包括检索式信息和自定义条件信息,以便获知用户所需检索的专利文件的特征,通过语法解析引擎对检索信息进行解析,以生成与专利索引文件相应格式的检索查询语句,以便后续查询对应的专利文件;将检索查询语句与专利索引文件进行匹配,以确定检索信息对应的专利文件在专利文件数据库中的存储位置信息为专利文件位置信息,直接使用检索查询语句对专利文件数据库进行检索,因而无需跨库检索,数据库系统无需维护两套语法解析规则,减少了开发工作量与数据库系统的维护成本;将获取到的专利文件位置信息发送至应用层处理模块,通过应用层处理模块对利文件位置信息和对应的属性信息进行关联处理,生成检索结果展示信息并发送至用户端,便于用户查看检索结果;从而提高从专利文件数据库中检索专利文件的效率。

2. 基于专利文件数据库建立专利索引文件,便于后续从专利文件数据库中快速找到所需的专利文件;创建自定义信息字段,用于存储用户的自定义条件信息,获取用户每次进行专利文件检索时输入的自定义条件信息,对自定义条件信息进行扁平化处理后添加至自定义信息字段中,以便降低字段爆炸的可能性;自定义信息字段存储于专利索引文件中,并定期基于更新后的自定义信息字段更新专利索引文件,将自定义信息字段嵌套于专利索引文件中,便于通过单次查询检索到检索信息所对应的专利文件,无需跨库检索,且当用户收录的自定义条件信息数据较多时,性能也优于现有的跨库查询系统。

3. 根据预设的评估周期评估自定义信息字段的字段数量,生成字段数量信息,并将字段数量信息与文件扩展阈值进行对比,以便判断字段数量是否达到需要进行文件扩展的程度,若字段数量信息大于文件扩展阈值,则基于自定义信息字段生成新的索引集群,从而实现对自定义信息字段的水平扩展,提高用户检索专利文件时的检索效率。

附图说明

图1是本申请实施例一中专利文件空间索引实现方法的流程图。

图2是本申请专利文件空间索引实现方法中步骤S20的流程图。

图3是本申请专利文件空间索引实现方法中步骤S22的流程图。

图4是本申请专利文件空间索引实现方法中步骤S22的另一流程图。

图5是本申请专利文件空间索引实现方法中步骤S20的另一流程图。

图6是本申请专利文件空间索引实现方法中步骤S30的流程图。

图7是本申请实施例二中专利文件空间索引实现系统的一原理框图。

图8是本申请实施例三中的设备示意图。

具体实施方式

以下结合附图1至8对本申请作进一步详细说明。

实施例一

本申请公开了一种专利文件空间索引实现方法,可用于构建专利检索网站的专利文件检索系统。

如图1所示,具体包括如下步骤:

S10:获取用户输入的检索信息,通过语法解析引擎对所述检索信息进行解析,生成检索查询语句,所述检索信息包括检索式信息和自定义条件信息。

在本实施例中,检索信息是指用户在进行专利检索时所输入的信息,用于限定所需检索的专利文件的范围,检索信息包括检索式信息和自定义条件信息;检索式信息是指用户在搜索框内输入的由若干关键词构成的检索式;自定义条件信息是指用户用于对基于检索式搜索到的专利文件进行进一步筛选的条件信息;语法解析引擎是指拥有将用户输入的检索信息解析为计算机程序所能识别的语句的工具;检索查询语句为基于检索信息进行解析后生成的用于执行专利文件索引的语句。

具体地,检索式信息由关键词和检索符号构成,可用于确定希望检索的关键词内容和不希望检索的关键词内容,便于确定用户所需检索的相关内容;自定义条件信息用于进一步限定专利文件检索的检索范围,例如申请日、公开日、授权公告日、专利当前状态等信息。

具体地,获取用户所输入的检索信息,以便获知用户所需检索的专利文件的范围,将检索信息输入至语法解析引擎中,以便利用语法解析引擎对用户输入的检索信息进行解析,从而转化为检索查询语句,便于计算机程序确定用户需求,以执行专利文件的检索工作;在本申请中,专利文件是指包括专利申请文件、专利公布文本、专利授权文本及其他专利相关文件在内的多种公开文件。

在本实施例中,检索符号包括:

AND:检索两个关键词都必须存在的记录,该运算符对于检索词的位置没有要求,仅要求同时出现在相同的文献中;示例:汽车AND发动机、car AND engine可检索到关键词字段包含“汽车”和“发动机”的专利;空格与AND的作用相同。

OR:检索两个关键词,至少存在其中一个关键词;示例:汽车OR发动机可检索到关键词字段包含“汽车”或“发动机”的专利。

NOT:指定应排除在外的检索词;示例:汽车NOT发动机可检索到关键词字段包含“汽车”,但不包含“发动机”的专利。

S:代表可以在同句中检索包含的关键词;示例:TIAB:(粉碎效果(S)粉碎刀具),即将同句中检索的两个关键词用S隔开。

P:代表可以在同段中检索包含的关键词;示例:TIAB:(变压器(P) 反馈回路),即将同段中检索的两个关键词用P隔开。

W:检索的每个单词均已指定顺序,如果前加数字,则代表在两个关键词之间插入0到n个单词(n代表1到99的数字),且检索词的顺序不可颠倒的记录;示例:CLMS:((月桂OR十二OR Lau) (3W)(羟OR hydro*)(3W)(prop# OR丙) 3W(菜碱OR tainel) )。

D:检索包含指定检索词且词序任意的记录,如果前加数字则代表两个关键词之间插入0到n个单词(n代表1到99的数字),且检索词顺序任意的记录;示例:CLMS:((月桂OR十二OR Lau) (3D)(羟OR hydro#)(3D)(prop# OR丙) 3D(菜碱OR tainel) )

“(”和“)”:将括号内的逻辑优先运算;示例:汽车AND(发动机OR引擎)

“"”和“"”:精准的短句检索;不区分大小写和半角全角输入;示例:"electricvehicle"

“[”和“]”: 范围查询时限定分类号的起止范围;示例:IPC:[H01L31/0203 TOH01L31/042]。

“*”: 星号代表0个或者多个数量的字符,可在一个词内任意位置使用;示例:(1)comput*(comput后可有零个或多个数量的字符);(2)com*er(com和er之间可有零个或多个数量的字符)。

“@”:@代表一个字符,可以使用一个或多个@代表检索词中的特定数量的字符;示例:(1)engin@(代表engin后必须有一个字符);(2)en@@ne(代表en和ne之间必须有两个字符)。

“#”: #代表零个或者一个字符,可以使用一个或多个#符代表检索词中的特定数量的字符;示例:(1)colo#r(表示colo和r之间最多相隔一个字符);(2)col##r(表示co和r之间最多相隔两个字符)。

“>”:示例:pd>20190101表示公开(公告)日大于2019年1月1日的;同理“>=”表示大于等于,“<”表示小于,“<=”表示小于等于,“!=”表示不等于。

常用搜索字段还包括:

文本类:

TI:标题、ABS:摘要、TIAB:标题摘要、CLMS:权利要求、DES:说明书、TIABC:标题/摘要/权利要求

分类:

IPC:IPC分类号、GBC4:国民经济行业分类、ESSI:战新分类

公司&人:

AP:原始申请人、APS: [标]原始申请人、ASP:当前权利人、ASPS: [标]当前权利人、IN:发明(设计)人、CR:代理机构

地址:

AP_ADD:申请人地址、AP_PVC:中国申请人省市、PNC:公开国别

号码:

AN:申请号、PN:公开(公告)号、PRN:优先权号

日期:

AD:申请日、PD:公开(公告)日、PRD:优先权日、PCTSD: PCT进入国家阶段日

专利状态:

LSC:当前法律状态、STATUS:专利有效性、LGE:法律事件

法律:

RAED:转让执行日、CTG:引用专利、CITEDBY:被引用专利

S20:基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块。

在本实施例中,专利索引文件记录了各专利文件在专利文件数据库中的存储位置,以便用户从存储专利文件的专利文件数据库中搜索各特定专利文件;专利文件位置信息是指各专利文件在专利文件数据库中存储位置的信息;应用层处理模块是指用于对专利文件进行检索后生成的信息进行处理后以展示在应用层所使用的模块;检索查询语句与专利索引文件内数据所使用的数据格式相同。

具体地,基于检索查询语句,从专利索引文件中确定符合检索查询语句所限定条件的专利文件,并获取这些专利文件在专利文件数据库中的位置为专利文件位置信息,将专利文件位置信息发送至应用层处理模块,便于后续将获取到的专利文件位置信息经过一系列的预处理后展示在应用层,使用户接收到专利检索结果。

其中,专利索引文件的创建方法以及专利索引文件的内容可参照图2,在步骤S20之前,包括:

S21:基于专利文件数据库建立专利索引文件。

具体地,基于专利文件数据库中存储的若干专利文件的属性信息和对应的存储位置信息,生成专利索引文件,便于后续在专利索引文件检索用户所需的专利文件,并获取对应的专利文件位置信息。

进一步地,由于专利文件数据库不断收录新的专利文件,因此,当专利文件数据库中存储的专利文件数量发生变更时,需要同步或定期对专利索引文件进行更新,以便用户能够检索到新收录的专利文件。

S22:创建自定义信息字段,获取用户的自定义条件信息,进行扁平化处理后,添加至自定义信息字段中,所述自定义信息字段存储于专利索引文件中。

在本实施例中,自定义信息字段是指用于存储用户自定义条件信息的字段。

其中,自定义信息字段的创建和更新的方法可参照图3,在步骤S22中,包括:

S221:在专利索引文件中创建自定义信息字段。

具体地,在专利检索文件中创建一个自定义信息字段,从而便于将用户使用过的自定义条件信息存储至自定义信息字段中,便于后续快速调取用户的历史自定义条件信息,以达到提高用户检索效率的效果;在专利索引文件中创建自定义信息字段,便于仅通过单次查询就能够检索到检索信息所对应的专利文件,无需跨库检索,数据库系统无需维护两套语法解析规则,减少了开发工作量与数据库系统的维护成本,从而提高从专利文件数据库中检索专利文件的效率。

S222:当接收到用户的自定义条件信息时,对所述自定义条件信息进行扁平化处理。

具体地,当接收到用户的自定义条件信息时,对接收到的自定义条件信息进行扁平化处理,以便将整个自定义条件信息映射为单个字段;选定数据对象,flattened类型解析出每个子字段值作为keyword类型,数据对象中的内容可以通过单次查询进行搜索或聚集;而在本实施例中,对整个数据对象仅创建一个映射字段,可以有效防止映射有太多的字段,便于减少存储空间占用,降低字段爆炸的可能性。

S223:更新专利索引文件的API接口,将扁平化处理后的自定义条件信息更新至自定义信息字段中。

具体地,对接收到的自定义条件信息进行扁平化处理后,更新专利索引文件的API接口,使专利索引文件的API接口能够接收经扁平化处理后的自定义条件信息,进而将扁平化处理后的自定义条件信息更新至自定义信息字段中,以便后续对用户的历史自定义信息进行快速匹配和调取。

其中,参照图4,在步骤S22之后,包括:

S224:根据预设评估周期评估自定义信息字段的字段数量信息,将所述字段数量信息与文件扩展阈值进行对比。

在本实施例中,字段数量信息是指自定义信息字段中所存储的字段的数量信息;文件扩展阈值是指用于与自定义信息字段的字段数量信息进行比较,以确定是否需要进行水平扩展的阈值。

具体地,当自定义信息字段中的字段数据量过大时,从自定义信息字段中获取特定用户存储的自定义条件信息的效率会受到影响,因此,从检索速度性能上进行考虑,当自定义信息字段的字段数据量过大时,可以进行水平扩展。

具体地,根据自定义字段信息的字段数量增长速率和所能容纳的最大字段数量信息,设置评估周期和文件扩展阈值,便于根据评估周期定期对自定义信息字段进行评估,从而确定对应的字段数量信息;将字段数量信息与预设的文件扩展阈值进行对比。

S225:若字段数量信息大于文件扩展阈值,基于自定义信息字段生成新的索引集群。

具体地,若任一自定义字段信息对应的字段数量信息大于文件扩展阈值,则认为该自定义字段信息中字段的数据量邻近上限,因此,基于该自定义字段信息生成新的索引集群,便于降低单个自定义字段信息的字段数据量,从而提高从自定义信息字段中获取特定用户存储的自定义条件信息的效率。

S23:基于自定义信息字段更新专利索引文件。

具体地,自定义信息字段生成后,不断根据新获取的自定义条件信息进行更新,定期基于更新后的自定义信息字段更新专利索引文件,将自定义信息字段嵌套于专利索引文件中,便于通过单次查询检索到检索信息所对应的专利文件,无需跨库检索;且当用户收录的自定义条件信息数据较多时,性能也优于现有的跨库查询系统。

其中,在步骤S23之后,包括:

S24:分析专利索引文件中各字段的功能,并进行功能类型定义,所述功能类型包括索引字段和非索引字段。

具体地,通过字段分析算法对专利索引文件中的各字段逐一进行分析,以确定各字段的具体功能,从而对各字段进行功能类型定义,便于后续进行区分;在本实施例中功能类型包括索引字段和非索引字段,索引字段是指用于执行专利文件索引工作的字段,非索引字段是指其他不用于执行专利文件索引工作的字段。

S25:将非索引字段添加至其他字段文件中,并将非索引字段从专利索引文件中删除。

具体地,将各非索引字段添加至其他字段文件中进行安置,在本实施例中,其他字段文件可以是新建的专门用于存储非索引字段的字段文件,也可以是现有的字段文件;将安置完成的非索引字段从专利索引文件中删除,以便对不同类型的字段数据进行分类存放,同时便于减少专利索引文件的数据量,降低存储负担。

其中,参照图5,在步骤S20中,包括:

S26:基于检索查询语句作为关键词,通过文本匹配算法对专利索引文件进行匹配,从而确定专利文件的存储位置。

具体地,根据检索查询语句生成关键词,便于后续查询用户所需的专利文件;基于生成的关键词通过文本匹配算法对专利索引文件进行匹配,具体是从专利索引文件中匹配符合关键词的专利文件的存储位置信息,以从专利索引文件中确定用户所需检索的专利文件在专利文件数据库中的存储位置。

S27:基于专利文件的存储位置查询专利文件数据库,生成专利文件位置信息,获取对应的属性信息。

具体地,基于专利文件的存储位置查询专利文件数据库,以对匹配到的专利文件的存储位置信息进行验证,判断该存储位置信息是否有用户所需检索的专利文件,若有,则验证成功,若无,则验证失败,基于验证成功的存储位置信息生成专利文件位置信息,基于每一专利文件位置信息获取对应专利文件的属性信息,便于后续将专利文件的属性信息进行展示,以便用户查看专利文件的基本信息,快速判断是否为所需的专利文件。

S28:将专利文件位置信息和对应的属性信息发送至应用层处理模块。

具体地,将专利文件位置信息和对应的属性信息发送至应用层处理模块,便于后续将专利文件位置信息和对应专利文件的属性信息进行处理后一并向用户展示。

S30:通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端。

具体地,获取到专利文件位置信息后,再进一步获取各专利文件对应的属性信息,其中属性信息包括专利文件标题、著录信息等,通过应用层处理模块对用户所需专利文件对应的专利文件位置信息、属性信息进行结合,并以特定的排序规则进行排序后,生成检索结果展示信息,将检索结果展示信息发送至用户端,便于用户查看专利检索结果。

进一步地,检索结果展示信息中的每一条专利信息以超链接的形式连接专利文件原文,便于提高检索结果展示信息的生成效率,降低网页延迟、减少计算机和网络资源的消化。

其中,参照图6,在步骤S30中,包括:

S31:基于专利文件位置信息生成对应的超链接。

具体地,基于专利文件位置信息生成对应的超链接,便于后续用户在应用层通过超链接的形式阅读专利文件,降低从专利文件数据库中获取完整的数量众多的专利文件并上传至应用层时所需消耗的计算机资源和网络资源,便于提高检索结果生成效率。

S32:将专利文件的属性信息填入对应的预设展示模板中,所述属性信息包括专利标题和著录信息,将所述超链接与专利标题关联。

具体地,将检索到的各专利文件的属性信息逐一填充入预设的展示模板中;其中,属性信息包括专利标题和著录信息,便于后续用户通过专利标题和著录信息判断各专利文件是否为自己感兴趣的专利文件,以便提高用户的专利检索效率;将专利文件的超链接与专利标题关联,便于后续用户通过点击专利标题连接至完整的专利文件以进行查阅。

S33:基于预设的展示顺序规则信息将填充后的展示模板进行排序,生成检索结果展示信息。

具体地,根据用户选择或专利检索网站的默认显示规则确定展示顺序规则信息,便于在需要对专利检索结果进行展示时,基于预设的展示顺序规则信息将填充后的展示模板进行排序,从而生成检索结果展示信息,便于后续根据预设的展示顺序规则信息对检索结果的多个专利文件进行展示。

应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

实施例二

如图7所示,本申请公开了一种专利文件空间索引实现系统,用于执行上述专利文件空间索引实现方法的步骤,该专利文件空间索引实现系统与上述实施例中专利文件空间索引实现方法相对应。

专利文件空间索引实现系统包括检索信息解析模块、专利文件索引模块和应用层展示模块。各功能模块的详细说明如下:

检索信息解析模块,用于获取用户输入的检索信息,通过语法解析引擎对所述检索信息进行解析,生成检索查询语句,所述检索信息包括检索式信息和自定义条件信息;

专利文件索引模块,用于基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块;

应用层展示模块,用于通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端。

其中,专利文件索引模块包括:

专利索引文件建立子模块,用于基于专利文件数据库建立专利索引文件;

自定义信息字段创建子模块,用于创建自定义信息字段,获取用户的自定义条件信息,进行扁平化处理后,添加至自定义信息字段中,所述自定义信息字段存储于专利索引文件中;

专利索引文件更新子模块,用于基于自定义信息字段更新专利索引文件;

字段功能类型定义子模块,用于分析专利索引文件中各字段的功能,并进行功能类型定义,所述功能类型包括索引字段和非索引字段;

非索引字段清理子模块,用于将非索引字段添加至其他字段文件中,并将非索引字段从专利索引文件中删除;

专利文件存储位置匹配子模块,用于基于检索查询语句作为关键词,通过文本匹配算法对专利索引文件进行匹配,从而确定专利文件的存储位置;

专利文件位置信息生成子模块,用于基于专利文件的存储位置查询专利文件数据库,生成专利文件位置信息,获取对应的属性信息;

应用层处理子模块,用于将专利文件位置信息和对应的属性信息发送至应用层处理模块。

其中,自定义信息字段创建子模块包括:

自定义信息字段生成子模块,用于在专利索引文件中创建自定义信息字段;

字段扁平化处理子模块,用于当接收到用户的自定义条件信息时,对所述自定义条件信息进行扁平化处理;

自定义信息字段更新子模块,用于更新专利索引文件的API接口,将扁平化处理后的自定义条件信息更新至自定义信息字段中;

字段数量信息评估子模块,用于根据预设评估周期评估自定义信息字段的字段数量信息,将所述字段数量信息与文件扩展阈值进行对比;

索引扩展子模块,用于若字段数量信息大于文件扩展阈值,基于自定义信息字段生成新的索引集群。

其中,应用层展示模块包括:

超链接生成子模块,用于基于专利文件位置信息生成对应的超链接;

展示模板填充子模块,用于将专利文件的属性信息填入对应的预设展示模板中,所述属性信息包括专利标题和著录信息,将所述超链接与专利标题关联;

检索结果展示子模块,用于基于预设的展示顺序规则信息将填充后的展示模板进行排序,生成检索结果展示信息。

关于专利文件空间索引实现系统的具体限定可以参见上文中对于专利文件空间索引实现方法的限定,在此不再赘述;上述专利文件空间索引实现系统中的各个模块可全部或部分通过软件、硬件及其组合来实现;上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以是以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

实施例三

一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储检索信息、语法解析引擎、检索查询语句、专利索引文件、专利文件数据库、专利文件位置信息和检索结果展示信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现专利文件空间索引实现方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

S10:获取用户输入的检索信息,通过语法解析引擎对所述检索信息进行解析,生成检索查询语句,所述检索信息包括检索式信息和自定义条件信息;

S20:基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块;

S30:通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

S10:获取用户输入的检索信息,通过语法解析引擎对所述检索信息进行解析,生成检索查询语句,所述检索信息包括检索式信息和自定义条件信息;

S20:基于检索查询语句和专利索引文件,查询专利文件数据库,将查询到的专利文件位置信息发送至应用层处理模块;

S30:通过应用层处理模块对专利文件位置信息和对应的属性信息生成检索结果展示信息并发送至用户端。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)、DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

技术分类

06120115758650