掌桥专利:专业的专利平台
掌桥专利
首页

用于与遗传资源相关的申报的方法、装置、设备和介质

文献发布时间:2023-06-19 09:35:27


用于与遗传资源相关的申报的方法、装置、设备和介质

技术领域

本公开的实施例涉及遗传资源管理领域,并且更具体地,涉及用于与遗传资源相关的申报的方法、装置、设备和计算机存储介质。

背景技术

人类遗传资源不仅是开展人类基因组生物多样性、了解人类的起源和进化的基础材料,也是研究人类遗传性疾病和许多重大疾病的物质基础。正是由于人类遗传资源的重要性,各个国家对于本国人类遗传资源的处理都有相关的规定。例如,中国于2019年7月1日实施了《中华人民共和国人类遗传资源管理条例》,对与中国人类遗传资源相关的采集,保藏,利用,对外提供行为进行了规定。此外,一些不同的国家可能还对于其他类型遗传资源(例如,动物遗传资源和植物遗传资源等)的利用进行了规定。

通常,科研机构,高等学校,医疗机构或者企业在申请利用遗传资源(例如,人类遗传资源)来进行合作科学研究时,都需要向遗传资源管理机构(例如,中国科学技术部人类遗传资源管理办公室)递交申报文档,并只有在审批通过后,才能够执行相关的遗传资源研究。然而,这样的申报文档通常涉及众多内容,这导致科研机构,高等学校,医疗机构或者企业需要耗费大量的人力和时间成本来准备这样的申报文档。

发明内容

本公开的实施例提供一种用于与遗传资源相关的申报的方案。

根据本公开的第一方面,提出了一种用于与遗传资源相关的申报的方法。该方法包括:响应于针对遗传资源执行目标处理的申报请求,确定与申报请求相对应的申报模板,申报模板包括待填写项;基于与申报请求相关联的信息集以及与待填写项对应的内容获取策略,来生成针对待填写项的参考内容,信息集包括关于与目标处理相关联的属性的信息;以及基于参考内容,生成针对申报请求的申报文档。

根据本公开的第二方面,提出了一种用于与遗传资源相关的申报的装置。该装置包括:申报模板确定模块,被配置为响应于针对遗传资源执行目标处理的申报请求,确定与申报请求相对应的申报模板,申报模板包括待填写项;参考内容生成模块,被配置为基于与申报请求相关联的信息集以及与待填写项对应的内容获取策略,来生成针对待填写项的参考内容,信息集包括关于与目标处理相关联的属性的信息;以及申报文档生成模块,被配置为基于参考内容,生成针对申报请求的申报文档。

根据本公开的第三方面,提供了一种电子设备,包括:存储器和处理器;其中存储器用于存储一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据本公开的第一方面的方法。

根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行实现根据本公开的第一方面的方法。

提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。

图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;

图2图示了根据本公开实施例的用于与遗传资源相关的申报的过程的流程图;

图3图示了根据本公开实施例的示例申报模板的示意图;

图4图示了根据本公开实施例的示例信息集的示意图;

图5图示了根据本公开实施例的生成参考内容的示例过程的流程图;

图6图示了根据本公开实施例的构建信息集的示例过程的流程图;

图7图示了根据本公开实施例的示例源文件的示意图;

图8图示了根据本公开实施例的生成申报文档的示例过程的流程图;

图9图示了根据本公开的一些实施例的用于与遗传资源相关的装置的示意性结构框图;以及

图10图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

如上文所讨论的,对于科研机构,高等学校,医疗机构或者企业而言,准备与人类遗传资源有关的申报文档通常需要耗费大量的人力和时间。此外,准备这样的申报文档可能还会涉及准备大量的其他文件以及将其他文件的信息填入到申报文档中。例如,科研机构,高等学校,医疗机构/企业可能需要准备临床研究方案以作为附件,并在准备最终的申报文档的过程中需要与该附件中的信息保持一致。这进一步加大了科研机构/企业所需要投入的时间。

根据本公开的实施例,提供了一种用于与遗传资源相关的申报的方案。在该方案中,首先,可以确定与申报请求相对应的申报模板,该申报请求可以是与遗传资源执行目标处理相关。然后,可以根据与申报请求相关联的信息集以及与申报模板中的待填写项对应的内容获取策略,来生成针对该待填写项的参考内容。随后,可以基于所生成的参考内容来自动地生成针对申报请求的申报文档。通过这样的方式,本公开的实施例可以自动地获取申报请求所对应的申报模板中需要填写的信息,进而自动地完成申报文档的生成。这进而能够极大地提高申报文档的生成效率,降低申报方(例如,科研机构,高等学校,医疗机构/企业)所需要耗费的人力成本和时间成本。

为了方便描述,下文中以人类遗传资源作为示例来描述申请。应当理解的是,根据不同区域关于遗传资源的不同规定,关于其他类型的遗传资源(例如,动物遗传资源或者植物遗传资源)的处理可能也需要收到管理或约束。

首先参见图1,其示意性示出了其中可以使用根据本公开的示例性实现方式的环境100的示意图。如图1所示,环境100中包括计算设备,其被配置为根据本公开所描述的过程来自动地生成申报文档150。

在一种示例场景中,计算设备120例如可以从用户接收针对遗传资源执行目标处理的申报请求。例如,用户可以通过在所呈现的图形用户界面(GUI)的操作来向计算设备120发送申报请求,该申报请求例如可以指定针对遗传资源的特定处理。

例如,用户可以在与计算设备120耦合的终端设备(例如,个人计算机)选择本次申报所涉及的针对遗传资源所执行处理的类型,以使得该终端设备能够向计算设备120(例如,服务器设备)发送申报请求。应当理解,用户也可以利用输入设备以直接与计算设备120进行交互,以生成该申报请求。

在另一种示例场景中,申报请求也可以是由计算设备120或者与计算设备120耦合的其他设备(例如,终端设备)所自动生成地。例如,计算设备120可以定期地生成申报请求,以根据已有的文件自动地创建申报文档。或者,计算设备120可以检查申报所需文件的完整性,并在确定所需要文件已经完整时,自动地生成申报请求以创建申报文档。

应当理解,本文中的“申报请求”旨在用于触发计算设备120创建申报文档150。根据实现的需要,任何适当类型的信号、消息或指令等都可以用作“申报请求”。

在一些实现中,该申报请求可以指示科研机构,高等学校,医疗机构/企业向遗传资源管理机构申请对遗传资源执行特定类型的处理。例如,该处理可以包括采集遗传资源、保藏遗传资源、利用遗传资源、或者对外提供遗传资源等。

在确定申报请求后,计算设备120可以确定与该申报请求所对应的申报模板。示例性地,如图1所示,计算设备120例如可以从多个候选模板110中确定与该申报请求所对应的申报模板。这样的候选模板110例如可以被存储在于计算设备120相耦合的存储设备中。关于申报模板的确定过程将在下文中结合图2详细描述,在此暂不详叙。

如图1所示,计算设备120还可以获取信息集130。信息集130可以包括关于与针对遗传资源的目标处理相关联的属性的信息。示例性地,信息集130例如可以被存储在于计算设备120相耦合的存储设备中。

在一些实现中,信息集130例如可以维护关于请求审批的该目标处理(例如,遗传资源的对外提供)的属性的不同信息,例如该对外提供项目的项目编号、项目标题、合作方等等。信息集130例如可以被组织为一个或多个数据表,以使得计算设备120能够通过特定的字段来获取特定属性的值。

在一些实现中,信息集130例如还可以是根据上传的相关文件160(下文中也称为“源文件”)所自动创建的。信息集130的示例创建过程例如可以参考下文中关于图6所描述的内容。

如图1所示,计算设备120可以基于所确定的申报模板和信息集130来生成自动地生成申报文档150。例如,计算设备120可以利用信息集130中的一项或多项信息来填充申报模板中的待填写项,以获得最终的申报文档。

在一种示例场景中,计算设备120例如可以先向用户提供利用信息集中的信息填充后的申报模板。用户可以对该申报模板进行进一步编辑,以使得计算设备120能够根据用户编辑后的申报模板来生成最终的申报文档150。

在一些实现中,所生成的申报文档150例如可以被递送至遗传资源管理机构,以完成申报。关于申报文档150生成的具体过程将在下文中参考图2至图8详细地描述。

下文将参考图2至图8来描述根据本公开实施例的用于与遗传资源有关的申报的过程。图2示出了根据本公开的一些实施例的用于与遗传资源有关的申报的过程200的流程图。过程200例如可以由图1中所示的计算设备120来实现,也可以由其他任何适当的电子设备来实现。

如图2所示,在框202,响应于针对遗传资源执行目标处理的申报请求,计算设备120确定与申报请求相对应的申报模板。申报模板例如可以包括固定内容以及待填写的内容(也称为“待填写项”)。申报模板中可以包括一个待填写项,也可以包括多个待填写项,本公开的实施例对于待填写项的数目没有任何限制。

如上文所讨论的,计算设备120可以响应于从用户接收的申报请求来确定申报模板。或者,计算设备120也可以响应于计算设备120或者另一计算设备生成的指示来自动地确定申报模板,而无需用户的额外动作。

在一些实现中,申报模板例如可以对应于遗传资源管理机构关于遗传资源的该类型的处理的申报要求。例如,中国科学技术部发布了与针对遗传资源的不同处理所对应的不同申报要求,例如《中国人类遗传资源国际合作科学研究审批行政许可事项服务指南》和《中国人类遗传资源采集审批行政许可事项服务指南》。

在一些实现中,申报模板可以是根据该申报请求对应的申报要求所确定的。例如,计算设备120可以提取申报要求中的审批申请书部分,并将其转换为与该申报请求所对应的申报模板。

在一些实现中,申报模板还可以是从多个预定义的候选模板中确定的。如参考图1所描述的,计算设备120可以从多个候选模板110中确定与申报请求对应的申报模板。在一些实现中,多个候选模板可以是基于遗传资源管理机构所发布的、与针对遗传资源的不同类型的处理相对应的申报要求而确定。例如,计算设备120可以将由遗传资源管理机构发布的不同申报要求转换为对应的候选模板,计算设备120可以根据申报请求所对应的遗传资源处理的类型,来从多个候选模板110中确定申报模板。

如上所述,申报模板可以包括固定内容以及一个或多个待填写项。图3示出了根据本公开实施例的示例申报模板300的示意图。

如图3所示,申报模板300可以包括固定内容320和多项待填写项310-1至310-5(单独或统一称为待填写项310)。

固定内容320例如可以包括用于描述待填写项的文本或表格。例如,固定内容“项目编号”是用于描述待填写项310-1所需要填入信息的文本。在一些实现中,固定内容320将直接被转换到最终的申报文档150中。

如图3所示,待填写项310可以是申报模板中需要填入的、用于描述本次申报请求的信息的部分。例如,待填写项310可以包括待勾选的选项、待输入的文本或待上传的内容等。。

应当理解,仅是出于方便描述的目的,申报模板300在图3中被示出为用户可见的形式。在一些其他实现中,申报模板300也可以体现为一段描述代码,而不具备对应的图形可视化形式。此外,应当理解,图3中所示的申报模板300中的待填写项310中所填入的内容仅是示意性的,向用户呈现的申报模板300中的一个或多个待填写项310可以是空白的。

继续参考图2,在框204,计算设备120基于与申报请求相关联的信息集130以及与待填写项对应的内容获取策略,来生成针对待填写项的参考内容,其中信息集130包括关于与目标处理相关联的属性的信息。

在一些实现中,可以为申报模板中的待填写项配置对应的内容获取策略。这样的内容获取策略例如可以与对应的候选模板相关联地存储。

在一些实现中,内容获取策略可以指示与待填写项所对应的内容模板,其中内容模板包括固定部分和可替换部分。以图3作为示例,待填写项310-5所对应的内容模板例如可以表示为:“{项目编号}研究是一项由A公司发起的{项目标题},将在大约{国家数目}个国家招募{患者数目}例患者。”

在该内容模板的示例中,{项目编号}、{项目标题}、{国家数目}和{患者数目}等表示该内容模板中的可替换部分,其余文本部分为固定部分。应当理解,这样的内容模板的形式仅是示意性的,不旨在作为对本公开的限制。

在一些实现中,内容模板中的可替换部分可以被配置具有相应的内容获取途径。示例性地,可替换部分{项目编号}对应的内容获取途径例如指示计算设备120获取待填写项310-1中被填写的内容,以作为该可替换部分的内容。

作为另一示例,可替换部分{项目标题}对应的内容获取途径例如可以指示计算设备120从信息集130中获取对应的内容。图4示出了根据本公开实施例的示例信息集400。

如图4所示,信息集400例如可以包括按不同字段(属性410、内容420、文件430、页面440等)来组织的多个条目450、460和470。每个条目例如可以对应于与遗传资源的目标处理相关联的属性。例如,条目450可以对应于属性“方案编号”,条目460对应于属性“标题”,条目470对应于“临床试验类型”等。

相应地,信息集130中每个字段所对应的取值可以包括与该属性相关联的内容。例如,条目450中与字段“内容”420所对应的内容指示关于属性“方案编号”的信息为“X0001”。此外,文件430和页码440的值可以表示内容420的来源。应当理解,虽然信息集400中的取值的示例均是文本格式,但是其他类型的取值也是可能的,包括但不限于:图片、表格、视频或音频等。

此外,当取值为空(或者NULL)时,则表示信息集中不包括关于该属性的信息。例如,信息集400中不包括关于属性“临床试验类型”的信息。

在一些实现中,信息集130可以包括共享信息,其中共享信息对于多个申报请求或者包含多个申报请求的多个项目是共用的。示例性地,这样的共享信息例如可以是一些通用的信息。例如,诸如,在该信息集130是用于单一申请主体的不同遗传资源申报时,这样的信息集例如可以包括该申请主体的各项信息,例如,名称、地址和商标能够被不同申报请求或者不同项目复用。

在一些实现中,信息集130还可以包括专用信息,其中专用信息特定于申报请求或者特定于申报请求所属的项目。这样的专用信息例如可以包括本次申报请求的特定合作方、项目编号、项目标题和临床试验类型等等。不同的申报请求或者不同的申报请求组可能具有不同的专用信息。

以下将参考图5来描述根据信息集和内容获取途径来生成参考内容的示例过程204的示意图。如图5所示,在框502,计算设备120可以在信息集130中查找与可替换部分对应的目标信息。

以内容模板“{项目编号}研究是一项由A公司发起的{项目标题},将在大约{国家数目}个国家招募{患者数目}例患者。”作为示例,计算设备120可以从信息集130(例如,示例信息集400)中查找与可替换部分{项目标题}所对应的目标信息。具体地,计算设备120例如在信息集中查找是否存在属性410的取值为“标题”的条目,以及该条目中的内容字段是否为空。

在框504,计算设备120可以确定信息集130中是否包括目标信息。如果确定信息集130中包括目标信息,则过程204可以进行到框506。在框506,计算设备120可以基于固定部分和目标信息来生成参考内容。

继续之前的示例,计算设备120例如可以在信息集400中确定存在属性410的取值为“标题”的条目460并且该条目460中的内容字段的取值不为空。相应地,计算设备120例如可以利用该内容字段中的取值来替换内容模板中的可替换部分{项目标题},从而生成参考内容:

“{项目编号}研究是一项由A公司发起的

此外,上文所讨论的,计算设备120例如还可以用待填写字段310-1中被填入的内容替换内容模板中的可替换部分{项目编号},从而生成参考内容340:

继续参考图5,如果在框504确定信息集130中不包括目标信息,则过程204可以进行到框508。在框508,计算设备120可以基于固定部分来生成参考内容。

以上文所提及的示例内容模板中的可替换部分{国家数目}作为示例,如果计算设备120确定信息集400中不包括与属性“国家数目”对应的条目,或者该对应条目中的内容字段为空,则计算设备120可以确定无法从信息集400中获取用于替换该可替换部分{国家数目}的内容。

在一些实施例中,计算设备120例如可以在所生成的参考文本中呈现与该可替换部分对应的文本,以指示计算设备120未能自动地填写该替换部分,而需要用户手动地进行修订。

示例性地,在可替换部分{国家数目}和{患者数目}未被自动填入的情况下,辅助内容340例如可以表示为:“

在一些实现中,上文所讨论的内容模板可以是基于针对历史申报请求的历史申报文档而生成的,这些历史申报请求针对遗传资源执行与目标处理的类型相同的处理。

示例性地,计算设备120可以获取多个历史申报文档,这些历史申报文档可以与相同类型的遗传资源处理相关联。随后,计算设备120例如可以基于这些历史申报文档中与待填写项对应的内容来确定与该待填写项对应的内容模板。

示例性地,计算设备120例如可以基于多个历史申报文档中的对应内容来抽取对应的文本模式,从而生成内容模板。应当理解,计算设备120可以采用任何适当的技术(包括但不限于规则提取、机器学习等)来基于多个历史申报文档来生成内容模板,本公开不旨在对此进行限定。应当理解,内容模板的生成也可以由于计算设备120不同的其他设备来执行。

在一些实现中,不同于指示与待填写项相关联的内容模板不同,内容获取策略还可以指示与待填写项所对应的目标属性。继续图3的示例,与待填写项310-4所对应的内容获取策略可以指示从信息集130中获取目标属性“方案编号”所对应的信息。

相应地,计算设备120可以根据该内容获取策略而从信息集400中获取与目标属性“方案编号”相对应的信息为“X0001”。随后,计算设备120可以基于“X0001”来生成对应的参考内容330。

应当理解,虽然上文以文本作为示例描述了参考内容的生成,但是与信息集中对应的信息的格式对应地,参考内容可以包括任何适当格式的内容:文本、图片、表格、视频或音频等。

继续参考图2,在框206,计算设备120基于参考内容生成针对申报请求的申报文档150。

在一些实现中,计算设备120可以自动地利用参考内容来生成申报文档150。具体地,计算设备120可以将参考内容填充到申报模板中的待填写项,并基于经填充的申报模板来生成申报文档150。

示例性地,计算设备120例如可以将参考内容330填充到待填写项310-4,并且将参考内容340填充到待填写项310-5,以获得申报文档150。应当理解,计算设备120可以向用户提供申报文档150,并指示申报文档150中的至少部分信息需要被修订。

在另一些实现中,计算设备120也可以将参考内容提供至用户,并根据用户基于该参考内容的更新或确认来生成申报文档150。以下将参考图6来描述根据本公开的一些实现的生成设备文档的示例过程。

如图6所示,在框602,计算设备120可以将参考内容与待填写项相关联地提供。

在一些实现中,计算设备120例如可以向用户呈现申报模板,并在待填写项中自动填入所生成的参考内容。以图3作为示例,计算设备120可以将参考内容330自动填入到待填写项310-4中,并将参考内容340自动填入到待填写项310-5中。在又一些实现中,计算设备120也可以在待填写项外来提供参考内容,以作为用户填写待填写项的参考。基于这样的方式,可以为用户输入待填写项提供有效的参考,从而减轻用户的负担,协助用户完成高质量的申报。

在一些实现中,计算设备120还可以将辅助内容与参考内容相关联地提供,其中辅助内容是基于来自遗传资源管理机构的审查结果所生成的。这样的审查结果例如可以是与针对历史申报请求的历史申报文档相关联。这些历史申报请求可以用于向遗传资源管理机构申请针对遗传资源执行与目标处理的类型相同的处理。例如,这些历史申报请求可以同样是申请采集遗传资源的请求。

示例性地,计算设备120可以获取遗传资源管理机构对于利用相同申报模板所生成的历史申报文档的审核结果,并基于审核结果中与待填写项对应的部分来确定辅助内容。例如,这样的辅助内容可以指示被自动填入的参考内容或者用户填入的内容在内容方面或者格式方面的可能缺陷。通过这样的方式,可以帮助用户有效地了解参考内容可能存在的缺陷,从而使得用户能够提前克服这样的缺陷,提高申报文档的通过率。

继续参考图6,在框604,计算设备120可以接收针对待填写项的更新内容,其中更新内容是基于参考内容而生成的。对于计算设备120将参考内容填入到待填写项中的示例,计算设备120例如可以接收用户对于待填写项中所填入内容的修订,并将修订后的内容确定为更新内容。这样的修订的示例包括但不限于:输入新的内容、删除已有的内容、调整内容的表述、或者修改内容的格式等。

对于计算设备120在待填写项外提供参考内容的示例,计算设备120可以接收用户基于参考内容而在待填写项中输入的内容,以作为更新内容。

在框606,计算设备120可以利用申报模板和更新内容来生成申报文档150。具体地,计算设备120可以将更新内容填充到申报模板中的待填写项,并基于经填充的申报模板来生成申报文档150。

在一些实现中,这些更新内容也可以被用于优化与待填写项相关联的内容获取策略。例如,计算设备120可以基于用户对于参考内容的删减或调整来修改内容模板的固定部分。应当理解,计算设备120可以通过诸如机器学习或者基于规则的调整来根据更新内容来优化内容获取策略。

在一些实现中,在生成申报文档150前,计算设备120还可以根据申报模板中不同待填写项之间的关联性来对所填入的内容进行自动地校验。例如,计算设备120可以确定在不同待填写项中关于同一属性的信息是否一致,逻辑是否合理。在一些实现中,计算设备120可以在确定信息不一致的情况下,暂停申报文档150的生成,并向用户提供需要修改特定待填写项的提醒。

基于上文所讨论的方法,本公开的实施例可以自动地获取申报请求所对应的申报模板中需要填写的信息,进而自动地完成申报文档的生成。这进而能够极大地提高申报文档的生成效率,降低申报方(例如,科研机构,高等学校,医疗机构/企业)所需要耗费的人力成本和时间成本。此外,这样的方式还能够避免人工填写过程中可能造成的错误,从而提高申报文档审核通过的概率。

在一些实现中,计算设备120还可以根据遗传资源管理机构对于申报文档150的审核结果来调整内容获取策略。具体地,在申报文档150由于某些缺陷未能通过审核时,计算设备120例如可以获取遗传资源管理机构关于申报文档150的审核结果,并基于审核结果中与待填写项相关联的部分,来调整内容获取策略,适应中国人类遗传资源管理不断细化的要求。

例如,如果审核结果中指示申报文档150是由于项目摘要中缺少与“项目依据”有关的内容,而导致申报文档150未能通过审核。此时,计算设备120可以根据该审核结果来调整与项目摘要所对应的待填写项(例如,图3中的待填写项310-5)所对应的内容获取策略。例如,计算设备120可以调整该内容获取策略所指示的内容模板,以增加与“项目依据”有关的内容。基于这样的方式,本公开的实施例还能够基于审核结果来动态地优化内容获取策略,从而提高申报文档的审核通过概率。

以下将参考图7至图8来描述信息集的创建过程。图7示出了根据本公开实施例的创建信息集的示例过程700的示意图。如图7所示,在框702,计算设备120可以获取与申报请求相关联的源文件。在一些实现中,计算设备120可以为该申报请求或者该申报请求所述的项目下的用户提供上传源文件的接口。这样的源文件可以用于申请针对遗传资源的目标处理所需要的临床研究方案、法人资格材料、伦理审查批件等等。应当理解,不同类型的遗传资源处理可能需要不同类型的源文件。

图8示出了根据本公开的实施例的示例源文件800的示意图。该源文件800例如是提交申报所需要的临床研究方案。在一些实现中,源文件800可能包括不同格式的文件。在一些示例中,源文件800例如可以是由用户上传的文本格式文件,例如Word格式文件。在另一些示例中,源文件800例如可以包括PDF格式的文件。在有一些示例中,源文件800例如可以包括图片格式的文件等。

在一些实现中,在接收这些源文件后,计算设备120可以为这些源文件分配对应的标识,以指示该源文件所对应的内容。例如,计算设备120可以为临床研究方案800分配文件名“FILE1”。

备选地或附加地,用户也可以在上传这些源文件时,添加关于源文件的描述。这样的描述例如可以指示该源文件所对应的内容,并被用作与该源文件对应的标识。例如,用户可以在上传临床研究方案800时添加描述“FILE1”。或者,用户也可以在上传临床研究方案时从多个选项中选择该源文件的描述为“临床研究方案”,以使得计算设备120能够基于该描述来自动地确定对应的标识。

继续参考图7,在框704,计算设备120可以从源文件中确定关于与目标处理相关联的属性的信息。在一些实现中,计算设备120还维护特定属性与源文件之间的对应关系。例如,计算设备120可以通过对应关系确定应当从标识为“FILE1”的源文件(例如,临床研究方案)中获取与属性“方案编号”和“标题”所对应的信息。

在一些实现中,计算设备120可以基于该对应关系从上传的多个源文件中确定与这些属性所对应的源文件。在确定所对应的源文件后,计算设备120可以利用适当的方法以从源文件中获取与关于该属性的信息。

示例性地,对于上传的源文件为文本格式的示例,计算设备120例如可以通过基于正则表达式的文本匹配来获取与关于特定属性的信息。例如,计算设备120可以根据正则表达式“编号:(.*?)1.”来获取与关于属性“方案编号”的信息,其中该正则表达式限定了被起始文字“编号:”和结束文字“1.”中所包括的部分。

对于图8的示例,计算设备120例如可以从源文件800中确定与该正则表达式匹配的部分810,并基于该部分810确定关于属性“方案编号”的信息为“X0001”。

应当理解,计算设备120例如还可以通过机器学习或者知识图谱等任何适当的方式来从源文件来获取关于特定属性的信息。例如,计算设备120可以基于源文件800中大部分820来构建知识图谱来指示“研究方案标题”与“一项评价B药物安全性多中心、随机、剂量探索II期研究”之间的关系,并基于该关系确定关于属性“标题”的信息为“一项评价B药物安全性多中心、随机、剂量探索II期研究”。

在另一些示例中,用户上传的源文件可能是非文本格式。在一些实现中,计算设备120可以首先将这些非文本格式转换为文本格式,再基于类似的方法来获取关于特定属性的信息。

在另一些实现中,计算设备120例如也可以直接将非文本格式的源文件中的一部分直接确定作为关于特定属性的信息,而不进行文本的转换。示例性地,计算设备120例如将所上传的图片格式的源文件(例如,公司营业执照)的部分图片确定为关于属性“公司商标”的信息。

应当理解,以上从源文件中获取关于特定属性的信息的方式只是示例性地,还可以采用任何其他适当的方式来获取这些信息。此外,这些信息可以包括任何适当的类型,例如,文本格式、图片格式和表格格式等。

在框706,计算设备120可以将确定的信息存储在信息集中。在一些示例中,计算设备120例如可以从源文件中所确定的信息存储到信息集中以作为与特定属性所对应的条目中的“内容”字段的取值。

基于这样的方式,本公开的实施例能够自动地将来自不同源文件的内容组织为生成申报文档可用的信息,从而极大地提高了生成申报文档的效率。

在一些实现中,在向用户提供参考内容的示例中,如果参考内容中包括从目标源文件中确定的信息,计算设备120还可以将目标源文件的至少部分与参考内容相关联地提供。例如,计算设备120可以在参考内容的位置附近提供关于目标源文件的预览。

例如,以图3作为示例,当辅助内容340例如包括从源文件800中所确定的信息时,计算设备120例如可以与参考内容对比地呈现源文件800的相应部分。例如,计算设备120可以基于在信息集400中添加与属性“标题”所对应的条目所使用的源文件800的位置信息(例如,字段(页码440)的取值)来显示源文件800的第一页。

通过将参考内容以及目标源文件关联地提供,这能够帮助用户核查被自动填充到参考内容中的信息是否与目标源文件一致,从而避免信息自动抓取过程中可能产生的错误。

本公开的实施例还提供了参考图2至图8所讨论的方法和/或过程的相应装置。图9示出了根据本公开的一些实施例的用于与遗传资源有关的申报的装置900的示意性结构框图。

如图9所示,装置900可以包括:申报模板确定模块910,其被配置为响应于针对遗传资源执行目标处理的申报请求来确定与申报请求相对应的申报模板,其中申报模板包括待填写项。装置900还包括参考内容生成模块920,其被配置为基于与申报请求相关联的信息集以及与待填写项对应的内容获取策略,来生成针对待填写项的参考内容,信息集包括关于与目标处理相关联的属性的信息。此外,装置900还包括申报文档生成模块930,被配置为基于参考内容,生成针对申报请求的申报文档。

在一些实现中,内容获取策略指示与待填写项所对应的内容模板,并且内容模板包括固定部分和可替换部分。此外,参考内容生成模块包括920:查找模块,被配置为在信息集中查找与可替换部分对应的目标信息;以及第一生成模块,被配置为如果信息集中包括目标信息,则基于固定部分和目标信息来生成参考内容。

在一些实现中,参考内容生成模块920还包括:第二生成模块,被配置为如果信息集中不包括目标信息,则基于固定部分来生成参考内容。

在一些实现中,内容模板是基于针对历史申报请求的历史申报文档而生成的,历史申报请求针对遗传资源执行与目标处理的类型相同的处理。

在一些实现中,内容获取策略指示与待填写项所对应的目标属性,并且其中参考内容生成模块920包括:信息获取模块,被配置为从信息集中获取与目标属性相对应的信息;以及第三生成模块,被配置为基于获取的信息来生成参考内容。

在一些实现中,申报文档生成模块930包括:填充模块,被配置为将参考内容填充到申报模板中的待填写项;以及第四生成模块,被配置为基于经填充的申报模板来生成申报文档。

在一些实现中,申报文档模块930包括:第一提供模块,被配置为将参考内容与待填写项相关联地提供;接收模块,被配置为接收针对待填写项的更新内容,更新内容是基于参考内容而生成的;以及第五生成模块,被配置为利用申报模板和更新内容来生成申报文档。

在一些实现中,装置900还包括:第二提供模块,被配置为将辅助内容与参考内容相关联地提供,辅助内容是基于遗传资源管理机构对针对历史申报请求的历史申报文档的审核结果而生成的,历史申报请求针对遗传资源执行与目标处理的类型相同的处理。

在一些实现中,信息集至少包括:共享信息,共享信息对于多个申报请求或者包含多个申报请求的多个项目是共用的,或者专用信息,专用信息特定于申报请求或者特定于申报请求所属的项目。

在一些实现中,装置900还包括:源文件获取模块,被配置为获取与申报请求相关联的源文件;信息确定模块,被配置为从源文件中确定关于与目标处理相关联的属性的信息;以及信息存储模块,被配置为将确定的信息存储在信息集中。

在一些实现中,装置900还包括:第三提供模块,被配置为如果参考内容中包括确定的信息,则至少将目标源文件的部分与参考内容相关联地提供。

在一些实现中,装置900还包括:结果获取模块,被配置为获取遗传资源管理机构关于申报文档的审核结果;以及调整模块,被配置为基于审核结果中与待填写项相关联的部分,来调整内容获取策略。

在一些实现中,目标处理包括以下中的至少一项:采集遗传资源,保藏遗传资源,利用遗传资源,以及对外提供遗传资源。

在一些实现中,申报模板确定模块910包括:模板选择模块,被配置为从多个候选模板中确定与申报请求对应的申报模板,多个候选模板是基于遗传资源管理机构所发布的、与针对遗传资源的不同类型的处理相对应的申报要求而确定。

图10示出了其中可以实施本公开的一个或多个实施例的计算设备/服务器1000的框图。应当理解,图10所示出的计算设备/服务器1000仅仅是示例性的,而不应当构成对本文所描述的实施例的功能和范围的任何限制。

如图10所示,计算设备/服务器1000是通用计算设备的形式。计算设备/服务器1000的组件可以包括但不限于一个或多个处理器或处理单元1010、存储器1020、存储设备1030、一个或多个通信单元1040、一个或多个输入设备1050以及一个或多个输出设备1060。处理单元1010可以是实际或虚拟处理器并且能够根据存储器1020中存储的程序来执行各种处理。在多处理器系统中,多个处理单元并行执行计算机可执行指令,以提高计算设备/服务器1000的并行处理能力。

计算设备/服务器1000通常包括多个计算机存储介质。这样的介质可以是计算设备/服务器1000可访问的任何可以获得的介质,包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器720可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如,只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储设备730可以是可拆卸或不可拆卸的介质,并且可以包括机器可读介质,诸如闪存驱动、磁盘或者任何其他介质,其可以能够用于存储信息和/或数据(例如用于训练的训练数据)并且可以在计算设备/服务器1000内被访问。

计算设备/服务器1000可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性存储介质。尽管未在图10中示出,可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中,每个驱动可以由一个或多个数据介质接口被连接至总线(未示出)。存储器1020可以包括计算机程序产品1025,其具有一个或多个程序模块,这些程序模块被配置为执行本公开的各种实施例的各种方法或动作。

通信单元1040实现通过通信介质与其他计算设备进行通信。附加地,计算设备/服务器1000的组件的功能可以以单个计算集群或多个计算机器来实现,这些计算机器能够通过通信连接进行通信。因此,计算设备/服务器1000可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个网络节点的逻辑连接来在联网环境中进行操作。

输入设备1050可以是一个或多个输入设备,例如鼠标、键盘、追踪球等。输出设备1060可以是一个或多个输出设备,例如显示器、扬声器、打印机等。计算设备/服务器1000还可以根据需要通过通信单元1040与一个或多个外部设备(未示出)进行通信,外部设备诸如存储设备、显示设备等,与一个或多个使得用户与计算设备/服务器1000交互的设备进行通信,或者与使得计算设备/服务器1000与一个或多个其他计算设备通信的任何设备(例如,网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。

根据本公开的示例性实现方式,提供了一种计算机可读存储介质,其上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现上文描述的方法。

这里根据本公开实现的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实现,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文公开的各实现。

相关技术
  • 用于与遗传资源相关的申报的方法、装置、设备和介质
  • 用于遗传资源的处理的预警方法、装置、设备和介质
技术分类

06120112220964