掌桥专利:专业的专利平台
掌桥专利
首页

一种体系文件检查和修正方法、装置、设备及介质

文献发布时间:2023-06-19 12:13:22


一种体系文件检查和修正方法、装置、设备及介质

技术领域

本发明涉及机载研发技术领域,具体涉及一种体系文件检查和修正方法、装置、设备及介质。

背景技术

目前,体系文件内容的检查和修正主要通过人工进行技术评审的方式,检查文件中的谐音、混淆音、形似字错误、中文拼音全拼、语法错误,以及文件形式逻辑问题,并对评审中发现的问题进行讨论并进行修改。

现有工程研制体系文件数量庞大,内容较多;在长时间和大量的重复工作中,人容易思想疲劳,导致工作效率下降;没有统一的逻辑规则做指导,逻辑检查不可能全面。

由于上述原因,导致现有体系文件的处理方法存在以下问题:

一是通过技术评审耗费的时间较长,且效果不一定好;二是无法保证对所有语法语义错误得到检查和修正;三是在人工评审和修正过程中可能会引入新的语法和文字编写错误;四是体系文件逻辑错误不能得到系统地检查和修正,容易造成体系文件逻辑错误检查遗漏。

发明内容

针对现有技术中的缺陷,本发明提供一种体系文件检查和修正方法、装置、设备及介质,以解决现有技术在体系文件处理时效率低,且无法系统进行检查和纠正的问题。

第一方面,本发明提供的一种体系文件检查和修正方法,包括:

基于行业标准,建立体系文件架构和逻辑规则;

根据所述体系文件架构和所述逻辑规则,完成体系文件编辑;

针对完成编辑的体系文件进行检查和修正,输出体系文件。

由上述技术方案可知,本申请基于行业标准和行业最佳工程实践,确定符合行业标准的体系文件架构和逻辑规则,基于确定出的体系文件架构和逻辑规则对体系文件进行编辑,并针对体系文件进行检查和修正。可对体系文件做出符合行业标准和最佳工程实践的修正,输出符合行业标准的体系文件。通过使用上述方法可以系统的对体系文件进行编辑、检查和修正,降低了技术评审时间,避免了检查和修正的错误遗漏。

可选地,所述基于行业标准和行业最佳工程实践,确定体系文件架构和逻辑规则,具体包括:

建立与行业标准一致的数据、角色和目标语句;

基于所述数据、角色和目标语句建立过程和规程的逻辑关系;

根据所述过程和规程的逻辑关系确定体系文件架构和可视化逻辑规则。

可选地,所述针对完成编辑的体系文件进行检查和修正,输出体系文件,具体包括:

通过分词工具对体系文件中的语句进行分词,形成词序列;

对所述词序列进行错误检测,定位错误位置;

遍历所述错误位置,基于文本纠错工具生成候选替换词集;

确定所述候选替换词集中的最优候选词,替换所述错误位置的字词;

输出完成错误替换的体系文件。

可选地,所述确定所述候选替换词集中的最优候选词,替换错误位置的字词,具体包括:

将所述候选替换词集中的元素输入所在错误语句,分别获取元素对应所在语句的困惑度;

根据所述元素对应所在语句的困惑度,确定最优候选词并替换错误位置的字词。

可选地,所述方法还包括:

基于所述体系文件架构和逻辑规则,生成规范脚本;

基于所述完成编辑的体系文件,生成体系文件脚本;

比对所述规范脚本和所述体系文件脚本的参数信息,若所述参数信息不存在差异,输出所述体系文件脚本;

若所述参数信息存在差异,修改所述体系文件架构的所述参数信息,或,修改所述完成编辑的体系文件的所述参数信息。

第二方面,本发明提供的一种体系文件的检查和纠正装置,包括:

规范确定模块,用于基于行业标准,确定体系文件架构和逻辑规则;

文件编辑模块,用于基于所述体系文件架构和所述逻辑规则,完成体系文件编辑;

输出模块,针对完成编辑的体系文件进行检查和修正,输出体系文件。

可选地,所述规范确定模块具体用于:

建立与行业标准一致的数据、角色和目标语句;

基于所述数据、角色和目标语句建立过程和规程的逻辑关系;

根据所述过程和规程的逻辑关系确定体系文件架构和可视化逻辑规则。

可选地,所述输出模块具体用于:

通过分词工具对体系文件中的语句进行分词,形成词序列;

对所述词序列进行错误检测,定位错误位置;

遍历所述错误位置,基于文本纠错工具生成候选替换词集;

确定所述候选替换词集中的最优候选词,替换所述错误位置的字词;

输出完成错误替换的体系文件。

可选地,所述输出模块具体还用于:

将所述候选替换词集中的元素输入所在错误语句,分别获取元素对应所在语句的困惑度;

根据所述元素对应所在语句的困惑度,确定最优候选词并替换错误位置的字词。

可选地,还包括脚本比对模块,具体用于:

基于所述体系文件架构和逻辑规则,生成规范脚本;

基于所述完成编辑的体系文件,生成体系文件脚本;

比对所述规范脚本和所述体系文件脚本的参数信息,若所述参数信息不存在差异,输出所述体系文件脚本;

若所述参数信息存在差异,修改所述体系文件架构的所述参数信息,或,修改所述完成编辑的体系文件的所述参数信息。

第三方面,本发明一实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一种方法的步骤。

第四方面,本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法的步骤。

基于上述技术方案,本申请具有如下有益效果:

1)体系文件的建立主要是出于研发目的,本申请涉及的方法为研发提供一套可行性流程活动,通过将体系文件匹配体系文件和逻辑规则,符合行业标准的编辑,输出适用于各个研发目的的体系文件,同时也加快了研发进度。

2)通过比对体系文件架构和逻辑规则的脚本与完成编辑的体系文件脚本,有效比对参数之间的差异,根据比对结果,对体系文件架构和逻辑规则与完成编辑的体系文件之间的参数进行进一步确认,从而修改对应的参数信息,提高了参数修改的准确性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。

图1示出了本发明一实施例提供的体系文件检查和修正方法的流程示意图;

图2示出了本发明一实施例提供的体系文件检查和修正方法的流程示意图;

图3示出了本发明一实施例提供的体系文件检查和修正方法的流程示意图;

图4示出了本发明一实施例提供的体系文件检查和修正方法的流程示意图;

图5示出了本发明一实施例提供的体系文件检查和修正装置的结构示意图;

图6示出了本发明一实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。

需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

体系文件是纲领性文件,企业通过依据体系文件来执行研发流程,从而保证研制产品以及研发过程与行业标准的一致性。

图1示出了本发明第一实施例所提供的一种体系文件检查和修正方法的流程图。如图1所示,根据本发明实施例的一种基于形式逻辑的体系文件检查和修正方法,包括:

S101、基于行业标准,建立体系文件架构和逻辑规则。

具体地,根据行业标准,定义体系文件中涉及到的生命周期数据,体系中涉及的角色及其职责,研制体系需要满足的行业标准目标,为工程研制体系的设计和编写提供完全一致的数据、角色和目标表述。例如民用航空中,行业标准包括SAE ARP-4754A、DO-178C、DO-254和ARP-476等。基于上述的行业标准,对应于研发项目所针对的研发对象,以此确定符合行业标准的体系文件架构和逻辑规则,为体系文件的编辑和修正提供标准支持,使最后输出的体系文件符合行业标准。以SAE ARP-4754A《民用飞机和系统开发指南》为例,其中规定了飞机和系统研制过程以及中间的过程活动,通过基于上述行业标准建立的体系文件的架构和逻辑规则,依据基于行业标准的架构和逻辑规则,使体系文件满足行业要求。

S102、根据所述体系文件架构和所述逻辑规则,完成体系文件编辑。

本步骤中,基于确定的符合行业标准的文件架构和逻辑规则,针对体系文件进行编辑。其中体系文件编辑包括过程文件编辑和规程文件的编辑。过程文件主要包括过程中活动的逻辑关系定义,包括活动的先后顺序、调用关系、输入输出关系,规程文件主要包括任务的逻辑关系定义,包括任务的执行流程、反馈机制、输入输出关系。另外,体系文件编辑还包括对其他指令文件的编辑,主要包括生命周期数据的模板、活动或任务的执行指南或生命周期数据的编写指南,以及用于验证的各种检查单。基于上述比体系文件编辑包括的三种类型,过程文件编辑、规程文件编辑和其他指令文件的编辑,完成体系文件中间文件的编辑,通过体系文件编辑器来实现体系文件编辑。

由于体系文件的建立主要是出于研发目的,本步骤为研发提供一套可行性流程活动,通过将体系文件匹配体系文件和逻辑规则,符合行业标准的编辑,输出适用于各个研发目的的体系文件,为研发过程提供可靠的体系文件,从而加快了研发进度。

S103、针对完成编辑的体系文件进行检查和修正,输出体系文件。

具体地,完善体系文件的编辑,包括体系文件的中间文件,针对体系文件进行进一步的错误检测和修正,避免体系文件中的字音字形的错误,对于字音字形错误进行纠正,避免符合行业标准逻辑的情况下出现文字输入的错误。

可选地,通过上述体系文件检查和修正方法对体系文件进行检查和修正,参见图2,步骤S101具体还包括如下步骤:

S201、建立与行业标准一致的数据、角色和目标语句。

在一个可能的实施方式中,为了保持与行业标准的一致性,建立与行业标准一致的数据、角色和目标语句,基于上述一致的数据、角色和目标语句,使输出的体系文件保持与行业标准一致的逻辑。在一种可能的实施方式中,步骤S201中的数据可以是体系文件中涉及到的具体参数信息,角色是体系文件中的研发所针对的具体对象,目标语句是针对于角色所需进行的具体操作。以SAE ARP-4754A《民用飞机和系统开发指南》为例,在指南中的4.6节系统实施中,研发所述针对的具体对象包括硬件和软件、电子硬件/软件和飞机/系统,以电子硬件/软件集成举例,具体操作包括研制保证数据和硬件和/或软件寿命周期数据等具体操作。

上述举例仅为本申请的一个可能的实施方式,不作为对本申请技术方案的具体限制。

S202、基于数据、角色和目标语句建立过程和规程的逻辑关系。

具体地,通过一致的数据、角色和目标语句,输出的过程和规程的逻辑符合发展需求和行业标准,其中过程和规程的逻辑关系包括下述列举的几种内容。过程中活动的逻辑关系,包括活动的先后顺序、调用关系、输入输出关系;规程中任务的逻辑关系,包括任务的执行流程、反馈机制、输入输出关系。

S203、根据过程和规程的逻辑关系确定体系文件架构和可视化逻辑规则。

通过建立与行业标准一致的数据、角色和目标语句,使过程和规程的逻辑关系符合行业标准,可使输出的体系文件架构和可视化逻辑规则符合行业标准,利于研发的开展。

具体地,可以通过图形化方式建立流程图,流程图对应逻辑规则,实现逻辑规则的可视化。研发人员可基于流程图更直观的确定研发针对的目标对象、研发顺序及研发步骤等,使研发活动开展更加顺利。

可选地,参见图3,针对完成编辑的体系文件进行检查和修正,输出体系文件,体系文件的检查和修正方法具体还包括如下步骤:

S301、通过分词工具对体系文件中的语句进行分词,形成词序列。

具体地,本实施例中具体通过结巴分词器来对体系文件进行分词。结巴分词器在本步骤的作用主要是中文分词,基于结巴分词器,可将通过文件中的语句段落分割成以字或是词为单位的错误检测对象,便于之后针对单个的字或词检测错误概率。同时可以通过添加自定义词典的方式,加入体系文件对应领域的专有词汇,以使语句中的词汇可以被识别,在经过分词工具分词时更贴合对应领域的场景需要,形成的词序列更适配于目标生成的体系文件。

同时,还可以基于其他分词方法,通常的分词方法有基于词典匹配(正向最大匹配法、逆向最大匹配法和双向匹配分词法等)或基于统计(HMM、CRF、和深度学习);目前主流分词工具库除结巴分词器之外,还包括中科院计算所NLPIR、哈工大LTP、清华大学THULAC、Hanlp分词器等。

S302、对所述词序列进行错误检测,定位错误位置。

具体地,字粒度:语言模型困惑度(ppl)检测某字的似然概率值低于句子文本平均值,则判定该字是疑似错别字的概率大。词粒度:分词后不在词典中的词是疑似错词的概率大。通过两方面的错误检测,确定字和词的错误概率,并定位疑似错误的字和词的位置。

S303、遍历所述错误位置,基于文本纠错工具生成候选替换词集。

本步骤中,遍历所有的错误字词位置,并使用谐音、混淆音、形似字、中文全拼、语法错误词典,对错误位置的字词进行替换。上述分词及错误检测基于结巴分词器和语言模型,语言模型可以为rnn_crf模型或是seq2seq模型等其他语言模型,检测出错误位置并定位。同时,通过添加自定义的词典,如机载领域的的专用词典,其中包括机载领域的专有词汇,当疑似错字或错词的错误概率确定后,基于疑似的错字或错词,对应于词典内容进行替换,使生成的文件的错误字词得到纠正。

S304、确定候选替换词集中的最优候选词,替换所述错误位置的字词。

具体地,继续利用PyCorrector对替换后的体系文件语句进行合法性检查,通过语言模型计算语句的困惑度,在候选替换词集中并对所有候选词依据困惑度进行排序,选出困惑度最小的最优候选词。

S305、输出完成错误替换的体系文件。

本步骤中,基于步骤S301-S304对体系文件对完成逻辑编辑的体系文件进行语句的错误字词替换,可以系统的对体系文件进行检查和修正,避免了逻辑编辑后的体系文件中正确字的音似字和形似字出现,减少了人工在体系文件检查工作的任务量,同时减少了体系文件出现文字错误的情况,提高了输出的体系文件的正确性。

可选地,在步骤S304中,具体还包括如下内容:

将所述候选替换词集中的元素输入所在错误语句,分别获取元素对应所在语句的困惑度;

根据所述元素对应所在语句的困惑度,确定最优候选词并替换错误位置的字词。

具体地,通过分别计算候选替换词集中元素的困惑度,获取困惑度最低的元素,使替换词符合替换位置的语句逻辑,提高了准确性。针对于分词后的语句,字粒度和词粒度可得到分词后字词的错误概率,形成候选替换词集,通过语言模型计算候选替换词集中各个元素的困惑度,并得到依据困惑度排序的候选替换词集的内容,确定最优候选词。最优候选词应当满足在候选替换词集中的困惑度最低。

可选地,参见图4,本申请具体涉及的体系文件检查和修正方法,还包括:

基于所述体系文件架构和逻辑规则,生成规范脚本;

基于所述完成编辑的体系文件,生成体系文件脚本;

比对所述规范脚本和所述体系文件脚本的参数信息,若所述参数信息不存在差异,输出所述体系文件脚本;

若所述参数信息存在差异,修改所述体系文件架构的所述参数信息,或,修改所述完成编辑的体系文件的所述参数信息。

具体地,比对体系文件架构和逻辑规则与完成编辑的体系文件的脚本文件,针对具体的参数信息进行比对,若存在差异,对体系文件架构和完成编辑的体系文件的之间确定需要修改的参数信息。

在一个可能的实施方式中,首先基于体系文件架构和逻辑规则以及完成编辑的体系文件分别形成脚本,这两者在逻辑上应该是一致的。但是针对与具体的研发目标对或是流程可能会存在差异,但是这种差异可能会导致生成的体系文件不符合行业标准,从而对研发的目标对象存在影响。为了避免这种问题,对两者生成的脚本之间进行比对,针对参数信息修改体系文件架构和逻辑规则的具体参数信息,或,修改生成的体系文件的具体参数信息,使两者之间保持一致。在本步骤中,可以利用常用的脚本比对软件对脚本进行比对,分析存在的差异。

通过比对脚本,有效比对参数之间的差异,根据比对结果,对体系文件架构和逻辑规则与完成编辑的体系文件之间的参数进行进一步确认,确定出差异导致原因为体系文件架构和逻辑规则还是体系文件,针对导致原因和行业标准进行确认,修改对应的参数信息。提高了参数修改的准确性。

在一个实施例中,提供了一种体系文件检查和修正装置40,参见图5,包括:

规范确定模块401,用于基于行业标准,确定体系文件架构和逻辑规则;

文件编辑模块402,用于基于体系文件架构和逻辑规则,完成体系文件编辑;

输出模块403,针对完成编辑的体系文件进行检查和修正,输出体系文件。

可选地,规范确定模401块具体用于:

建立与行业标准一致的数据、角色和目标语句;

基于数据、角色和目标语句建立过程和规程的逻辑关系;

根据过程和规程的逻辑关系确定体系文件架构和可视化逻辑规则。

可选地,输出模块403具体用于:

通过分词工具对体系文件中的语句进行分词,形成词序列;

对词序列进行错误检测,定位错误位置;

遍历错误位置,基于文本纠错工具生成候选替换词集;

确定候选替换词集中的最优候选词,替换错误位置的字词;

输出完成错误替换的体系文件。

可选地,输出模块403具体还用于:

将候选替换词集中的元素输入所在错误语句,分别获取元素对应所在语句的困惑度;

根据元素对应所在语句的困惑度,确定最优候选词并替换错误位置的字词。

可选地,体系文件检查和修正装置40还包括脚本比对模块404,具体用于:

基于体系文件架构和逻辑规则,生成规范脚本;

基于完成编辑的体系文件,生成体系文件脚本;

比对规范脚本和体系文件脚本的参数信息,若参数信息不存在差异,输出体系文件脚本;

若参数信息存在差异,修改体系文件架构的参数信息,或,修改完成编辑的体系文件的参数信息。

本申请实施例提供的体系文件检查和修正装置40与上述体系文件检查和修正方法采用了相同的发明构思,能够取得相同的有益效果,在此不再赘述。

基于与上述体系文件检查和修正方法相同的发明构思,本申请实施例还提供了一种电子设备50,如图6所示,该电子设备50可以包括处理器501和存储器502。

处理器501可以是通用处理器,例如中央处理器(CPU)、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

存储器502作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器502还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;上述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于:移动存储设备、随机存取存储器(RAM,Random Access Memory)、磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等各种可以存储程序代码的介质。

或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、随机存取存储器(RAM,Random Access Memory)、磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

相关技术
  • 一种体系文件检查和修正方法、装置、设备及介质
  • 一种体系文件的生成方法、装置、设备及介质
技术分类

06120113211779