导航：首页> 测量；测试>基于工业标识的数据查询方法及相关设备

基于工业标识的数据查询方法及相关设备

文献发布时间：2024-04-18 19:58:26

技术领域

本申请涉及数据分析技术领域，具体涉及数据查询技术领域，尤其涉及一种基于工业标识的数据查询方法及相关设备，其中，相关设备包括基于工业标识的数据查询装置、电子设备及存储介质。

背景技术

工业互联网标识通过条形码、二维码、无线射频识别标签等方式赋予每一个实体或虚拟对象唯一的身份编码，同时承载相关数据信息，实现实体和虚拟对象的定位、连接和对话的新型基础设施。

在相关技术中，对于很多大型的应用，其所支持的每类业务通常各自具有一套单独的工业标识，用户在查询不同类型的业务数据时，需要基于每种业务对应的工业标识查询对应的数据，这种数查询方式存在数据查询效率低的缺陷。

发明内容

鉴于以上内容，有必要提出一种基于工业标识的数据查询及相关设备，以解决数据查询效率低的技术问题。其中，相关设备包括基于工业标识的数据查询装置、电子设备及存储介质。

本申请提供基于工业标识的数据查询方法，所述方法包括：接收与工业标识对应的用户请求和用户的身份标识；根据所述用户请求从数据库中确定多个候选数据；根据所述身份标识从所述多个候选数据中匹配对应的多个目标数据；根据每个目标数据的优先级的顺序，校验所述每个目标数据的完整性，得到校验结果；根据所述校验结果，输出所述目标数据。

在一些实施例中，所述根据所述用户请求从数据库中确定多个候选数据包括：依据预设的通信协议解析所述用户请求，得到所述用户请求中记载的请求报文；获取数据库中每个数据对应的数据描述信息；计算所述请求报文与所述数据描述信息之间的相关性；根据所述相关性确定所述多个候选数据。

在一些实施例中，所述计算所述请求报文与所述数据描述信息之间的相关性包括：对所述请求报文进行分词，得到多个报文词汇；分析所述数据描述信息，得到多个描述词汇；对所述报文词汇进行稀疏编码，得到第一稀疏向量；对所述描述词汇进行稀疏编码，得到第二稀疏向量；输入所述第一稀疏向量和所述第二稀疏向量至预训练编码器中，得到所述报文词汇对应的第一嵌入向量和所述描述词汇对应的第二嵌入向量；根据所述第一嵌入向量和所述第二嵌入向量确定所述请求报文与所述数据描述信息之间的相关性。

在一些实施例中，所述根据所述相关性确定所述多个候选数据包括：根据所述相关性由大到小的顺序对所述数据库中的数据排序；计算每两个相邻的数据对应的相关性之间的差值；确定最大的所述差值对应的两个数据中次序靠前的数据为边界数据；确定所述边界数据以及次序比所述边界数据靠前的数据为候选数据。

在一些实施例中，所述多个候选数据中的每一个对应一个权限标识，根据所述身份标识从所述多个候选数据中匹配对应的多个目标数据包括：根据所述身份标识匹配对应的权限标识；确定匹配到的所述权限标识对应的候选数据为目标数据。

在一些实施例中，确定所述每个目标数据的优先级的方法包括：获取所述目标数据上一次被查询的时刻，以及目标数据在预设时长内被查询的次数；计算当前时刻与所述被查询的时刻之间的时间差；分别对所述被查询的次数和所述时间差进行归一化处理，得到归一化的时间差和归一化的次数；计算所述归一化的时间差与所述归一化的次数的均值，得到所述目标数据的优先级。

在一些实施例中，所述根据所述校验结果输出所述目标数据包括：获取所述用户请求中记载的第一验证码；对所述目标数据进行哈希计算，得到所述目标数据对应的第二验证码；当所述第一验证码和所述第二验证码相同时，确定所述目标数据的校验结果为正常，输出所述目标数据；当所述第一验证码和所述第二验证码不同时，确定所述目标数据的校验结果为异常，输出预警信息。

本申请实施例还提供一种基于工业标识的数据查询装置，所述装置包括：接收模块，用于接收与工业标识对应的用户请求；确定模块，用于根据所述用户请求从数据库中确定多个候选数据；匹配模块，用于根据接收到的用户的身份标识从所述多个候选数据中匹配对应的多个目标数据；所述确定模块，还用于确定每个目标数据的优先级；校验模块，用于根据所述优先级的顺序校验所述每个目标数据的完整性，得到校验结果；输出模块，用于根据所述校验结果，输出所述目标数据。

本申请实施例还提供一种电子设备，所述电子设备包括：存储器，存储至少一个指令；处理器，执行所述存储器中存储的指令以实现所述的基于工业标识的数据查询方法。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现所述的基于工业标识的数据查询方法。

由以上技术方案可以看出，本申请实施例根据与工业标识对应的用户请求确定候选数据，并根据用户的身份标识从候选数据中确定目标数据，能够通过多次筛选缩小数据查询的范围，从而能够提升数据查询的效率；在进行数据查询的过程中，先确定目标数据优先级，并根据优先级由高到低的顺序依次评估目标数据的完整性，从而能够提升查询到的目标数据的质量，并进一步提升数据查询的效率。

附图说明

图1是本申请一实施例提供的基于工业标识的数据查询方法的应用场景图。

图2是本申请一实施例提供的基于工业标识的数据查询方法的流程图。

图3是本申请一实施例提供的确定多个候选数据的方法的流程图。

图4是本申请一实施例提供的确定目标数据的方法的流程图。

图5是本申请一实施例提供的确定目标数据的优先级的方法的流程图。

图6是本申请一实施例提供的根据校验结果输出目标数据的方法的流程图。

图7是本申请一实施例提供的确定请求报文与数据描述信息的相关性的方法的流程图。

图8是本申请一实施例提供的根据相关性确定多个候选数据的方法的流程图。

图9是本申请一实施例提供的基于工业标识的数据查询装置的功能模块图。

图10是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了能够更清楚地理解本申请的目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本申请，所述描述的实施例仅是本申请一部分实施例，而不是全部的实施例。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本申请实施例提供一种基于工业标识的数据查询方法，可应用于一个或者多个电子设备中，电子设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

电子设备可以是任何一种可与客户进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理（Personal Digital Assistant，PDA）、游戏机、交互式网络电视（Internet Protocol Television，IPTV）、智能式穿戴式设备等。

电子设备还可以包括网络设备。其中，所述网络设备包括，但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。

电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络（Virtual Private Network，VPN）等。

如图1所示，本申请提供的基于工业标识的数据查询方法可应用于电子设备100，电子设备100与终端200通信连接。其中，终端200包括摄像装置201。终端200中的摄像装置201用于扫描工业标识300，使得终端200接收与工业标识300对应的用户请求，发送该用户请求至电子设备100。电子设备100接收到用户请求之后，根据该用户请求从数据库中查询与工业标识关联的目标数据。其中，电子设备100可以是终端设备200内置的处理器，还可以是与终端200通信连接的外部处理器，本申请对此不做限定。

示例性的，终端200可以是手机，摄像装置201可以是手机中的摄像头，电子设备100可以是手机的中央处理器，工业标识300可以是生产线对应的工业物联网标识，其中，工业物联网标识用于关联与生产线相关的数据。用户通过手机中的摄像头扫描工业物联网标识后，手机接收到与工业物联网标识对应的用户请求，手机的中央处理器根据该用户请求查询与工业物联网标识相关联的数据（例如，生产线相关的数据）。

在本申请一实施例中，终端200还包括显示装置202，显示装置202用于向用户展示工业标识300。终端200响应于用户通过显示装置202对工业标识300进行的预设操作（例如，点击工业标识300），接收与工业标识300对应的用户请求，并发送该用户请求至电子设备100。电子设备100根据该用户请求查询与工业标识300相关联的目标数据。

如图2所示，是本申请一实施例提供的基于工业标识的数据查询方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的基于工业标识的数据查询方法包括如下步骤。

S20，接收与工业标识对应的用户请求。

在本申请一实施例中，工业标识可以是工业互联网中常用的标识，能够赋予企业或组织唯一的身份。工业标识可以是二维码、条形码、还可以是前端页面中的超链接。其中，工业标识用于关联数据库中的数据存储地址。

在本申请一实施例中，响应于用户对工业标识进行的预设操作，生成用户请求。示例性的，当工业标识是二维码或条形码时，预设操作可以是用户利用电子设备扫描工业标识；当工业标识是前端页面中的超链接时，预设操作可以是用户点击超链接。

在本申请一实施例中，用户请求用于表征用户通过工业标识查询数据的请求。具体的，用户利用电子设备扫描工业标识之后，根据工业标识中的内容生成符合预设的通信协议的用户请求，其中，预设的通信协议可以是HTTP协议、TCP协议或UDP协议等，本申请对此不做限定。

S21，根据所述用户请求从数据库中确定多个候选数据。

在本申请一实施例中，用户请求包括请求头和请求报文。其中，请求头用于记载工业标识关联的数据库的存储路径，请求报文用于记载工业标识关联的数据的关键字。

在本申请一实施例中，为了提升数据查询效率，可根据请求头确定数据库，并对比请求报文的内容与该数据库中每个数据的描述信息，以从该数据库中确定多个候选数据。具体的，确定多个候选数据的方法请参见图3对应的详细说明。

S22，根据接收到的用户的身份标识从所述多个候选数据中匹配对应的多个目标数据。

在本申请一实施例中，多个候选数据中的每一个对应一个权限标识，权限标识用于表征查询该候选数据所需的权限。例如，不同的候选数据对应的权限标识可被分为“低级、中级和高级”；又例如，候选数据对应的权限标识还可以被分为“一级、二级和三级”。

在本申请一实施例中，用户的身份标识可以是用户根据前端页面的提示输入的身份信息，且用户的身份标识关联于权限标识。示例性的，身份标识关联的权限标识为低级时，表明该用户具备查询低级数据的权限；又例如，当身份标识关联的权限标识为高级时，表明该用户同时具备查询高级数据、中级数据和低级数据的权限。其中，身份信息可以是用户名和密码的组合；身份信息还可以是用户ID和验证码的组合。本申请对身份标识的具体格式不做限定。

在本申请一实施例中，可根据身份标识匹配对应的权限标识，并确定匹配到的权限标识对应的候选数据为目标数据。具体的，确定目标数据的方法请参见图4对应的详细说明。

S23，确定每个目标数据的优先级。

在本申请一实施例中，为了提升数据查询的效率，可在确定目标数据之后，确定目标数据的优先级。该优先级用于表征目标数据是否为常用数据，当目标数据的优先级较高时，则优先输出该目标数据。如此，能够提升数据查询的效率。具体的，确定目标数据的优先级的方法请参见图5对应的详细说明。

S24，根据所述优先级由高到低的顺序，校验所述每个目标数据的完整性，得到校验结果。

在本申请一实施例中，为了确保输出的目标数据的质量，进一步提升数据查询的效率，可根据优先级由高到低的顺序依次校验每个目标数据的完整性，以得到校验结果。其中，校验结果包括正常和异常。如此，在输出目标数据之前，基于目标数据的完整性校验结果评估目标数据的质量，从而避免输出的目标数据为受损的数据，能够进一步提升数据查询的效率。

S25，根据所述校验结果，输出所述目标数据。

在本申请一实施例中，当校验结果为正常时，表明该目标数据未出现损坏的情况，则可输出该目标数据。当校验结果为异常时，表明该目标数据出现了损坏的情况，则可输出预警信息，以提示用户重新查询，还能够提示数据库运维人员及时进行数据维护。具体的，根据校验结果输出目标数据的方法请参见图6对应的详细说明。

如图3所示，是本申请一实施例提供的确定多个候选数据的方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的确定多个候选数据的方法包括如下步骤。

S30，依据预设的通信协议解析所述用户请求，得到所述用户请求中记载的请求报文。

在本申请一实施例中，为了从数据库中匹配与用户请求关联程度较高的候选数据，可根据预设的通信协议解析用户请求，得到用户请求中记载的请求报文。其中，请求报文用于记载工业标识关联的数据对应的关键字。例如，当工业标识关联的数据是电商交易数据时，请求报文中记载的关键字可包括“商品ID”、“买家信息”或“交易金额”等；当工业标识关联的数据是制造业中的自动化生产线数据时，请求报文中记载的关键字可包括“产线ID”、“产线运行时长”或“产线当前产能”。

在本申请一实施例中，用户请求由多个字节的数据组合而成，为了确定用户请求中记载的请求报文，可根据预设的通信协议解析用户请求，从而从多个字节中确定特定的字节数量的数据为请求报文。

示例性的，当预设的通信协议为TCP协议时，由于TCP协议对应的请求头最长为60字节，因此可确定用户请求中第60个字节之后所有的数据为请求报文。

S31，获取数据库中每个数据对应的数据描述信息。

在本申请一实施例中，数据库中的数据存储格式为数据表的格式，每个数据表对应一段数据描述信息。其中，数据描述信息用于表征该数据表中存储的数据相关的各项属性，例如，属性可以包括数据的字段名称、数据的类型、数据表的外键、数据表的外键、该数据表与其他数据表之间的主从关系等。

示例性的，数据描述信息可以是：“数据名称：tb_productinfo；版本信息：V1.01.01；主键字段：productID”，该数据表描述信息用于表整个该数据表的名称为tb_productinfo，该数据表中存储的数据的版本为V1.01.01，且该数据表中的主键对应的字段名称为productID。

S32，计算所述请求报文与所述数据描述信息之间的相关性。

在本申请一实施例中，为了提升数据查询的效率，可先计算请求报文与数据描述信息之间的相关性。相关性越高则表明请求报文中记载的内容与数据描述信息中记载的内容越相似，进一步能够表明该数据描述信息对应的数据与工业标识的关联程度越高。具体的，确定请求报文与数据描述信息之间的相关性的方法请参见图7对应的详细说明。

S33，根据所述相关性确定所述多个候选数据。

在本申请一实施例中，可根据相关性由高到低的顺序对数据库中的所有数据进行排序，并确定次序靠前的多个数据为候选数据；还可确定相关性大于预设阈值的数据为候选数据。具体的，根据相关性确定多个候选数据的方法请参见图8对应的详细说明。

在本申请一实施例中，每一个候选数据对应一个权限标识，用于表征用户查询该候选数据时所需要的权限。电子设备在接收到用户发送的身份标识之后，根据身份标识匹配对应的权限标识，并根据匹配到的权限标识确从候选数据中确定目标数据。如图4所示，是本申请一实施例提供的确定目标数据的方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的确定目标数据的方法包括如下步骤。

S40，根据所述身份标识匹配对应的权限标识。

在本申请一实施例中，不同的身份标识包括不同的内容，例如，一些身份标识包括用户名和用户密码；另一些身份标识包括用户的姓名和用户的证件号码。因此，不同的身份标识对应于不同级别的权限标识。

在本申请一实施例中，可从预存的身份权限关联信息中确定身份标识对应的权限标识。其中，预存的身份权限关联信息用于存储用户的身份标识与权限标识的关联关系。示例性的，当权限标识包括低级、中级和高级，且身份标识包括用户名和用户密码时，该身份标识对应的权限标识可以是低级；当身份标识包括用户姓名和用户的证件号码时，由于根据用户姓名和用户的证件号码可以对用户进行实名认证，因此该身份标识对应的权限标识可以是中级；当身份标识包括用户姓名、证件号码和用户的生物特征（例如，指纹、面部特征或声纹特征）时，该身份标识对应的权限标识可以是高级。

S41，确定匹配到的所述权限标识对应的候选数据为目标数据。

在本申请一实施例中，在确定身份标识对应的权限标识之后，可确定该权限标识对应的所有候选数据为目标数据。示例性的，当确定身份标识对应的权限标识为高级，且有三个候选数据对应的权限标识为高级，则确定该三个候选数据为目标数据。

如图5所示，是本申请一实施例提供的确定目标数据的优先级的方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的确定目标数据的优先级的方法包括如下步骤。

S50，获取所述目标数据上一次被查询的时刻，以及目标数据在预设时长内被查询的次数。

在本申请一实施例中，当目标数据上一次被查询的时刻与当前时刻相距越近时，表明目标数据在当前时刻被再次查询的概率较高；当目标数据在预设时长内被查询的次数较多时，表明用户查询该目标数据的需求较高，因此该目标数据在当前时刻被再次查询的概率较高。

S51，计算当前时刻与所述被查询的时刻之间的时间差。

在本申请一实施例中，为了根据目标数据上一次被查询的时刻评估目标数据的优先级，首先可计算当前时刻与目标数据上一次被查询的时刻之间的时间差。该时间差越大则表明距离该目标数据上一次被查询已过去较长的时间，则该目标数据在当前时刻再次被查询的概率相对较低；该时间差越小则表明距离该目标数据上一次被查询已过去了较短的时间，则该目标数据在当前时刻再次被查询的概率相对较高。

S52，分别对所述被查询的次数和所述时间差进行归一化处理，得到归一化的时间差和归一化的次数。

在本申请一实施例中，为了提高确定目标数据的优先级的准确度，可根据时间差和被查询的次数联合确定目标数据的优先级，避免由于单一变量而导致的优先级准确度低的问题。

在本申请一实施例中，由于时间差和目标数据被查询的次数分别具备不同的量纲，因此首先可利用预设的归一化算法分别对目标数据被查询的次数和时间差进行归一化处理，得到归一化的时间差设归一化的次数。其中，预设的归一化算法可以是最大化算法、最小化算法等，本申请对此不做限定。

示例性的，当预设的归一化算法是最大化算法，且多个目标数据的时间差分别为26秒、100秒、300秒，则归一化的时间差分别为0.086、0.33、1。

S53，计算所述归一化的时间差与所述归一化的次数的均值，得到所述目标数据的优先级。

在本申请一实施例中，通过计算归一化的时间差与归一化的次数的均值，融合多个特征以确定目标数据的优先级，从而能够提升确定优先级的准确度。示例性的，当某一个目标数据对应的归一化的时间差为0.5且对应的归一化的次数为0.8，则该目标数据对应的优先级为0.65。

如图6所示，是本申请一实施例提供的根据校验结果输出目标数据的方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的根据校验结果输出目标数据的方法包括如下步骤。

S60，获取所述用户请求中记载的第一验证码。

在本申请一实施例中，用户请求中还记载有第一验证码，用于校验用户对应的数据的完整性。其中，第一验证码是利用预设的哈希算法对请求报文进行哈希运算后得到的。其中，预设的哈希算法可以是SHA256算法、SHA1算法等，本申请对此不做限定。

示例性的，当请求报文的内容为“产线ID”、“产线运行时长”或“产线当前产能”，且预设的哈希算法为SHA256算法时，对应的第一验证码为“6b03ee085ce063c32ba1eca94b6c97bce2fa6730656b195275b926bd79c6afd3”。

S61，对所述目标数据进行哈希计算，得到所述目标数据对应的第二验证码。

在本申请一实施例中，在接收到用户请求之后，利用预设的哈希算法对目标数据进行哈希计算，得到用户请求对应的第二验证码。其中，第二验证码用于表征用户请求被接收到之后对应得到的验证信息。

S62，当所述第一验证码和所述第二验证码相同时，确定所述目标数据的校验结果为正常，输出所述目标数据。

在本申请一实施例中，由于哈希运算得到的第一验证码和第二验证码均具备唯一性，因此，当第一验证码和第二验证码相同时，表明目标数据未被篡改，或目标数据在存储或传输的过程中未发生损坏，数据的完整性正常。因此，可输出该目标数据。

S63，当所述第一验证码和所述第二验证码不同时，确定所述目标数据的校验结果为异常，输出预警信息。

在本申请一实施例中，当第一验证码和第二验证码不同时，表明目标数据可能被篡改或发生损坏的情况。因此可输出预警信息以向用户示警，预警信息还可用于通知数据库运维人员及时对损坏的目标数据进行修复。

如图7所示，是本申请一实施例提供的确定相关性的方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的确定相关性的方法包括如下步骤。

S321，对所述请求报文进行分词，得到多个报文词汇。

在本申请一实施例中，请求报文中包括多个报文词汇，为了计算请求报文与数据描述信息之间的相关性，可先对请求报文和数据描述信息进行量化处理。而为了提升对请求报文和数据描述信息进行量化处理时的准确度，可先利用预存的分词工具对请求报文和数据描述信息进行分词，从而以更细的粒度划分请求报文和数据描述信息，从而在后续对请求报文和数据描述信息进行量化时能够得到更加准确的量化数据。

在本申请一实施例中，预设的分词工具可以是Jiaba分词工具、HanLP分词工具等具备分词功能的软件程序。示例性的，当请求报文为：产线ID、产线运行时长、产线当前产能”时，经过分词后得到的多个报文词汇分别为“产线”、“ID”、“运行时长”、“当前”、“产能”。

S322，分析所述数据描述信息，得到多个描述词汇。

在本申请一实施例中，数据描述信息用于记载数据库中各个数据表的属性信息，其中包括多个描述词汇，可利用预设的分词工具对数据描述信息进行分词，得到数据描述信息中的描述词汇。示例性的，当数据描述信息为：“数据名称：tb_productinfo；版本信息：V1.01.01；主键字段：productID”，则经过分词之后得到的描述词汇包括：数据名称、tb_productinfo、版本信息、V1.01.01、主键字段、productID。

S323，对所述报文词汇进行稀疏编码，得到第一稀疏向量。

在本申请一实施例中，可利用预设的编码算法对报文词汇进行稀疏编码。例如，预设的编码算法可以是one-hot编码算法、gram编码算法、奇异值分解算法等具备稀疏编码功能的算法，本申请对此不做限定。

在本申请一实施例中，第一稀疏向量具备多个维度，用于表征报文词汇的量化特征。示例性的，当预设的编码算法为one-hot编码，且请求报文对应3个报文词汇时，则第一稀疏向量可以是[[1，0，0]，[0，1，0]，[0，0，1]]。

S324，对所述描述词汇进行稀疏编码，得到第二稀疏向量。

在本申请一实施例中，可利用相同的编码算法对描述词汇进行稀疏编码，确定描述词汇对应的第二稀疏向量。其中，第二稀疏向量用于表征描述词汇的量化特征。

S325，输入所述第一稀疏向量和所述第二稀疏向量至预训练编码器中，得到所述报文词汇对应的第一嵌入向量和所述描述词汇对应的第二嵌入向量。

在本申请一实施例中，由于第一稀疏向量与第二稀疏向量的维度较高，且第一稀疏向量的维度与第二稀疏向量的维度可能不同，因此可利用预训练编码器对第一稀疏向量和第二稀疏向量进行降维，得到报文词汇对应的第一嵌入向量和描述词汇对应的第二嵌入向量。如此，通过降低第一稀疏向量和第二稀疏向量的维度，能够提升后续数据处理的效率，并能够利用预训练编码器统一第一稀嵌入向量和第二嵌入向量的维度，便于后续根据相同维度的第一嵌入向量和第二嵌入向量计算请求报文和数据描述信息的相关性。

在本申请一实施例中，预训练编码器可以是预先训练至收敛状态的编码器，该预训练编码器的输入数据为第一稀疏向量或第二稀疏向量，输出为第一嵌入向量或第二嵌入向量。示例性的，编码器可以是全连接神经网络、循环神经网络、长短期记忆模型等现有的编码器，本申请对此不做限定。

S326，根据所述第一嵌入向量和所述第二嵌入向量确定所述请求报文与所述数据描述信息之间的相关性。

在本申请一实施例中，可利用预设的相关性算法计算请求报文与数据描述信息之间的相关性。其中，预设的相关性算法可以是欧式距离算法、余弦相似度算法、汉明距离算法等，本申请对此不做限定。

示例性的，当第一嵌入向量为[1，2，3]且第二嵌入向量为[2，3，4]，且预设的相关性算法为余弦相似度算法时，该第一嵌入向量和该第二嵌入向量的相关性的计算方式满足以下关系式：

；

则该第一嵌入向量和该第二嵌入向量的相关性为0.993。

如图8所示，是本申请一实施例提供的根据相关性确定多个候选数据的方法的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。本申请实施例提供的根据相关性确定多个候选数据的方法包括如下步骤。

S331，根据所述相关性由大到小的顺序对所述数据库中的数据排序。

在本申请一实施例中，数据描述信息与请求报文的相关性越高，则表明该数据描述信息对应的数据与工业标识的关联程度越高。为了在数据库中缩小确定候选数据的范围，可先根据相关性由大到小的顺序对数据库中的数据排序，后续根据该顺序从数据库中确定候选数据。

S332，计算每两个相邻的数据对应的相关性之间的差值。

在本申请一实施例中，两个相邻的数据对应的相关性之间的差值能够表征两个相邻的数据与工业标识关联程度的差异度。当差值越大时，表明两个相邻的数据与工业标识关联程度的差异较大。

S333，确定最大的所述差值对应的两个数据中次序靠前的数据为边界数据。

在本申请一实施例中，为了从数据库中筛选出与工业标识关联程度较高的多个候选数据，首先可根据差值确定边界数据。具体的，可确定最大的差值对应的两个数据中次序靠前的数据为边界数据。

例如，当数据库中存储有五个数据，且每个数据的数据描述信息与请求报文之间的相关性从大到小依次为0.99、0.98、0.97、0.8、0.79，则相关性0.97对应的数据为边界数据。

S334，确定所述边界数据以及次序比所述边界数据靠前的数据为候选数据。

在本申请一实施例中，边界数据对应的相关性与次序相对靠后的其他数据对应的相关性差异较大，表明边界数据和次序相对靠前的其他数据与工业标识的关联程度较高。因此，可确定边界数据一级次序比边界数据靠前的数据为候选数据。如此，根据相关性的差异对数据库中的数据进行筛选，确定多个候选数据，能够降低后续需要分析的数据的数量，从而提升数据查询效率。

请参见图9，图9是本申请一实施例提供的基于工业标识的数据查询装置的功能模块图。基于工业标识的数据查询装置11包括接收模块110、确定模块111、匹配模块112、校验模块113和输出模块114。本申请所称的模块/单元是指一种能够被处理器13所执行，并且能够完成固定功能的一系列计算机可读指令段，其存储在存储器12中。在本实施例中，关于各模块/单元的功能将在后续的实施例中详述。

所述接收模块110，用于接收与工业标识对应的用户请求。

所述确定模块111，用于根据所述用户请求从数据库中确定多个候选数据。

所述匹配模块112，用于根据接收到的用户的身份标识从所述多个候选数据中匹配对应的多个目标数据。

所述确定模块111，还用于确定每个目标数据的优先级。

所述校验模块113，用于根据所述优先级的顺序校验所述每个目标数据的完整性，得到校验结果。

所述输出模块114，用于根据所述校验结果，输出所述目标数据。

在本申请一实施例中，所述确定模块111还用于：依据预设的通信协议解析所述用户请求，得到所述用户请求中记载的请求报文；获取数据库中每个数据对应的数据描述信息；计算所述请求报文与所述数据描述信息之间的相关性；根据所述相关性确定所述多个候选数据。

在本申请一实施例中，所述确定模块111还用于：对所述请求报文进行分词，得到多个报文词汇；分析所述数据描述信息，得到多个描述词汇；对所述报文词汇进行稀疏编码，得到第一稀疏向量；对所述描述词汇进行稀疏编码，得到第二稀疏向量；输入所述第一稀疏向量和所述第二稀疏向量至预训练编码器中，得到所述报文词汇对应的第一嵌入向量和所述描述词汇对应的第二嵌入向量；根据所述第一嵌入向量和所述第二嵌入向量确定所述请求报文与所述数据描述信息之间的相关性。

在本申请一实施例中，所述确定模块111还用于：根据所述相关性由大到小的顺序对所述数据库中的数据排序；计算每两个相邻的数据对应的相关性之间的差值；确定最大的所述差值对应的两个数据中次序靠前的数据为边界数据；确定所述边界数据以及次序比所述边界数据靠前的数据为候选数据。

在本申请一实施例中，多个候选数据中的每一个对应一个权限标识，所述匹配模块112还用于：根据所述身份标识匹配对应的权限标识；确定匹配到的所述权限标识对应的候选数据为目标数据。

在本申请一实施例中，所述确定模块111还用于：获取所述目标数据上一次被查询的时刻，以及目标数据在预设时长内被查询的次数；计算当前时刻与所述被查询的时刻之间的时间差；分别对所述被查询的次数和所述时间差进行归一化处理，得到归一化的时间差和归一化的次数；计算所述归一化的时间差与所述归一化的次数的均值，得到所述目标数据的优先级。

在本申请一实施例中，所述输出模块114还用于：获取所述用户请求中记载的第一验证码；对所述目标数据进行哈希计算，得到所述目标数据对应的第二验证码；当所述第一验证码和所述第二验证码相同时，确定所述目标数据的校验结果为正常，输出所述目标数据；当所述第一验证码和所述第二验证码不同时，确定所述目标数据的校验结果为异常，输出预警信息。

请参见图10，是本申请实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令，处理器13用执行所述储器中存储的计算机可读指令以实现上述任一实施例所述的基于工业标识的数据查询方法。

在本申请一实施例中，电子设备1还包括总线、存储在所述存储器12中并可在所述处理器13上运行的计算机程序，例如基于工业标识的数据查询程序。

图10仅示出了具有存储器12和处理器13的电子设备1，本领域技术人员可以理解的是，图10示出的结构并不构成对电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

结合图2，电子设备1中的所述存储器12存储多个计算机可读指令以实现一种基于工业标识的数据查询方法，所述处理器13可执行所述多个指令从而实现：接收与工业标识对应的用户请求；根据所述用户请求从数据库中确定多个候选数据；根据接收到的用户的身份标识从所述多个候选数据中匹配对应的多个目标数据；确定每个目标数据的优先级；根据所述优先级由高到低的顺序，校验所述每个目标数据的完整性，得到校验结果；根据所述校验结果，输出所述目标数据。

具体地，所述处理器13对上述指令的具体实现方法可参考图2对应实施例中相关步骤的描述，在此不赘述。

本领域技术人员可以理解，所述示意图仅仅是电子设备1的示例，并不构成对电子设备1的限定，电子设备1可以是总线型结构，也可以是星形结构，电子设备1还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置，例如电子设备1还可以包括输入输出设备、网络接入设备等。

需要说明的是，电子设备1仅为举例，其他现有的或今后可能出现的电子产品如可适应于本申请，也应包含在本申请的保护范围以内，并以引用方式包含于此。

其中，存储器12至少包括一种类型的可读存储介质，所述可读存储介质可以是非易失性的，也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器（例如：SD或DX存储器等）、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式移动硬盘、智能存储卡（Smart Media Card, SMC）、安全数字（Secure Digital, SD）卡、闪存卡（Flash Card）等。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于工业标识的数据查询程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器13在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器（Central Processing unit，CPU）、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心（Control Unit），利用各种接口和线路连接整个电子设备1的各个部件，通过运行或执行存储在所述存储器12内的程序或者模块（例如执行基于工业标识的数据查询程序等），以及调用存储在所述存储器12内的数据，以执行电子设备1的各种功能和处理数据。

所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于工业标识的数据查询方法实施例中的步骤，例如图2所示的步骤。

示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器12中，并由所述处理器13执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如，所述计算机程序可以被分割成接收模块110、确定模块111、匹配模块112、校验模块113和输出模块114。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、计算机设备，或者网络设备等）或处理器（Processor）执行本申请各个实施例所述的基于工业标识的数据查询方法的部分。

电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指示相关的硬件设备来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。

其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存储器及其他存储器等。

进一步地，计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

总线可以是外设部件互连标准（Peripheral Component Interconnect，简称PCI）总线或扩展工业标准结构（Extended Industry Standard Architecture，简称EISA）总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，在图10中仅用一根箭头表示，但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。

本申请实施例还提供一种计算机可读存储介质（图未示），计算机可读存储介质中存储有计算机可读指令，计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于工业标识的数据查询方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：江苏中天互联科技有限公司;