掌桥专利:专业的专利平台
掌桥专利
首页

一种基于互相关计算的手机号码查询方法及系统

文献发布时间:2023-06-19 09:32:16


一种基于互相关计算的手机号码查询方法及系统

技术领域

本发明涉及一种基于互相关计算的手机号码查询方法及系统,具体涉及一种基于IMSI与采集图像进行互相关比对进行相似度比拟的技术领域。

背景技术

随着数据挖掘与分析技术的日益完善,涌现出的数据收集与处理技术也在以指数增长的模式扩充和完善。数据之间的相似性成了数据的关联性分析的重要参考依据,目前,分析数据关联价值,成了研究人员分析杂乱数据,重定义数据价值的着力点。

现有的相似度分析仅仅是单一数值对象之间的比对,普遍为单一的文本分析或者单一的图像之间的像素点对比,仅适用于有特定对比对象,不具有关联性的情景下,且采用的循环遍历的读取所有数值的方式,加重了计算时的运行复杂度。

发明内容

发明目的:提供一种基于互相关计算的手机号码查询方法,以解决现有技术存在的上述问题。进一步的目的是通过结合采集的照片集和IMSI信息的相关性,完成对目标人物的手机号码查询。

技术方案:一种基于互相关计算的手机号码查询方法,包括以下步骤:

步骤1、通过信息采集设备获取经过人的图像信息和IMSI信息,进行数据源的获取;

在进一步的实施例中,图像数据的采集为当人脸进入人脸采集设备的拍摄范围内时,进行人脸拍摄和人脸图像信息和拍摄时间的存储,信息设备采集的图片信息确保在时间轴的划分上可见的是相隔较远的拍摄时间点,即目标对象上号的时间范围内不存在时间范围的重叠;

IMSI数据源为在某人到达拍摄地点一定时间段内,信息采集设备收集到的IMSI向设备发送登记请求的次数。

步骤2、输入目标查询照片,与数据库中的数据进行比对,对查询到的数据进行数据处理,降低计算复杂度;

对于输入的目标照片先进行具有相似性的IMSI筛选,取时间点前后小范围的时间段,计算时仅考虑这个时间段出现的号码,以此减少无关联性数据在互相关计算时所造成的时间复杂度,即在本方法中则采用检索出的照片拍摄间前后各30秒期间,出现的IMSI信息和次数。

步骤3、利用互相关函数进行多组数据的关联性分析;

相似度的判断依据为一组照片在时间轴上所呈现的离散函数和每一个IMSI的互相相关函数的计算,其两个对象的互相关函数公式如下:

其中Pic(t)表示关于照片集的离散函数,Imsi(τ+t)中τ表示时间差,整体函数式为拍摄时间段内IMSI的离散函数,判断根据更具相似性的依据是通过直接查看所有互相关函数的有效点总数。

判断根据更具相似性的依据是通过直接查看所有互相关函数的有效点总数,但为减少常驻和经常经过的对象的干扰,采用互相关函数归一化的解决的方式,将整个互相关函数能量压缩至1,即除一个该IMSI总数,除一个照片总数,计算公式如下:

在经过上述步骤的处理后,建立在两次图像时间差值大于区间大小,也就是一个号只会和一张照片对上的基础上时,对于同一照片集,不同IMSI的互相关函数中符合条件的能量和大小表征的仅是哪个IMSI与照片集更为相似,而计算出的结果为某IMSI的任一上号时间都仅能对应照片集中的某一张照片的拍摄时间,即该模型下,计算得的能量最大值为照片总数分之一,基于此乘上照片总数,便可以使得任意目标拥有任意大小的照片集时该目标与某IMSI的相似度,计算公式为:

在进过初步进行复杂度降低后,剩下的比对数据量变得到了较大程度上的减少,为降低模糊目标或模糊照片导致的误导现象,照片函数采用的则不是每个时刻的张数,而是在原有的基础上乘上它的可信度,其计算公式为:

结合所有的计算的值,在归一化在可信度的结合下,方案中总体实现的互相关计算公式为:

步骤4、将经过处理过后的结果集进行可视化的呈现;

将上述计算出的相似度结果集进行降序排列,利用前端开发设计语言进行可视化界面的布局实现,通过数据交互技术将信息结果集选取排列在前的、最具相似性的结果集合呈现至用户可见的可视化界面。

有益效果:本发明涉及一种基于互相关计算的手机号码查询方法,通过提供一种基于互相关的比对算法,解决多种类数据对象的关联性对比,进一步为通过一段时间范围内IMSI和照片的互相关比对,进行相似度的极高的结果集的可视化,以及通过算法优化降低时间和空间的复杂度计算。当用户输入目标照片时,可以获取与目标值具有高相似度的照片集,同时根据照片拍摄的时间范围得到对应的IMSI,通过对相同IMSI的求和,将计算得到的数值作为相似度的大小,并在相似度数值经过降序排列后,将最靠前的IMSI结果集及他们的相似度可视化至用户界面。

附图说明

图1为本发明一种基于互相关计算的手机号码查询方法的架构框图。

图2为本发明一种基于互相关计算的手机号码查询方法的实现流程图。

具体实施方式

在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。

如图1所示为一种基于互相关计算的手机号码查询方法的流程图,具体实施一种基于互相关计算的手机号码查询方法,如下:

首先,用户在界面使用终端输入待检索的目标人物图片信息,通过程序设定将目标人物的照片与已采集到人脸信息数据库中的人物照片进行相似度的比对,选择出一系列极具相似性的人脸照片作为待推荐的结果集,并形成以时间和相似概率为参数的离散函数。其次,在程序的运行下,读取照片集中每一张照片对应的拍摄时间点,并设定照片拍摄时间点前后一段时间作为查询IMSI信号依据的时间段。再次,利用已经选取出的时间段到存储IMSI的数据库中找寻对应时间段出现的不同IMSI,根据时间段的划分形成以时间和上号次数为参数的每个IMSI自身的离散函数。从次,利用程序的辅助计算实现两个离散函数的互相关计算。最后,将计算出的结果值进行排序,选取出排名前三的数值,并将对应的IMSI包含手机号信息和输入的目标照片,在用户可视化终端界面呈现,具体其实现流程图2所示。

其中,在人脸图像信息和拍摄时间采集入库的时候,定义的照片拍摄时间点为刚开始进入摄像设备的时间点,为了防止同一个人在极短的时间范围内采集到多张图像信息从加重后期相关时间段无用IMSI的出现,所以人脸数据库中进行同一个人照片信息存储的时间间隔较大,即照片入库时,如果判断两张照片为极具相似性的,则会丢弃第二张采集到的照片,确保获取的两张照片在时间轴上相隔较远。

IMSI的存储数据库中所定义的上号次数为终端设备上报的登记次数,即人物携带手机经过信息采集终端设备的时候,IMSI会两三秒向采集设备发送一次登记,设备记录IMSI信息和时间点上IMSI发送登记的次数。

将照片集产生的离散函数和不同IMSI产生的离散函数进行互相关的计算,互相关的值便是两者之间的相似性大小,由于穷举法利用循环读取所有IMSI信息进行互相关计算比对时,计算的时间复杂度和空间复杂度会大大上升,所以为减少消耗提高运行效率,在计算前先进行毫无相似度IMSI的排出,通过先筛选有相似性的IMSI在进行计算,采用的排除方式则是比对照片拍摄时间前后共一分钟范围内,IMSI出现的种类和数量。其中互相关计算在本方案的使用为表示为某个IMSI与目标照片集的互相关函数值就是在τ的时间范围内,每一个时间点的目标对象的照片数量与这个时间点延时τ秒的时刻该IMSI数量相乘,再相加的和,判断两个对象存在相关性的依据是在τ的时间范围内存在一个具有值、能量和权重的点,计算公式为:

其中Pic(t)表示关于照片集的离散函数,Imsi(τ+t)中τ表示时间差,整体函数式为拍摄时间段内IMSI的离散函数,判断根据更具相似性的依据是通过直接查看所有互相关函数的有效点总数,但为减少常驻和经常经过的对象的干扰,采用互相关函数归一化的解决的方式,本方案为了去除干扰项达到更好的判断出照片集中哪一个与目标人物的更为相关,便采用归一化的处理,将整个互相关函数的能量压缩到1,即对应操作是除以一个该IMSI的总数和除以一个照片总数,计算公式如下:

上述计算公式中除以照片总数仅是为了归一化达到去除干扰的目的,在实际计算中当照片集中的数量越多,相似性也就越低,因为每个照片覆盖的时间段是独立不重复的,每个可以对应的IMSI上号时间点都会与x-1个照片不对应,所以产生了x-1倍的不对应,其中变量x表示数照片的数量。对于同一照片集,不同IMSI的互相关函数中符合条件的能量和大小仅能表示哪个更相似。在经过上述步骤的处理后,建立在两次图像时间差值大于区间大小,也就是一个号只会和一张照片对上的基础上时,对于同一照片集,不同IMSI的互相关函数中符合条件的能量和大小表征的仅是哪个更为相似,因此计算出的结果为某IMSI的所有IMSI上号时间都能对应上某一照片集中的某张照片的拍摄时间,最后得到的互相关函数中符合条件的能量和最大也只能为(1/照片总数),基于一个号只会和一张照片对上的基础上,我们在乘上照片总数,便可以使得任意目标拥有任意大小的照片集,当IMSI与这个目标完全对应时,相似度为1,即计算公式转换为如下的计算公式:

比对上的每个照片与被给予的目标照片之间上存在有近似85%和90%的相似度,当某张照片与目标照片相似度原本就很低时,也就降低了与之对应的IMSI上号时间的可信度,为降低相似度,减少误导现象的产生,照片函数采用的则不是每个时刻的张数,而是在原有的基础上乘上它的可信度,达到目标与号码的相似度不至于呈现百分百的现象。计算时应将照片集中每张照片的可信度应用上去,即照片函数不是直接用每个时刻的张数,而是乘上它的可信度,计算公式如下:

其中P(t)表示为照片集中对应照片可信度的离散函数,最终总体计算两者之间的互相关数值,其计算公式如下:

将最终计算出的多个数值进行排序,选取出排名最为靠前的三个IMSI,利用可视化的编程语言,进行用户可见界面的布局设计,通过数据交互技术将信息结果集选取排列在前的、最具相似性的结果集合呈现至用户可见的可视化界面利用简约直观可见的界面,进行目标检索照片和IMSI信息及所对应手机号的呈现。

基于上述方法,可以构建一种基于互相关算法的手机号码对应查询系统,包括:

用于采集数据源,建立待比对数据库的第一模块;其中,待比对人脸数据库中含有的数据源为人脸信息采集设备采集到的人脸信息和采集信息的时间点,待比对IMSI数据库的数据源为人物携带手机经过信息采集设备终端时IMSI与设备进行上报登记的次数和时间段。

用于构建简易可操作的可视化界面的第二模块;该模块通过相应的编程语言进行可视化界面的布局设计,构建出的界面引导用户输入目标照片的信息,并同时将最终计算出的推荐结果展现出屏幕上。

用于互相关函数关联应用的第三模块;该模块将初步寻找到的照片集和IMSI集分别构建出离散的照片函数集和IMSI离散函数,利用归一化和可信度提升等操作实现如下计算方式的实现,利用如下公式计算出相似度的值:

将计算出的值按照大小进行排序,选取出排名最为靠前的三个IMSI,通过数据交互技术将信息结果集呈现至用户可见的可视化界面利用简约直观可见的界面,进行目标检索照片和IMSI信息及所对应手机号的呈现。

在上述技术方案下,本发明具体的使用过程如下:例如在警方追击目标时,查询其可能拥有手机号码的情境下,利用本发明在可视化的操作界面,通过在用户端输入目标照片的图像文件,并利用计算多张照片对应的多组IMSI及其权重,对相同IMSI求和得到相似值的方法,在完成结果排序的情况下,便可在可视化的界面查看到经过合理化计算得到的高相似度结果集,即待检索的目标人物照片和相似度最高的3个IMSI和其对应的手机号,从而达到查询手机号码的目的。

如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上做出各种变化。

相关技术
  • 一种基于互相关计算的手机号码查询方法及系统
  • 一种基于SQL与图计算交互式分析的查询方法和系统
技术分类

06120112199646