掌桥专利:专业的专利平台
掌桥专利
首页

一种互联网犯罪涉案数据库提取涉案信息方法

文献发布时间:2024-01-17 01:16:56



技术领域

本发明涉及数据处理技术领域,具体是一种互联网犯罪涉案数据库提取涉案信息方法。

背景技术

互联网犯罪侦查活动中对涉案数据库的侦察活动中涉案数据库表格众多,字段含义不明,错误,互相冲突,数据内容往往多达几百GB,备份数据与在运行系统数据重叠冲突,无效流水数据过多等问题,例如网络传销、网络诈骗、网络赌博等互联网犯罪案件中涉案数据库庞大,难以进行有效信息的提取和甄别,无法及时对犯罪类型犯罪有效数据、所需要的涉案信息进行整合,在当前互联网犯罪案件中犯罪分子往往犯罪全过程仅需数月的形势下,犯罪团伙连续快速作案与涉案数据处理的延迟性存在巨大矛盾,如何在庞大涉案数据库内提取涉案有效信息,成为急需解决的一个问题。

针对上述问题,我们提供了一种互联网犯罪涉案数据库提取涉案信息方法,以解决上述所提到的问题。

发明内容

本发明的目的在于提供一种互联网犯罪涉案数据库提取涉案信息方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种互联网犯罪涉案数据库提取涉案信息方法,包括涉案类型数据含义匹配模块、涉案类型数据统计模块、团队类型推断模块和涉案信息整合提取展示模块;

所述涉案类型数据含义匹配模块,用于对涉案数据库中数据表字段值根据其数据特征匹配各类公民个人信息,包括对数据字段注释含义和数据特征匹配类型进行比对,确认是否存在错误注释情况;

所述涉案类型数据统计模块根据表名称和关键字等数据含义结合已办结案件统计和计算结果,以已保存例案表结构同类表在涉案数据中对应表的表名称和注释进行逐个比较并计算曼哈顿距离,确认相似度最高的案件类型;

所述团队类型推断模块包括结合犯罪类型筛选相关包含涉案数据表字段对已确认类型数据库进行人员基本信息分类统计、资金出入统计、资金往来统计,并根据已确认主表和备份表时间区间对于重复计算部分进行去重;

所述涉案信息整合提取展示模块包括将符合例库中模式的已筛选数据根据例案中犯罪团伙相关信息,犯罪模式运转关键参数进行标注并展示,然后将包含公民个人信息条数计数值情况进行排序并逐个展示,供犯罪侦查部门使用,已办结案件数据将会被重上传至案件例库,供后续分析使用。

作为本发明进一步的方案:所述涉案类型数据含义匹配模块包括对存在时间戳的数据进行数据时间区间对应,对同一时间区间内产生的同类型数据进行基于时间戳的比对和确认,根据是否存在错误注释和语义分析只保留一个更接近字段实际数据特征的关键字。

作为本发明再进一步的方案:所述涉案类型数据含义匹配模块包括对于表名称存在较长相同子串,或差异仅为日期字符串的表,比较其数据库字段类型和注释,判断主表与备份表,对表格内容进行合并,对表格名,表格字段注释进行比对确认,根据是否存在错误注释和语义分析保留一个更接近字段实际表特征的表名称。

作为本发明再进一步的方案:所述犯罪模式运转关键参数包括传销分成比例、集资诈骗入门费用和团队管理奖金比例。

与现有技术相比,本发明的有益效果是:

本发明使用多模块对涉案数据库、数据表、字段、数据定义注释进行按人、按日期、按名称、按组织、按人员关系进行人员基本信息分类统计、资金出入统计、资金往来统计,推断实际涉案团伙类型,并依据对应罪名侦察研判起诉需要,将所需涉案信息进行整合,提取和展示,解决互联网犯罪侦查活动中对涉案数据库的侦察活动中涉案数据库表格众多,字段含义不明,错误,互相冲突,数据内容往往多达几百GB,备份数据与在运行系统数据重叠冲突,无效流水数据过多等问题,并能够综合字段名称和注释,结合字段内容,对涉嫌犯罪类型进行研判,根据研判结果自动化提取涉案信息,能够有效提高网络传销、网络集资诈骗、网络赌博等互联网犯罪案件中涉案数据库的侦查研判取证速度,在当前互联网犯罪案件中犯罪分子往往犯罪全过程仅需数月的形势下,有效解决了犯罪团伙连续快速作案无法打击的问题。

附图说明

图1为本发明的提取涉案信息方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明公开了一种在调取互联网犯罪数据库提取涉案信息方法,包括涉案类型数据含义匹配模块、涉案类型数据统计模块、团队类型推断模块和涉案信息整合提取展示模块;

其中涉案类型数据含义匹配纠错模块包括:

对涉案数据库中数据表字段值根据其数据特征匹配各类公民个人信息如手机号,身份证号,银行卡号,第三方支付接口类型,对数据字段注释含义和数据特征匹配类型进行比对,确认是否存在错误注释情况。

对存在时间戳的数据进行数据时间区间对应,对同一时间区间内产生的同类型数据进行基于时间戳的比对和确认,根据是否存在错误注释和语义分析只保留一个更接近字段实际数据特征的关键字。

对于表名称存在较长相同子串,或差异仅为日期字符串的表,比较其数据库字段类型和注释,判断主表与备份表,对表格内容进行合并,对表格名,表格字段注释进行比对确认,根据是否存在错误注释和语义分析保留一个更接近字段实际表特征的表名称。

其中涉案类型数据统计模块包括:

根据表名称和关键字等数据含义结合已办结案件统计和计算结果,以已保存例案表结构同类表在涉案数据中对应表的表名称和注释进行逐个比较并计算曼哈顿距离,确认相似度最高的案件类型。

其中团队类型推断模块包括:

结合犯罪类型筛选相关包含涉案数据表字段对已确认类型数据库进行人员基本信息分类统计、资金出入统计、资金往来统计,并根据已确认主表和备份表时间区间对于重复计算部分进行去重。

其中涉案信息整合提取展示模块包括:

将符合例库中模式的已筛选数据根据例案中犯罪团伙相关信息,犯罪模式运转关键参数如传销分成比例,集资诈骗入门费用,团队管理奖金比例等进行标注并展示,然后将包含公民个人信息条数计数值情况进行排序并逐个展示,供犯罪侦查部门使用。

已办结案件数据将会被重上传至案件例库,供后续分析使用。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

技术分类

06120116106530