掌桥专利:专业的专利平台
掌桥专利
首页

一种跨网络涉诈关联分析方法、系统及计算机存储介质

文献发布时间:2023-06-19 09:49:27


一种跨网络涉诈关联分析方法、系统及计算机存储介质

技术领域

本申请涉及网络领域,特别是涉及一种跨网络涉诈关联分析方法、系统及计算机存储介质。

背景技术

随着网络的飞速发展以及社会信息化程度的逐步提高,电信网络诈骗事件不断出现,诈骗方式更加隐蔽,诈骗手法不断翻新。诈骗形式也由利用语音短信等传统诈骗转变为利用社会热点和行业漏洞,借助电信网、互联网等多种方式实施的新型诈骗。现有诈骗手段多涉及跨领域的方式,比如利用手机号码注册互联网账号,用互联网的方式进行诈骗行为等。而当前的诈骗检测主要是针对单一网络,例如在电信网络中监测与涉诈电话号码相关的短信、通话、网址信息等信息;在互联网中检查与涉诈账号相关的文本、音频、图片视频等信息。由于不同网络的数据难以直接交互与共享,现阶段的反诈手段缺少电信网络和互联网的协同合作,因此难以准确判断跨电信网与互联网的诈骗事件。

现有技术的相关研究主要针对电信业务的通话、短信信息、互联网中网址银行账号等信息进行网络诈骗的初步判断,并不适用于跨领域的网络诈骗方式。另外,对于跨领域涉及手机号码和账号的关联分析方法,也不适用于电信网络诈骗的应用场景。

为此,工信部提出完善跨政企、跨行业、跨部门的联防联控工作机制的目标,希望充分利用大数据等技术手段,在电信网络诈骗治理方面发挥强大效能。因此,亟待设计一种联合电信网络和互联网的诈骗联合分析系统,以构建电信网络诈骗的安全防线。

发明内容

本发明的目的是从电信网络和互联网的数据中,完成对电信网络诈骗的深度挖掘和关联分析,构建跨网络的电信网络诈骗事件的安全防线。

基于此,第一方面,本发明提供了一种跨网络涉诈分析方法,其特征在于:

获取第一电话号码及其相关信息,对所述第一电话号码的相关信息进行整理与数据预处理,所述第一电话号码的相关信息包括通话信息、行为日志信息、短信信息,其中短信信息中还包括网址信息,所述第一电话号码为已确定涉诈的电话号码;

从所述第一电话号码的相关信息中提取关键词,关键词包括第二电话号码和/或第三互联网账号;

将提取的所述第二电话号码输入基于人工智能的电话信息反诈研判模块,所述基于人工智能的电话信息反诈研判模块获取所述第二电话号码的短信信息、行为日志信息、通话信息,综合分析判断所述第二电话号码是否涉诈,如果确定所述第二电话号码涉诈,则输入涉诈电话号码信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第二电话号码输入所述涉诈电话号码信息库;

将提取的所述第三互联网账号输入基于人工智能的互联网信息反诈研判模块,以判断所述第三互联网账号是否涉诈,如果属于涉诈互联网账号,输入涉诈互联网账号信息库,如果无法确定是否属于涉诈互联网账号,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第三互联网账号输入所述涉诈互联网账号信息库。

在一些实施例中,所述的方法,其进一步包括:获取第一互联网账号及其相关信息,对所述第一互联网账号的相关信息进行整理与数据预处理,所述第一互联网账号的相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息,所述第一互联网账号为已确认涉诈的互联网账号;

从所述第一互联网账号的相关信息中提取关键词,关键词包括第三电话号码和/或第二互联网账号;

将提取的第二互联网账号输入所述基于人工智能的互联网账号信息反诈研判模块,所述基于人工智能的互联网账号信息反诈研判模块获取所述第二互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息,通过综合分析以判断所述互联网账号是否涉诈,如果确定所述第二互联网账号涉诈,将所述第二互联网账号输入所述涉诈互联网账号信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第二互联网账号输入所述涉诈互联网账号信息库;

将提取的所述第三电话号码输入所述基于人工智能的电话信息反诈研判模块,以判断所述第三电话号码是否涉诈,如果确定所述第三电话号码涉诈,输入所述涉诈电话号码信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第三电话号码输入所述涉诈电话号码信息库。

在一些实施例中,所述的方法,其进一步包括:获取所述涉诈电话号码信息库中的第四涉诈电话号码及其相关信息,所述第四涉诈号码相关信息包括通话信息、行为日志信息、短信信息,同时获取所述涉诈互联网账号信息库中的第四涉诈互联网账号及其相关信息,所述第四涉诈互联网账号相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息;

将所述第四涉诈电话号码及其相关信息和所述第四涉诈互联网账号及其相关信息输入联合反诈研判模块,以判断是否属于跨网络涉诈,如果属于跨网络涉诈,则交由人工后续处置;

所述联合反诈研判模块包括联合反诈研判模型,其中获取已确定属于跨网络涉诈电话号码相关信息中的通话信息、行为日志信息、短信信息,以及获取已确定属于跨网络涉诈互联网账号相关信息中的文本信息、行为日志信息、音频信息、图像和视频信息作为训练数据集,通过涉诈电话号码与涉诈互联网账号之间的关联映射关系,对所述联合反诈模型进行训练。

在一些实施例中,所述的方法,其进一步包括:对所述第一电话号码的相关信息进行整理与数据预处理,包括采用自然语言处理技术将所述第一电话号码的短信信息转换为文本信息,并从中识别出网址信息,对网址信息进行内容解析和URL分析,对所述第一电话号码的行为日志进行关联分析,采用语音识别技术将所述第一电话号码的通话信息转换为文本信息;

和/或,对所述第一互联网账号的账号信息进行整理与数据预处理,包括采用自然语言处理技术对所述第一互联网账号的文本信息处理,采用语音识别技术将所述第一互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理,对所述第一互联网账号的行为日志信息采用关联分析技术,对所述第一互联网账号的图像和视频信息采用图像处理技术。

本发明还提供了一种跨网络反诈分析系统,所述系统包括电话网络反诈分析装置,互联网网络反诈分析装置和跨网络涉诈联合分析装置,所述电话网络反诈分析装置用于分析判断涉诈电话号码中是否包括新的涉诈电话号码和涉诈互联网账号,所述互联网网络反诈分析装置用于分析判断涉诈互联网账号中是否包括新的涉诈互联网账号和涉诈电话号码,所述跨网络涉诈联合分析装置对涉诈电话号码和涉诈互联网账号进行联合分析以判断是否属于跨网络涉诈,其中所述电话网络反诈分析装置包括:

电话号码预处理模块,获取第一电话号码及其相关信息,对所述第一电话号码的相关信息进行整理与数据预处理,所述第一电话号码的相关信息包括通话信息、行为日志信息、短信信息,其中短信信息中还包括网址信息,所述第一电话号码为已确定涉诈的电话号码;

第一提取模块,其用于从所述第一电话号码的相关信息中提取关键词,关键词包括第二电话号码和/或第三互联网账号;

基于人工智能的电话信息反诈研判模块,所述基于人工智能的电话信息反诈研判模块获取所述第二电话号码的短信信息、行为日志信息、通话信息,综合分析判断所述第二电话号码是否涉诈,如果确定所述第二电话号码涉诈,输入涉诈电话号码信息库,如果无法确定是否涉诈,则可由人工辅助研判如果人工辅助研判为涉诈,则将所述电话号码输入所述涉诈电话号码信息库;

第一发送模块,将提取的所述第三互联网账号输入基于人工智能的互联网信息反诈研判模块,以判断所述第三互联网账号是否涉诈,如果属于涉诈互联网账号,输入涉诈互联网账号信息库,如果无法确定是否属于涉诈互联网账号,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第三互联网账号输入所述涉诈互联网账号信息库;

涉诈电话号码信息库,存储第一电话号码和确定涉诈的第二电话号码。

在一些实施例中,所述互联网网络反诈分析装置包括:

互联网账号预处理模块,其获取第一互联网账号及其相关信息,对所述第一互联网账号的相关信息整理与数据预处理,所述第一互联网账号的相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息,所述第一互联网账号为已确认涉诈的互联网账号;

第二提取模块,其从所述第一互联网账号的相关信息中提取关键词,关键词包括第三电话号码和/或第二互联网账号;

基于人工智能的互联网账号信息反诈研判模块,其获取所述第二互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息,通过综合分析以判断所述互联网账号是否涉诈,如果确定所述第二互联网账号涉诈,将所述第二互联网账号输入涉诈互联网账号信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第二互联网账号输入所述涉诈互联网账号信息库;

第二发送模块,将提取的所述第三电话号码发送给基于人工智能的电话信息反诈研判模块,以判断第三所述电话号码是否涉诈,如果确定所述电话号码涉诈,输入涉诈电话号码信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第三电话号码输入涉诈电话号码信息库;

涉诈互联网账号信息库,存储第一互联网账号和确定涉诈的第二互联网账号。

在一些实施例中,所述跨网络涉诈联合分析装置包括:

获取模块,获取所述涉诈电话号码信息库中的第四涉诈电话号码及其相关信息,所述第四涉诈电话号码相关信息包括通话信息、行为日志信息、短信信息,和获取所述涉诈互联网账号信息库中的第四涉诈互联网账号及其相关信息,所述第四涉诈互联网账号相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息;

联合反诈研判模块,其对输入的所述第四涉诈电话号码及其相关信息和所述第四涉诈互联网账号及其相关信息进行综合分析,以判断是否属于跨网络涉诈,如果确定属于跨网络涉诈,则交由人工后续处置;

所述联合反诈研判模块包括联合反诈研判模型,其中获取已确定属于跨网络涉诈电话号码相关信息中的通话信息、行为日志信息、短信信息,以及获取已确定属于跨网络涉诈互联网账号相关信息中的文本信息、行为日志信息、音频信息、图像和视频信息作为训练数据集,通过涉诈电话号码与涉诈互联网账号之间的关联映射关系,对所述联合反诈研判模型进行训练。

在一些实施例中,所述的系统进一步包括:所述电话号码预处理模块包括第一处理模块,其采用自然语言处理技术将所述短信信息转换为文本信息,并从中识别出网址信息,对网址信息进行内容解析和URL分析,第二处理模块,其对所述行为日志进行关联分析,第三处理模块,其采用语音识别技术将所述通话信息转换为文本信息;

和/或,所述互联网账号预处理模块包括第一预处理模块,其采用自然语言处理技术对所述第一互联网账号的文本信息处理,第二预处理模块,其采用语音识别技术将所述第一互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理,第三预处理模块,其对所述第一互联网账号的行为日志信息采用关联分析技术,第四预处理模块,其对所述第一互联网账号的图像和视频信息采用图像处理技术。

本发明还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述方法。

本发明实施例提供的技术方案带来的有益效果是:

通过对涉诈电话号码的相关信息和涉诈互联网账户的相关信息的进一步深入挖掘,找出关联的涉诈电话号码或是涉诈互联网账号的相关信息,并结合电话网络和互联网信息进行关联分析,深度挖掘跨领域数据之间的潜在联系,从而实现跨领域电信网络诈骗事件的识别和判断。通过本发明将跨领域的数据联系起来,可以提升电信网络诈骗事件的事前预防的准确性,强化事中的拦截能力,改善事后溯源获得可靠取证链。

附图说明

在不一定按比例绘制的附图中,相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。

图1示出了跨网络涉诈分析系统的跨网络涉诈分析方法的流程示意图;

图2a示出了电话网络反诈分析装置的结构示意图;

图2b示出了电话网络反诈分析装置的结构示意图;

图2c示出了跨网络涉诈联合分析装置的结构示意图;

图3a示出了基于人工智能的电话信息反诈研判模块的反诈研判方法的流程示意图;

图3b示出了基于人工智能的电话信息反诈研判模块的结构示意图;

图4a示出了基于人工智能的互联网信息反诈研判模块的反诈研判方法的流程示意图;

图4b示出了基于人工智能的互联网信息反诈研判模块的结构示意图;

图5a示出了电话网络反诈分析装置的电话号码预处理模块的结构示意图;

图5b示出了互联网网络反诈分析装置的互联网账号预处理模块的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。

请参考图1,其示出了根据本发明提供的跨网络涉诈分析方法的一个实施例的示意性流程。

本实施例的跨网络涉诈分析方法用于对跨网络的诈骗信息进行关联分析,从而构建网络诈骗的安全防线,所述跨网络的定义可以包括电信网络、移动网络或是联通网络等涉及的电话通信网络和互联网之间的跨网络诈骗信息联合分析,比如电话诈骗事件为使得诈骗方式变得更加隐蔽,利用电话号码注册互联网账号,从而改用互联网的方式进行诈骗行为,或是通过电话网络和互联网联合进行诈骗行为等。

跨网络涉诈分析系统包括电话网络反诈分析装置、互联网网络反诈分析装置和跨网络涉诈联合分析装置。

具体流程如下:

参考图1,电话网络反诈分析装置的操作流程包括以下步骤:

步骤S01:获取第一电话号码及相关信息,并对所述第一电话号码的相关信息进行整理与数据预处理,所述第一电话号码为已确定的涉诈电话号码。其中电话号码包括固定电话号码、手机电话号码、数字电话号码等常见形式的电话号码,已确定的涉诈电话号码可以从电信网络、移动网络、联通网络等相应电话通信网络平台或是其他与上述平台具有合作关系的网络平台或是网络公安平台等通过各种现有技术标引或标记过的涉嫌诈骗的电话号码信息中获取。

所述第一涉诈电话号码的相关信息包括通话信息、行为日志信息、短信信息,其中短信信息中还包括网址信息。

其中在所述第一电话号码相关信息的整理与数据预处理中,采用自然语言处理技术将所述第一电话号码的短信信息转换为文本信息,并从中识别出网址信息,对网址信息进行内容解析和URL分析。

对所述第一电话号码的行为日志进行关联分析。

采用语音识别技术将所述第一电话号码的通话信息转换为文本信息,再通过自然语言处理技术进一步处理。

步骤S02:从所述第一电话号码的相关信息中提取关键词,关键词包括第二电话号码和/或第三互联网账号,当提取的关键词是第二电话号码时,进入步骤S03,将所述第二电话输入基于人工智能的电话信息反诈研判模块,当提取的关键词是互联网账号时,进入步骤S13,将所述第三互联网账号输入互联网反诈分析系统的基于人工智能的互联网信息反诈研判模块。

其中可以根据已有设计的规则或模板提取涉诈手机号码的相关信息中的手机号码和互联网账号等信息。

步骤S03:将提取的所述第二电话号码输入基于人工智能的电话信息反诈研判模块,以判断所述第二电话号码是否涉诈,如果确定所述第二电话号码涉诈,则进入步骤S04,输入涉诈电话号码信息库,并提交给相关单位处理。如果无法确定是否涉诈,则进入步骤S05,进行人工辅助研判,如果人工辅助研判或内部处置确定为涉诈,则进入步骤S04,将所述电话号码输入涉诈电话号码信息库,并提交给相关单位处理。如果确定第二电话号码不涉诈,则重新进入其他涉诈电话号码的相关处理。

如图3a所示,步骤S03进一步包括:

步骤S031:所述基于人工智能的电话信息反诈研判模块获取所述第二电话号码的短信信息、行为日志信息、通话信息,并进行整理与预处理。

其中在所述第二电话号码相关信息的整理与数据预处理中,采用自然语言处理技术将所述第二电话号码的短信信息转换为文本信息,并从中识别出网址信息,对网址信息进行内容解析和URL分析;对所述第二电话号码的行为日志进行关联分析;采用语音识别技术将所述第二电话号码的通话信息转换为文本信息,再通过自然语言处理技术进一步处理。

步骤S032:通过对所述第二电话号码相关信息的综合分析以判断所述电话号码是否存在网络诈骗行为。通过电话号码的相关信息综合分析所述电话号码是否存在网络诈骗行为的相关技术采用现有技术。

步骤S04:输入涉诈电话号码信息库,并提交给相关单位处理。

步骤S05:进行人工辅助研判。

步骤S13:将提取的所述第三互联网账号发送给基于人工智能的互联网信息反诈研判模块,以判断所述第三互联网账号是否涉诈,如果属于涉诈互联网账号,则进入步骤S14,输入涉诈互联网账号信息库,并提交给相关单位处理,如果无法确定是否属于涉诈互联网账号,则进入步骤S15,进行人工辅助研判,如果人工辅助研判确定为涉诈,则进入步骤S14,则将所述第三互联网账号输入涉诈互联网账号信息库,并提交给相关单位处理,如果确定所述第三互联网账号不涉诈,则重新进入其他涉诈互联网账号的相关处理。

基于人工智能的互联网信息反诈研判模块获取所述第三互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息,通过综合分析以判断所述第三互联网账号是否存在网络诈骗行为。

其中所述基于人工智能的互联网信息反诈研判模块采用自然语言处理技术对所述第三互联网账号的文本信息进行处理;采用语音识别技术将所述互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理;对所述互联网账号的行为日志信息采用关联分析技术;对所述第三互联网账号的图像和视频信息采用图像处理技术。

参考图1,互联网网络反诈分析装置的操作流程包括如下步骤:

步骤S11:获取第一互联网账号及相关信息,并对所述第一互联网账号的相关信息进行整理与数据预处理,所述第一互联网账号为已确认涉诈的互联网账号,所述相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息。已确定的涉诈互联网账号可以通过各种互联网网络平台或是网络公安平台等通过各种现有技术标引或标记过的涉嫌诈骗的互联网账号信息中获取。

采用自然语言处理技术对所述第一互联网账号的文本信息处理。

采用语音识别技术将所述第一互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理。

对所述第一互联网账号的行为日志信息采用关联分析技术。

对所述第一互联网账号的图像和视频信息采用图像处理技术。

步骤S12:从所述第一互联网账号的相关信息中提取关键词,关键词包括第三电话号码和/或第二互联网账号,当提取的关键词是所述第二互联网账号时,进入步骤S13,将所述第二互联网账号输入基于人工智能的互联网信息反诈研判模块,当提取的关键词是所述第三电话号码时,进入步骤S03,将所述第三电话号码输入基于人工智能的电话信息反诈研判模块。

其中可以根据已有设计的规则或模板提取涉诈互联网账号的相关信息中的手机号码和互联网账号等信息。

步骤S13,将提取的第二互联网账号输入基于人工智能的互联网账号信息反诈研判模块,以判断所述第二互联网账号是否涉诈,如果确定所述第二互联网账号涉诈,则进入步骤S14,将所述第二互联网账号输入涉诈互联网账号信息库,并提交给相关单位处理,如果无法确定是否涉诈,则进入步骤S15,由人工辅助研判,如果人工辅助研判确定为涉诈,则进入步骤S14,将所述第二互联网账号输入涉诈互联网账号信息库,并提交给相关单位处理,如果确定所述第二互联网账号不涉诈,则重新进入其他涉诈互联网账号的相关处理。

如图4a所示,步骤S13进一步包括:

步骤S131:所述基于人工智能的互联网信息反诈研判模块获取所述第二互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息,进行整理与预处理。

在对所述第二互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息进行整理与预处理中,采用自然语言处理技术对所述第二互联网账号的文本信息进行处理;采用语音识别技术将所述第二互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理;对所述第二互联网账号的行为日志信息采用关联分析技术;对所述第二互联网账号的图像和视频信息采用图像处理技术。

步骤S132:通过对第二互联网账号的的文本信息、行为日志信息、音频信息、图像和视频信息进行综合分析以判断所述第二互联网账号是否存在网络诈骗行为。通过互联网账号的相关信息综合分析所述互联网账号是否存在网络诈骗行为的相关技术采用现有技术。

步骤S14:将所述第二互联网账号输入涉诈互联网账号信息库。

步骤S15:进行人工辅助研判。

步骤S03:将提取的第三电话号码输入基于人工智能的电话信息反诈研判模块,以判断所述电话号码是否涉诈,如果确定所述第三电话号码涉诈,则进入步骤S04,将所述第三电话号码输入涉诈电话号码信息库,并提交给相关单位处理,如果无法确定是否涉诈,则进入步骤S05,进行人工辅助研判,如果人工辅助研判确定为涉诈,则进入步骤S04,将所述第三电话号码输入涉诈电话号码信息库,并提交给相关单位处理,如果确定所述第三电话号码不涉诈,则重新进入其他涉诈电话号码的相关处理。

所述基于人工智能的电话信息反诈研判模块获取所述第三电话号码的短信信息、行为日志信息、通话信息,通过综合分析以判断所述第三电话号码是否存在网络诈骗行为。

其中所述基于人工智能的电话信息反诈研判模块采用自然语言处理技术将所述第三电话号码的短信信息转换为文本信息,并从中识别出网址信息,对网址信息进行内容解析和URL分析;对所述电话号码的行为日志进行关联分析;采用语音识别技术将所述电话号码的通话信息转换为文本信息,再通过自然语言处理技术进一步处理。

上述涉诈电话号码信息库存入确认涉诈的第一电话号码、第二电话号码和第三号码,上述涉诈互联网账号信息库存入确认涉诈的第一互联网账号、第二互联网账号、第三互联网账号,并将上述涉诈电话号码和涉诈互联网账号输入后续的跨网络涉诈联合分析装置进行跨网络涉诈联合分析。

参考图1,跨网络涉诈联合分析装置的操作流程包括如下步骤:

S21:获取涉诈电话号码信息库的涉诈电话号码及其相关信息,所述电话号码相关信息包括通话信息、行为日志信息、短信信息,同时获取涉诈互联网账号信息库的涉诈互联网账号及其相关信息,所述互联网账号相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息。

S22:将所述涉诈电话号码及其相关信息和所述涉诈互联网账号及其相关信息输入联合反诈研判模块,以判断是否属于跨网络联合诈骗行为,如果确定属于跨网络联合诈骗行为,则交由人工辅助研判并交由相关部门处置以进行后续处理。

所述联合反诈研判模块包括联合反诈研判模型,通过获取已确定属于跨网络联合诈骗行为的涉诈电话号码及其相关信息中的通话信息、行为日志信息、短信信息,以及获取已确定属于跨网络联合诈骗行为的互联网账号及其相关信息中的文本信息、行为日志信息、音频信息、图像和视频信息作为训练数据集,通过涉诈电话号码与涉诈互联网账号之间的关联映射关系,对联合反诈研判模型进行训练。

图2示出了根据本发明提供的跨网络涉诈联合分析平台的一个实施例的示意性结构。

如图2所示,本实施例提供的跨网络涉诈联合分析系统100包括电话网络反诈分析装置101、互联网网络反诈分析装置102和跨网络涉诈联合分析装置103。

其中在本发明的实施例中,电话网络反诈分析装置101包括:

电话号码预处理模块111,获取第一电话号码,对所述第一电话号码的相关信息进行整理与数据预处理,所述第一涉诈电话号码的相关信息包括通话信息、行为日志信息、短信信息,其中短信信息中还包括网址信息,所述第一电话号码为已确定涉诈的电话号码;

在本实施例的一个可选实现方式中,如图5a所示,所述电话号码预处理模块111可以包括第一处理模块1111,其采用自然语言处理技术将所述短信信息转换为文本信息,并从中识别出网址信息,并对网址信息进行内容解析和URL分析;第二处理模块1112,其对所述行为日志进行关联分析;包括第三处理模块1113,其采用语音识别技术将所述通话信息转换为文本信息,再通过自然语言处理技术进一步处理。

第一提取模块112,其用于从所述第一涉诈电话号码的相关信息中提取关键词,关键词包括第二电话号码和/或第三互联网账号;

基于人工智能的电话信息反诈研判模块113,其获取来自关键词提取模块的所述第二电话号码及其相关信息,综合分析判断所述第二电话号码是否涉诈,如果确定所述第二电话号码涉诈,输入涉诈电话号码信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述电话号码输入涉诈电话号码信息库。

在本实施例的一个可选实现方式中,如图3b所示,所述基于人工智能的电话信息反诈研判模块113包括第一信息分析模块1131,其采用自然语言处理技术将所述第二电话号码的短信信息转换为文本信息,并从中识别出网址信息,并对网址信息进行内容解析和URL分析;对所述第二电话号码的行为日志进行关联分析;采用语音识别技术将所述第二电话号码的通话信息转换为文本信息,再通过自然语言处理技术进一步处理;第一判断模块1132,其通过获取所述第二电话号码的短信信息、行为日志信息、通话信息,通过综合分析以判断所述第二电话号码是否存在网络诈骗行为。通过电话号码的相关信息综合分析所述电话号码是否存在网络诈骗行为的相关技术采用现有技术。

第一发送模块114,将提取的第三互联网账号输入基于人工智能的互联网信息反诈研判模块123,以判断所述第三互联网账号是否涉诈,如果属于涉诈互联网账号,输入涉诈互联网账号信息库125,如果无法确定是否属于涉诈互联网账号,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第三互联网账号输入涉诈互联网账号信息库125;

涉诈电话号码信息库115,存储第一电话号码和确定涉诈的第二电话号码。

其中在本发明的实施例中,互联网网络反诈分析装置102包括:

互联网账号预处理模块121,获取第一互联网账号,对所述第一互联网账号的相关信息整理与数据预处理,所述相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息,所述第一互联网账号为已确认涉诈的互联网账号。

在本实施例的一个可选实现方式中,如图5b所示,所述互联网账号预处理模块121包括第一预处理模块1211,其采用自然语言处理技术对所述第一互联网账号的文本信息处理;第二预处理模块1212,其采用语音识别技术将所述第一互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理;第三预处理模块1213,其对所述第一互联网账号的行为日志信息采用关联分析技术;第四预处理模块1214,其对所述第一互联网账号的图像和视频信息采用图像处理技术。

第二提取模块122,从所述第一互联网账号的相关信息中提取关键词,关键词包括第三电话号码和/或第二互联网账号。

基于人工智能的互联网账号信息反诈研判模块123,判断提取的第二互联网账号是否涉诈,如果确定所述第二互联网账号涉诈,将所述第二互联网账号输入涉诈互联网账号信息库,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第二互联网账号输入涉诈互联网账号信息库。

在本实施例的一个可选实现方式中,如图4b所示,基于人工智能的互联网账号信息反诈研判模块123进一步包括:

第二信息分析模块1231:获取所述第二互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息,进行整理与预处理。在对所述第二互联网账号的文本信息、行为日志信息、音频信息、图像和视频信息进行整理与预处理中,采用自然语言处理技术对所述第二互联网账号的文本信息进行处理;采用语音识别技术将所述第二互联网账号的音频信息处理为文本信息,再通过自然语言处理技术进一步处理;对所述第二互联网账号的行为日志信息采用关联分析技术;对所述第二互联网账号的图像和视频信息采用图像处理技术。

第二判断模块1232:通过对第二互联网账号的的文本信息、行为日志信息、音频信息、图像和视频信息进行综合分析以判断所述第三互联网账号是否存在网络诈骗行为。通过互联网账号的相关信息综合分析所述互联网账号是否存在网络诈骗行为的相关技术采用现有技术。

第二发送模块124,将提取的第三电话号码发送给基于人工智能的电话信息反诈研判模块,以判断所述第三电话号码是否涉诈,如果确定所述第三电话号码涉诈,输入涉诈电话号码信息库115,如果无法确定是否涉诈,则可由人工辅助研判,如果人工辅助研判为涉诈,则将所述第三电话号码输入涉诈电话号码信息库115。

涉诈互联网账号信息库125,存储第一互联网账号和确定涉诈的第二互联网账号。

在本发明的实施例中,跨网络涉诈联合分析装置103包括:

获取模块131,获取来自电话网络反诈分析装置的涉诈电话号码信息库115中的涉诈电话号码及其相关信息,所述涉诈电话号码相关信息包括通话信息、行为日志信息、短信信息,和获取来自互联网反诈分析装置的涉诈互联网账号信息库125中的涉诈互联网账号及其相关信息,所述涉诈互联网账号相关信息包括文本信息、行为日志信息、音频信息、图像和视频信息。

联合反诈研判模块132,其对输入的所述涉诈电话号码及其相关信息和所述涉诈互联网账号及其相关信息进行综合分析,以判断是否属于跨网络涉诈,如果确定属于跨网络涉诈,则交由人工辅助研判并交由相关部门处置。

在本实施例的一个可选实现方式中,所述联合反诈研判模块132包括联合反诈研判模型,其中获取已确定属于跨网络涉诈电话号码相关信息中的通话信息、行为日志信息、短信信息,以及获取已确定属于跨网络涉诈互联网账号相关信息中的文本信息、行为日志信息、音频信息、图像和视频信息作为训练数据集,通过涉诈电话号码与涉诈互联网账号之间的关联映射关系,对联合反诈研判模型进行训练。

通过本发明,可以将电信网、互联网领域的数据进行关联分析,深度挖掘跨领域数据之间的潜在联系,从而实现跨领域电信网络诈骗事件。本发明坚持数据融合,能完善资源融合、监测精准度、高效管控新型电信网络诈骗事件,同时本发明坚持数据共享,完善跨政企、跨行业、跨部门的联防联控的工作机制。通过本发明将跨领域的数据联系起来,可以提升电信网络诈骗事件的事前预防的准确性,强化事中的拦截能力,改善事后溯源获得可靠取证链。

应当理解,上述示例的跨网络涉诈分析系统100的结构仅为本发明实施例提供的一个例子,并且,跨网络涉诈分析系统100所包括的电话网络反诈分析装置101、互联网网络反诈分析装置102和跨网络涉诈联合分析装置103可具有比示出的部件更多或更少的部件,可以组合两个或更多个部件,或者可具有部件的不同配置实现。

结合本发明实施例公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器(英文:Random Access Memory,RAM)、闪存、只读存储器(英文:Read Only Memory,ROM)、可擦除可编程只读存储器(英文:ErasableProgrammable ROM,EPROM)、电可擦可编程只读存储器(英文:Electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。

以上对本发明的实施例进行了描述。但是这些实施例仅仅是为了说明的目的,而并非为了限制本发明的范围。本发明的范围由所附权利要求及其等价物限定。不脱离本发明的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本发明公开的范围之内。

相关技术
  • 一种跨网络涉诈关联分析方法、系统及计算机存储介质
  • 一种跨网络涉诈关联分析方法、系统及计算机存储介质
技术分类

06120112316153