掌桥专利:专业的专利平台
掌桥专利
首页

信息处理方法、装置、介质和设备

文献发布时间:2023-06-19 10:38:35


信息处理方法、装置、介质和设备

技术领域

本说明书一个或多个实施例涉及数据处理技术领域,尤其涉及一种信息处理方法、装置、介质和设备。

背景技术

近年来,我国涉毒人群趋势上增引起各方忧虑。公安部现阶段仅仅掌握少部分显性涉毒人员的信息,针对隐性涉毒人员的信息确实少之又少。现阶段,社会已经网络化,人们的日常生活时刻都离不开与网络打交道,每个人的一言一行都会形成一系列的数据。在这种背景下,通过配置数据碰撞和机器学习算法模型获取有用的信息变得尤为重要。

全国很多地区存在涉毒人员管控难的问题,从根本原因来说,是吸毒人员自身的特点和现代化社会人员的流动性决定的,特别作为内地因经济差别而大量人员外出务工,管控尤其困难。为了解决以上问题,在当前的大数据+AI的背景下,运用大数据分析思维,建立涉毒人员管控模型就成为情报维稳的重点研究方向,只有在低密的、有限的数据条件下,最大程度发挥AI的科技成果,用技术来有效缓解一线维稳的压力和提高精准性。

因此如何预测并推荐隐性的涉毒人员信息,如何根据涉毒人员的网络信息,获取与其联系人员的数据,从而找出公安未掌握潜在的嫌疑人员信息,是业内亟需解决的问题。

发明内容

有鉴于此,本说明书一个或多个实施例的目的在于提出一种信息处理方法、装置、介质和设备,以解决目前对于潜在的涉毒人员的管控精度不高的问题。

基于上述目的,本说明书一个或多个实施例提供了一种信息处理方法,包括:

根据涉毒人员的身份标识获取与所述涉毒人员有关的关联信息,所述涉毒人员的身份标识具有唯一性;

按照预设的智能算法对所述关联信息进行统计分析,得到分析结果,并根据分析结果构建疑似人员的关系图谱;

根据所述关系图谱确定疑似人员的身份标识,并输出存在涉毒行为的疑似人员名单。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述按照预设的智能算法对所述关联信息进行统计分析,得到分析结果,并根据分析结果构建疑似人员的关系图谱,包括:

对所述关联信息进行二元分类和逻辑回归分类,并采用机器学习算法进行分析,包括:

确定最优目标函数:

其中,z指线性函数,g(z)为最后输出样本类别的概率值,当设置阈值为0.5时,g(z)大于等于0.5的结果为1,小于0.5的结果为0;

分类后,确定最优的线性函数模型:

其中,x为输入的涉及人员的身份标识,θ为x的最优参数,T为参数矩阵;

将所述公式(1)和公式(2)进行结合,以构造预测函数并确定损失函数:

P(y|x;θ)=(h

其中,P为样本数据的概率值,

确定对数似然函数:

公式(5)返回输入样本数据的类别1或0,其中1表示疑似人员,0 为非疑似人员。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述关联信息包括:

涉毒人员的手机信息、微信信息、QQ信息、上网人员信息、铁路网信息以及住宿信息中的至少一种。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述方法还包括:

根据所述涉毒人员的关联信息,与选定的非涉毒人员的关联信息进行关联碰撞;

根据碰撞结果,输出存在涉毒行为的疑似人员名单。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述根据所述涉毒人员的关联信息,与选定的非涉毒人员的关联信息进行关联碰撞,包括:

从所述涉毒人员的关联信息确定与所述涉毒人员有关的非涉毒人员的身份标识,并根据所述身份标识确定有关的非涉毒人员的关联信息;

对所述有关的非涉毒人员的关联信息进行进行关联碰撞,以得到疑似人员的重要特征,所述关联碰撞至少包括对各关联信息的并集、交集、差集、偏差以及数据清洗中的一种。

结合上述说明,在本发明实施例另一种可能的实施方式中,所述方法还包括:

结合所述疑似人员的关联碰撞结果以及所述疑似人员活跃度较高的关联信息,确定所述疑似人员的危险程度是否大于危险阈值;

当所述疑似人员的危险程度大于危险阈值时触发警报信息,并向内网发送所述警报。

第二方面,本发明还提供了一种信息处理装置,所述装置包括:

信息采集模块,用于根据涉毒人员的身份标识获取与所述涉毒人员有关的关联信息,所述涉毒人员的身份标识具有唯一性;

统计分析模块,用于按照预设的智能算法对所述关联信息进行统计分析,得到分析结果,并根据分析结果构建疑似人员的关系图谱;

输出展示模块,用于根据所述关系图谱确定疑似人员的身份标识,并输出存在涉毒行为的疑似人员名单。

上述的装置,所述装置还包括:

碰撞模块,用于根据所述涉毒人员的关联信息,与选定的非涉毒人员的关联信息进行关联碰撞;以及

根据碰撞结果,输出存在涉毒行为的疑似人员名单。

第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的信息处理方法。

第四方面,本发明还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述的信息处理方法。

从上面所述可以看出,本说明书一个或多个实施例提供的信息处理方法、装置、介质和设备,通过对涉毒信息的各类关联信息进行预设算法的综合分析,使得能够有效地提高对涉毒人员和涉毒人员群体的管控能力,满足社会对涉毒人员的要求;快速有效的提高查未掌握的涉毒人员的覆盖率,最大限度辅助抑制涉毒群体发生案事件;减少涉毒案件分析手工处理的工作量,减少涉毒人员信息漏管现象,极大降低警务人员工作成本及时间成本。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例的信息信息方法基本流程示意图;

图2为本说明书一个或多个实施例的关系图谱示意图;

图3为本说明书一个或多个实施例的信息处理装置基本示意图;

图4为本说明书一个或多个实施例的信息处理系统示意图;

图5为本说明书一个或多个实施例的电子设备结构示意图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。

需要说明的是,除非另外定义,本说明书一个或多个实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本说明书一个或多个实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。

本发明涉及一种信息处理方法、装置、介质和设备,其主要运用于需要对潜在涉毒人员进行综合分析的场景中,其基本思想是:通过预设算法对涉及人员的关联信息如交流信息、酒店信息及出行信息等进行综合分析,确定潜在涉毒人员的灰名单,并为公安机关提供有价值的社会安全信息,为抑制涉毒群体发生案事件提供辅助,且能够大幅减少涉毒案件分析手工处理的工作量,减少涉毒人员信息漏管现象,极大降低警务人员工作成本及时间成本。

需要说明的是,本说明书一个或多个实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本说明书一个或多个实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的信息处理方法。

需要说明的是,上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

图1为本发明示例性实施例的信息处理方法的基本流程图,结合图1 所示,本发明的信息处理方法,包括以下步骤:

在步骤110中,根据涉毒人员的身份标识获取与所述涉毒人员有关的关联信息,所述涉毒人员的身份标识具有唯一性;

所述涉毒人员的身份标识可以为涉毒人员的身份证号码,其具有唯一标识性,在特定的安全系统中,所述身份标识可以为经过掩层处理的一串字符,以使身份标识能够与特定的某一涉毒人员进行一一关联即可,即使其身份标识具有唯一性。

所述关联信息,一般为涉毒人员的手机信息、微信信息、QQ信息、上网人员信息、铁路网信息以及住宿信息中等,在综合分析中,其衣食住行相关信息均可作为所述关联信息,例如在购物网站购物时的送达地址、送达联系人、拨打电话的联系人、微信或QQ及其它类型的即时通讯软件的联系人、上网时其附近台机信息的使用人信息、住宿时酒店内其它住宿人员的身份信息等。

在步骤120中,按照预设的智能算法对所述关联信息进行统计分析,得到分析结果,并根据分析结果构建疑似人员的关系图谱;

所述预设的智能算法具体包括内容详见于以下对于数据的分类、归一、择优以及确定对数似然函数的过程。

在步骤130中,根据所述关系图谱确定疑似人员的身份标识,并输出存在涉毒行为的疑似人员名单。

对输出的分析结果进行解释,本发明示例性实施例的实施方式中,所述srcpackageid是系统内部对人员的唯一标识,公安内部电子专用标识,即所述身份标识,当非吸毒人员通过特征在机器学习中的输出概率(P)大于 0.5的,默认为此人是模型推荐的疑似涉毒人员,即预测值为1,输出概率 (P)小于0.5的,默认此人是非吸毒人员,不是模型推荐的结果,即预测值为0。

所述特征为针对于吸毒人员设定的数字标识,如吸毒人员与非吸毒人员相异的用户行为特征、用户行动轨迹、常去场所等均可作为特征进行机器学习。

更具体地,当一名吸毒人员的行动轨迹与另一名吸毒人员的行动轨迹完全相同时,则机器可确定该两名吸毒人员存在较大概率的复吸不法行为,又或多名吸毒人员经常多次同一商家购买同一种物品,则该商家可被机器判定为疑似吸毒人员或其它不法人员,等等。

对预测值为1的潜在涉毒人员进行名单编撰并形成灰名单输出,能够使有关机关或部门进行有针对性的安全维护工作。

本发明示例性实施例的一种实施方式中,所述按照预设的智能算法对所述关联信息进行统计分析,得到分析结果,并根据分析结果构建疑似人员的关系图谱,包括:

对所述关联信息进行二元分类和逻辑回归分类,并采用机器学习算法进行分析,包括:

确定最优目标函数:

其中,z指线性函数,g(z)为最后输出样本类别的概率值,当设置阈值为0.5时,g(z)大于等于0.5的结果为1,小于0.5的结果为0;

分类后,确定最优的线性函数模型:

其中,x为输入的涉及人员的身份标识,θ为x的最优参数,T为参数矩阵;

将所述公式(1)和公式(2)进行结合,以构造预测函数并确定损失函数:

P(y|x;θ)=(h

其中,P为样本数据的概率值,

确定对数似然函数:

公式(5)返回输入样本数据的类别1或0,其中1表示疑似人员,0 为非疑似人员。

本发明示例性实施例一种更具体的实施方式中,所述关联信息可为如下表1-表10中的信息:

表1

关联信息为手机信息时,其如下表2所示:

表2

关联信息为手机通讯录信息时,其如下表3所示:

表3

关联信息为手机通话纪录信息时,其如下表4所示:

表4

关联信息为手机微信信息时,其如下表5所示:

表5

关联信息为手机微信好友信息时,其如下表6所示:

表6

关联信息为手机微信成员表信息时,其如下表7所示:

表7

关联信息为手机QQ信息时,其如下表8所示:

表8

关联信息为手机QQ好友信息时,其如下表9所示:

表9

关联信息为手机QQ群成员信息时,其如下表10所示:

表10

关联信息为涉毒人员网吧上网信息时,其如下表11所示:

表11

关联信息为涉毒人员住宿信息时,其如下表12所示:

表12

关联信息为涉毒人员出行信息时,其如下表13所示:

表13

本发明示例性实施例的一种实施方式中,上述各类关联信息均可储存于数据存储器,在获取数据时可通过公安数据会按照不同警种存储的大数据环境获取。

本发明示例性实施例的一种实施方式中,根据所述涉毒人员的关联信息,与选定的非涉毒人员的关联信息进行关联碰撞;

所述关联碰撞为对吸毒人员相关的特征与非吸毒人员的相关特征进行关联后得到的碰撞结果,该碰撞结果可用于确定特定人员之间的似然概率,以最终根据该碰撞结果指引执法人员进行相应的执法活动。

根据碰撞结果,输出存在涉毒行为的疑似人员名单。

本发明示例性实施例的一种实施方式中,所述根据所述涉毒人员的关联信息,与选定的非涉毒人员的关联信息进行关联碰撞,包括:

从所述涉毒人员的关联信息确定与所述涉毒人员有关的非涉毒人员的身份标识,并根据所述身份标识确定有关的非涉毒人员的关联信息;

对所述有关的非涉毒人员的关联信息进行进行关联碰撞,以得到疑似人员的重要特征,所述关联碰撞至少包括对各关联信息的并集、交集、差集、偏差以及数据清洗中的一种。

经过关联碰撞之后得到的疑似人员信息包括如下表14所示:

表14

输出结果如表15所示:

表15

本发明示例性实施例的一种实施方式中,还包括对于疑似人员的危险警报信息的触发,这一过程包括:

结合所述疑似人员的关联碰撞结果以及所述疑似人员活跃度较高的关联信息,确定所述疑似人员的危险程度是否大于危险阈值;

当所述疑似人员的危险程度大于危险阈值时触发警报信息,并向内网发送所述警报。

本发明示例性实施例的一种实施方式中,关系图谱如图2所示,其可通过关系图谱展示装置进行展示,在获取涉毒人员的基础信息数据(涉毒人员基本信息),行为轨迹数据(铁路数据,住宿数据,上网数据)(以上数据见表11-表13),依据本发明的预设智能算法输出的高度疑似涉毒人员信息与涉毒人员联系频次(同乘车频次,同住宿频次,同上网频次),得出涉毒人员亲密关系人信息,形成疑似涉毒人员的关系图谱,图中居中为吸毒人员,箭头指向为与该吸毒人员存在关联的其它人员,根据箭头指向以及人员之间的关系,可对吸毒人员进行具体的关系网分析,且不同吸毒人员的关系图谱可进行结合,以便于进行进一步的关系分析。

本发明的方法,能够根据实际数据分析和工作经验,将大量的数据分析和情报平台数据结合起来,在分析数据过程中通过统计分析的方法描述涉毒人员个人特征、群体特征和行为特征,以得到未掌握的非人员有涉毒的嫌疑,并为是否是疑似涉毒人员提供准确的决策。

本发明示例性实施例还提供了一种信息处理装置,图3为本发明实施例提供的一种信息处理装置的结构示意图,该装置可由软件和/或硬件实现,一般地集成于智能终端中,可通过信息处理方法来实现。如图所示,本实施例可以以上述实施例为基础,提供了一种信息处理装置,其主要包括了信息采集模块310、统计分析模块320及输出展示模块330。

其中的信息采集模块310,用于根据涉毒人员的身份标识获取与所述涉毒人员有关的关联信息,所述涉毒人员的身份标识具有唯一性;

其中的统计分析模块320,用于按照预设的智能算法对所述关联信息进行统计分析,得到分析结果,并根据分析结果构建疑似人员的关系图谱;

其中的输出展示模块330,用于根据所述关系图谱确定疑似人员的身份标识,并输出存在涉毒行为的疑似人员名单。

更具体地,本发明的信息处理装置还可表述为图4所示的信息处理系统,图4中数据采集器1对应于信息采集模块310,涉毒分析器对应于上述的统计分析模块320,关系图谱展示器对应于上述的输出展示模块330,数据存储器用于储存采集得到的各类信息。

为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

上述实施例的装置用于实现前述任一实施例中相应的信息处理方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的信息处理方法。

图5示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit, ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM (Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等) 实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器 1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

上述实施例的电子设备用于实现前述任一实施例中相应的信息处理方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

基于同一发明构思,与上述任意实施例方法相对应的,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的信息处理方法。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的信息处理方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本说明书一个或多个实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC) 芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本说明书一个或多个实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本说明书一个或多个实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本说明书一个或多个实施例。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM)) 可以使用所讨论的实施例。

本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

相关技术
  • 图像处理设备以及图像处理方法,信息处理设备以及信息处理方法,信息记录设备以及信息记录方法,信息再现设备以及信息再现方法,记录介质和程序
  • 信息处理系统、信息处理方法、信息处理设备、信息处理设备控制方法、信息处理终端、信息处理终端控制方法、信息存储介质以及程序
技术分类

06120112622799