掌桥专利:专业的专利平台
掌桥专利
首页

一种用于对象分类的数据处理系统

文献发布时间:2024-04-18 19:58:53


一种用于对象分类的数据处理系统

技术领域

本发明涉及信息检索分类技术领域,特别是涉及一种用于对象分类的数据处理系统。

背景技术

随着城市经济的快速发展,对象的数量也随之增长,当对象数量过多时,需要对对象分类别的进行管控,有利于加强对象管理,现有技术中,进行对象分类时,对目标区域内指定的能够采集对象移动的定位信息的设备采集到的数据、能够采集到人物形象的设备采集到的数据或区域内登记的对象信息进行处理,将对象划分到设置好的对象类型中。

但是现有技术也存在以下技术问题:

无法对区域内所有能够采集到对象信息的设备采集到的数据进行处理,只能对指定的能够采集对象移动的定位信息的设备采集到的数据、能够采集到人物形象的设备采集到的数据或区域内登记的对象信息进行处理,并且区域内登记的对象信息具有滞后性,获取到的数据不够精准,因此,获取到的对象分类的范围较为广泛,降低了对象分类的精准度。

发明内容

针对上述技术问题,本发明采用的技术方案为:

一种用于对象分类的数据处理系统,包括:目标地理区域、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:

S100、获取目标地理区域对应的对象类型列表VA={VA

S200、获取VA对应的对象标识列表VB={VB

S300、获取VA对应的对象数量列表VC={VC

S400、根据VB和VC,获取VA对应的对象信息列表VD={VD

本发明至少具有以下有益效果:

本发明提供了一种用于对象分类的数据处理系统,包括:目标地理区域,第一地理区域,第二地理区域,第三地理区域、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标地理区域对应的对象类型列表;获取对象类型列表对应的对象标识列表;获取对象类型列表对应的对象数量列表;根据对象标识列表和对象数量,获取对象类型列表对应的对象信息列表。可知,本发明,设置多个范围较小的对象类型,对目标区域内所有能够采集到对象信息的设备采集到的数据以及登记的对象信息进行处理,获取目标区域内存在的对象标识以及对象标识对应的对象特征,对对象标识的对象特征进行处理,获取对象类型对应的对象标识和对象数量,有利于提高对象分类的精准度。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种用于对象分类的数据处理系统执行计算机程序的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的实施例提供了一种用于对象分类的数据处理系统,包括:目标地理区域、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤,如图1所示:

S100、获取目标地理区域对应的对象类型列表VA={VA

具体地,目标地理区域的范围为某一地理管理等级处于区级的地理区域的范围,例如:杭州市上城区。

进一步地,第一地理区域为目标地理区域对应的地理管理等级处于国家级的地理区域的范围内除目标地理区域对应的地理管理等级处于市级的地理区域范围以外的任一地理管理等级处于市级的地理区域的范围或目标地理区域对应的地理管理等级处于市级的地理区域的范围内任一地理管理等级处于县级的地理区域的范围,可以理解为,若目标地理区域为:杭州市上城区,那么第一地理区域为中国除杭州市以外的任意一个地理管理等级处于市级的地理区域的范围或杭州市内任意一个地理管理等级处于县级的地理区域的范围,例如:上海市、杭州市桐庐县。

进一步地,第二地理区域为除目标地理区域对应的地理管理等级处于国家级的地理区域的范围以外的其他任一地理管理等级处于国家级的地理区域的范围,可以理解为,若目标地理区域为:杭州市上城区,那么第一地理区域为除中国以外的任意一个地理管理等级处于国家级的地理区域的范围,例如:美国。

进一步地,第三地理区域为目标地理区域对应的地理管理等级处于市级的地理区域的范围内除目标地理区域以外的任一地理管理等级处于区级的地理区域的范围,可以理解为,若目标地理区域为:杭州市上城区,那么第三地理区域为杭州市除上城区以外的任意一个地理管理等级处于区级的地理区域的范围,例如:杭州市西湖区。

具体地,第一平台为官方认可的能够登记对象户籍信息的第三方平台,其中,本领域技术人员知晓,现有技术中任一能够登记对象户籍信息的第三方平台均属于本发明的保护范围,在此不再赘述。

具体地,第二平台为官方认可的能够登记流动对象信息的第三方平台,其中,本领域技术人员知晓,现有技术中任一能够登记流动对象信息的第三方平台均属于本发明的保护范围,在此不再赘述。

具体地,第三平台为官方认可的能够登记对象身份证信息的第三方平台,其中,本领域技术人员知晓,现有技术中任一能够登记对象身份证信息的第三方平台均属于本发明的保护范围,在此不再赘述。

具体地,第四平台为官方认可的能够登记出入境的外国对象信息的第三方平台,其中,本领域技术人员知晓,现有技术中任一能够登记出入境的外国对象信息的第三方平台均属于本发明的保护范围,在此不再赘述。

进一步地,第一注册信息为第一平台上的登记信息,第二注册信息为第一平台上的登记信息,第三注册信息为第三平台上的登记信息,第四注册信息为第四平台上的登记信息

进一步地,每一第一注册信息、第二注册信息、第三注册信息、第四注册信息均对应一个对象标识,其中,对象标识可以理解为身份证号。

S200、获取VA对应的对象标识列表VB={VB

具体地,每一对象标识列表中均包括若干个对象标识。

进一步地,每一对象标识均为对象的唯一身份标识。

具体地,在S200步骤中包括如下步骤:

S1、获取VA

具体地,va的取值范围为[1,30],其中,本领域技术人员知晓,本领域技术人员根据实际需求设置设置va的取值。

S2、获取VA

具体地,在S2步骤中通过如下步骤获取第一中间对象标识列表:

S21、获取目标地理区域对应的第一关键对象标识列表,第一关键对象标识列表包括若干个第一关键对象标识,第一关键对象标识为目标地理区域对应的第一平台上的任一第一注册信息对应的对象标识,其中,本领域技术人员知晓,现有技术中任一从注册信息中获取对象标识的方法均属于本发明的保护范围,在此不再赘述。

S22、获取目标地理区域对应的第二关键对象标识列表,第二关键对象标识列表包括若干个第二关键对象标识,第二关键对象标识为目标地理区域对应的第二平台上的任一第二注册信息对应的对象标识,其中,本领域技术人员知晓,获取第二关键对象标识列表的方式与获取第一关键对象标识列表的方式一致,在此不再赘述。

S23、获取目标地理区域对应的第三关键对象标识列表,第三关键对象标识列表包括若干个第三关键对象标识,第三关键对象标识为目标地理区域对应的第三平台上的任一第三注册信息对应的对象标识,其中,本领域技术人员知晓,获取第三关键对象标识列表的方式与获取第一关键对象标识列表的方式一致,在此不再赘述。

S24、获取目标地理区域对应的第四关键对象标识列表,第四关键对象标识列表包括若干个第四关键对象标识,第四关键对象标识为目标地理区域对应的第四平台上的任一第四注册信息对应的对象标识,其中,本领域技术人员知晓,获取第四关键对象标识列表的方式与获取第一关键对象标识列表的方式一致,在此不再赘述。

S25、获取目标地理区域对应的第五关键对象标识列表,第五关键对象标识列表包括若干个第五关键对象标识,第五关键标识为目标地理区域内任一能够采集对象标识的设备采集到的任一对象标识,其中,本领域技术人员知晓,现有技术中任一通过能够采集对象标识的设备获取所述设备采集到的对象标识的方法,均属于本发明的保护范围,在此不再赘述。

S26、将第一关键对象标识列表、第二关键对象标识列表、第三关键对象标识列表、第四关键对象标识列表以及第五关键对象标识列表中的对象标识插入到空的列表中并进行去重处理,获取第一中间对象标识列表,其中,本领域技术人员知晓,现有技术中任一去重的方法,均属于本发明的保护范围,在此不再赘述。

上述,对目标区域内所有能够采集到对象信息的设备采集到的数据以及登记的对象信息进行处理,精确的获取目标区域内存在的对象标识,根据对象标识获取对象特征,从而获取对象类型对应的对象标识和对象数量,有利于提高对象分类的精准度。

S3、获取VE

VF

呈现VE

具体地,在S3步骤中,包括如下步骤获取能够呈现第一中间对象的落脚点、居住地址和工作地址的文本:

获取目标对象对应的第一地址字符串列表A={A

具体地,所述目标对象为任意一个第一中间对象。

具体地,在获取目标对象对应的第一地址字符串列表步骤中包括如下步骤:

获取目标对象对应的预设地址文本列表D={D

获取D对应的文本标识列表P={P

根据P

具体地,在根据P

当P

具体地,标识“1”表征为:可作为居住地址。

当P

具体地,标识“2”表征为:可作为工作地址。

当P

具体地,标识“3”表征为:无法区分出居住地址或工作地址。

获取地址关系映射列表YS={YS

具体地,记录可以理解为列表中的一行数据。

获取D

当XS

当U

具体地,标识“4”表征为:可作为居住地址。

当U

具体地,标识“5”表征为:可作为居住地址。

上述,对预设地址文本对应的文本标识进行处理,确定第一地址文本和第二地址文本,当文本标识表征为无法区分出居住地址或工作地址时,将预设地址文本输入至预设关键词提取模型中,获取预设地址文本对应的第一关键词,并获取第一关键词与地址关系映射列表中的第二关键词的关键词相似度,当关键词相似度为1时,根据地址关系映射列表中的第二关键词标识,确定第一地址文本和第二地址文本,能够精准的确定出第一地址文本和第二地址文本,进而,能够精准的确定第一居住地址字符串和第一工作地址字符串,从而有利于提高获取目标地址字符串的精准度。

根据DY,获取A

具体地,在根据DY,获取A

获取DY对应的第一地址权重列表I={I

具体地,在获取DY对应的第一地址权重列表的步骤中包括如下步骤获取I

根据DY,获取DY对应的第一地址类型列表YL={YL

具体地,地址类型为户籍地址、现住地址、社保地址、教育地址、不动产地址等类型中的任一一种类型。

获取预设地址权重映射列表Q={Q

具体地,Q

获取YL

当YLQ

获取DY对应的第二地址权重列表I

具体地,在获取DY对应的第二地址权重列表的步骤中包括如下步骤:

获取DY对应的第一时间点列表R={R

根据R

I

根据I和I

I

确定最大的I

将第三地址文本输入到预设地图平台中,获取第三地址文本对应的第三地址坐标,第三地址坐标为第三地址文本在预设地图平台中的对应的位置的坐标,其中,本领域技术人员知晓,现有技术中任一能够获取文本对应的位置的坐标的地图平台均属于本发明的保护范围,在此不在赘述。

根据geohash8算法对第三地址坐标进行处理,获取A

上述,根据第一地址文本的第一地址类型,确定第一地址文本对应的第一地址权重,根据第一地址文本的登记时间,确定第一地址文本对应的第二地址权重,根据第一地址权重和第二地址权重,获取第一地址文本对应的第三地址权重,确定第三地址权重最高的第一地址文本为第三地址文本,将第三地址文本输入至地图中并根据geohash8算法进行处理,获取第一居住地址字符串,同理,获取第一工作地址字符串,能够筛选掉滞后的登记信息,选择更为准确的登记信息作为第一居住地址字符串和第一工作地址字符串,有利于提高获取目标地址字符串的精准度。

根据DE

上述,对预设地址文本以及预设地址文本对应的文本标识进行处理,获取第一地址文本和第二地址文本,对第一地址文本进行处理,将滞后的登记地址筛选掉,获取第一居住地址字符串,对第二地址文本进行处理,将滞后的登记地址筛选掉,获取第一工作地址字符串,进而,根据第一居住地址字符串和第二居住地址字符串获取目标居住地址字符串,根据第一工作地址字符串和第二工作地址字符串获取目标工作地址字符串,有利于提高获取目标地址字符串的精准度。

获取目标对象对应的第二地址字符串列表B={B

具体地,在获取目标对象对应的第二地址字符串列表的步骤中包括如下步骤获取B:

获取第一时间段列表T={T

具体地,n的取值范围为[25,35],其中,本领域技术人员知晓,本领域技术人员根据实际需求设置n的取值。

具体地,第一时间段为0:00-7:00和19:00-24:00。

根据T,获取B

具体地,在根据T,获取B

根据T,获取第四中间地址字符串簇L={L

具体地,轨迹数据源包括:探针、ETC和其他涉及到轨迹的数据的来源的平台。

具体地,在根据T,获取第四中间地址字符串簇的步骤中包括如下步骤:

根据T,获取T对应的第一中间地址字符串列表F={F

根据F,获取F对应的第一中间地址坐标列表G={G

根据geohash8算法对G

根据G

根据H

具体地,在根据H

获取H

根据M

N

当H

上述,对第一中间地址字符串进行处理,获取第一中间地址坐标和第二中间地址字符串,根据无监督聚类方法对第二中间地址字符串按照时间段和所属轨迹数据源进行聚类,获取第三中间地址字符串簇,根据第三中间地址字符串簇的数据量确定第四中间地址字符串簇,将数据量较少的簇筛选掉,有利于提高获取第二居住地址字符串的精准度,从而,有利于提高获取目标地址字符串的精准度。

根据L,获取L对应的第三地址字符串列表J={J

根据J

具体地,c=s。

根据K

具体地,在根据K

根据K

根据W

S

根据K

具体地,在根据K

根据K

根据Z

S

根据S

具体地,在根据S

当S中最大的S

当S中最大的S

S

获取最小值的函数,max()为获取最大值的函数。

上述,获取第四地址字符串列表的第一优先级和第二优先级,对第四地址字符串列表的第一优先级和第二优先级进行对比,确定第一关键地址字符串列表,将无需处理的轨迹数据筛选掉,对第一关键地址字符串列表中的每一第一关键地址字符串进行处理,能够精准的获取第二居住地址字符串,从而,有利于提高获取目标地址字符串的精准度。

确定最大的S

根据K

B

上述,根据第四中间地址字符串簇,获取第三地址字符串,进一步地,获取第四地址字符串列表,获取每一第四字符串列表对应的第一地址优先级和第二地址优先级,对第一地址优先级和第二地址优先级进行处理,确定第一关键地址字符串列表,将无需处理的轨迹数据筛选掉,对第一关键地址字符串列表中的每一第一关键地址字符串进行处理,能够精准的获取第二居住地址字符串,从而,有利于提高获取目标地址字符串的精准度。

获取第二时间段列表T

具体地,第二时间段为7:00-19:00。

根据T

上述,划分第一时间段和第二时间段,获取第一时间段内每一轨迹数据源上传的轨迹数据以及第二时间段内每一轨迹数据源上传的数据,采用相同的方式对第一时间段和第二时间段内的每一轨迹数据源上传的数据进行处理,将无需处理的轨迹数据筛选掉,获取第二地址字符串,有利于提高获取目标地址字符串的精准度。

具体地,在另一具体地实施例中,当n为7时,确定B

具体地,将目标对象的白天落脚点和夜晚落脚点作为能够呈现目标对象的落脚点的文本

根据A和B,获取目标对象对应的目标地址字符串列表C={C

具体地,在根据A和B,获取目标对象对应的目标地址字符串列表的步骤中包括如下步骤:

获取A

根据AB

具体地,在根据AB

当AB

具体地,AB

当AB

将最大的S

当S

具体地,在另一具体地实施例中,在将最大的S

当S

当NL≤16或NL≥60时,确定目标对象的户籍地址为C

当NL∈(16,60)时,确定目标对象的白天落脚点为C

获取A

根据AB

具体地,将目标对象的目标居住地址字符串作为能够呈现目标对象的居住地址的文本,目标对象的目标工作地址字符串作为能够呈现目标对象的工作地址的文本,

上述,对第一地址字符串和第二地址字符串进行处理,获取第一居住地址字符串和第二居住地址字符串之间的第二字符串相似度,对第二字符串相似度进行对比,获取目标居住地址字符串,同理,获取目标工作地址字符串,有利于提高获取目标地址的精准度。

S4、获取VA

S5、根据VG

具体地,在S5步骤中包括如下步骤:

S51、将VF

VH

VH

F

S52、根据geohash算法对特征坐标进行处理,获取VH

S53、将目标地理区域对应的地理名称输入至预设地图平台中,获取目标地理区域对应的指定坐标范围。

S54、根据geohash算法对指定坐标范围进行处理,获取指定坐标范围对应的第二坐标字符串列表VK={VK

S55、根据VL

具体地,在S55步骤中包括如下步骤:

S551、获取VL

S552、当任一VN

具体地,标识“-1”表征为字符串相同。

具体地,标识“0”表征为字符串不同。

S553、根据VL

S554、根据VL

S555、根据VL

S556、根据VL

S557、根据VL

S558、根据VL

S559、根据VL

上述,获取第一坐标字符串和第二坐标字符串的字符串相似度,对字符串相似度进行对比,可以精确的获取到第一特征标识,结合第一特征标识和第一预设算法列表中的第一预设特征标识或得让预设算法列表中的第二预设特征标识进行处理,可以更精准的获取对象类型对应的对象标识,进而有利于提高对象分类的精准度。

S56、当VG

具体地,标识“-2”表征为采用第一预设算法。

具体地,在S56步骤中包括如下步骤:

S561、获取第一预设算法列表VP={VP

S563、根据VM

具体地,在S563步骤中包括如下步骤:

S10、当(vb)∈[1,8]时,获取VM

S30、根据VZ

VW

S565、当VW

上述,根据对象类型的第一类型标识,选择对第一特征标识和第一预设算法列表中的第一预设特征标识进行处理,获取对象类型对应的对象标识,有利于提高对象分类的精准度。

S57、当VG

具体地,标识“-3”表征为采用第二预设算法。

具体地,在S57步骤中包括如下步骤:

S571、获取第二预设算法列表VQ={VQ

S573、根据VM

S575、当VU

上述,根据对象类型的第一类型标识,选择对第一特征标识和第二预设算法列表中的第二预设特征标识进行处理,获取对象类型对应的对象标识,有利于提高对象分类的精准度。

S6、获取VB

上述,对对象类型的第一类型标识和第一特征文本,进行处理,获取对象类型对应的对象标识,根据对象类型对应的对象标识获取对象类型对应的对象数量,有利于提高对象分类的精准度。

S300、获取VA对应的对象数量列表VC={VC

S400、根据VB和VC,获取VA对应的对象信息列表VD={VD

本发明提供了一种用于对象分类的数据处理系统,包括:目标地理区域,第一地理区域,第二地理区域,第三地理区域、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标地理区域对应的对象类型列表;获取对象类型列表对应的对象标识列表;获取对象类型列表对应的对象数量列表;根据对象标识列表和对象数量,获取对象类型列表对应的对象信息列表。可知,本发明,设置多个范围较小的对象类型,对目标区域内所有能够采集到对象信息的设备采集到的数据以及登记的对象信息进行处理,获取目标区域内存在的对象标识以及对象标识对应的对象特征,对对象标识的对象特征进行处理,获取对象类型对应的对象标识和对象数量,有利于提高对象分类的精准度。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

相关技术
  • 用于训练神经网络以分类对象或事件的方法和系统
  • 用于自主车辆中对象分类的系统和方法
  • 一种用于为对象文本描述确定默认分类信息的方法及系统
  • 一种应用于报价的分类对象方法和装置
技术分类

06120116510611