一种识别用户人群的方法以及装置
文献发布时间:2023-06-19 11:05:16
技术领域
本发明涉及计算机技术领域,特别涉及一种识别用户人群的方法以及装置。
背景技术
应用服务提供商在进行多媒体信息的投放或推送时,为了起到最好的效果,需要向特定的用户人群推送相关内容。例如,每年开学季时电商网站会向学生用户推送数码类产品;又例如,办公用品商店会向白领用户推送办公用品的促销广告。因此,如何在海量用户群中准确识别出特定用户人群,将是精准投放或者推送多媒体信息的关键。
在现有技术中,通常是采用训练好的识别模型,对海量用户群中的各个用户进行特征提取,以识别出特定用户人群。但是,在这种识别方式中存在以下缺点:
采用识别模型只能确定出用户是特定用户的概率值,若概率值大,该用户将会被划分为特定用户,可采用识别模型的方式得到的模型识别结果无法确定用户当前经常访问的场所。
有鉴于此,需要设计一种新的识别用户人群的方法,以克服上述缺陷。
发明内容
本发明实施例提供一种识别用户人群的方法及装置,用以解决现有技术中无法确定用户当前经常访问的场所的问题。
本发明实施例提供的具体技术方案如下:
一种识别用户人群的方法,包括:
获取目标对象在预设时间段内的历史访问记录集合;
基于预设的场所信息库,分别确定所述各条历史访问记录对应的场所,生成相应的场所集合;
确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所;
将所述目标对象与所述目标访问场所作为用户信息输出。
可选的,所述场所信息库的预设方法,进一步包括:
从预设的场所网络虚拟地址库中获取各个场所以及所述各个场所对应的网络虚拟地址;
基于预设的映射库,确定所述各个场所对应的物理地址;
基于各个物理地址,确定所述各个场所对应的网络覆盖区域;
基于所述各个场所,各个场所的网络虚拟地址以及各个网络覆盖区域,生成所述场所信息库。
可选的,基于所述各个物理地址中的一个物理地址,确定对应的一个场所的网络覆盖区域,包括:
以所述一个场所的物理地址为中心,采用预设半径划分出对应的一个网络覆盖区域。
可选的,基于预设的场所信息库,分别确定目标对象的各条历史访问记录对应的场所,包括:
获取所述场所信息库中各个场所的网络虚拟地址以及各个场所的网络覆盖区域;
针对所述各条历史访问记录分别执行以下操作,以确定所述各条历史访问记录对应的场所:
获取一条历史访问记录中包含的一个地址信息;
确定与所述一个地址信息对应的一个网络虚拟地址或者一个网络覆盖区域;
将所述一个网络虚拟地址或者所述一个网络覆盖区域对应的场所,确定为所述一条历史访问记录对应的场所。
可选的,确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所,包括:针对各个场所分别执行以下操作,以确定所述各个场所对应的访问活跃度:
获取一个场所中各条历史访问记录对应的访问时间;
基于所述各个访问时间,为所述各条历史访问记录添加时间标记信息;
基于预设需求规则和所述时间标记信息,计算所述目标对象针对所述一个场所的访问活跃度;
将访问活跃度最高的场所,确定为所述目标对象的目标访问场所。
可选的,基于预设需求规则和各个时间标记信息,计算所述目标对象针对所述一个场所的访问活跃度,包括:
基于所述时间标记信息,确定所述目标对象在所述预设时间段内访问所述一个场所的天数;
将所述目标对象在所述预设时间段内访问一个场所的天数,与所述预设时间段包含的天数之间的比值,作为所述目标对象针对所述一个场所的访问活跃度输出。
可选的,将所述目标对象、所述对象类型与所述目标访问场所作为用户信息输出,进一步包括:
将所述用户信息添加至预设的用户信息库中。
一种识别用户人群的装置,包括:
获取单元,用于获取目标对象在预设时间段内的历史访问记录集合;
处理单元,用于基于预设的场所信息库,分别确定所述各条历史访问记录对应的场所,生成相应的场所集合;
识别单元,用于确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所;
将所述目标对象与所述目标访问场所作为用户信息输出。
可选的,所述场所信息库的预设方法,所述获取单元进一步用于:
从预设的场所网络虚拟地址库中获取各个场所以及所述各个场所对应的网络虚拟地址;
基于预设的映射库,确定所述各个场所对应的物理地址;
基于各个物理地址,确定所述各个场所对应的网络覆盖区域;
基于所述各个场所,各个场所的网络虚拟地址以及各个网络覆盖区域,生成所述场所信息库。
可选的,基于所述各个物理地址中的一个物理地址,确定对应的一个场所的网络覆盖区域,所述获取单元用于:
以所述一个场所的物理地址为中心,采用预设半径划分出对应的一个网络覆盖区域。
可选的,基于预设的场所信息库,分别确定目标对象的各条历史访问记录对应的场所,所述处理单元用于:
获取所述场所信息库中各个场所的网络虚拟地址以及各个场所的网络覆盖区域;
针对所述各条历史访问记录分别执行以下操作,以确定所述各条历史访问记录对应的场所:
获取一条历史访问记录中包含的一个地址信息;
确定与所述一个地址信息对应的一个网络虚拟地址或者一个网络覆盖区域;
将所述一个网络虚拟地址或者所述一个网络覆盖区域对应的场所,确定为所述一条历史访问记录对应的场所。
可选的,确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所,所述识别单元用于:针对各个场所分别执行以下操作,以确定所述各个场所对应的访问活跃度:
获取一个场所中各条历史访问记录对应的访问时间;
基于所述各个访问时间,为所述各条历史访问记录添加时间标记信息;
基于预设需求规则和所述时间标记信息,计算所述目标对象针对所述一个场所的访问活跃度;
将访问活跃度最高的场所,确定为所述目标对象的目标访问场所。
可选的,基于预设需求规则和各个时间标记信息,计算所述目标对象针对所述一个场所的访问活跃度,所述识别单元用于:
基于所述时间标记信息,确定所述目标对象在所述预设时间段内访问所述一个场所的天数;
将所述目标对象在所述预设时间段内访问一个场所的天数,与所述预设时间段包含的天数之间的比值,作为所述目标对象针对所述一个场所的访问活跃度输出。
可选的,将所述目标对象、所述对象类型与所述目标访问场所作为用户信息输出,所述识别单元进一步用于:
将所述用户信息添加至预设的用户信息库中。
一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一项识别用户人群的方法。
一种存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述任一项识别用户人群的方法。
本发明有益效果如下:
本发明实施例中,通过场所信息库分别确定目标对象在预设时间段内的各条历史访问记录对应的场所,生成相应的场所集合;再确定场所集合中存在符合预设条件的场所时,将场所确定为目标对象的目标访问场所;最后,将目标对象和目标访问场所,作为用户信息输出。本发明实施例将目标对象的历史访问记录集合与预设的场所信息库相匹配,确定出对应的目标访问场所,相比于现有技术中以特征提取的方式识别用户人群,本发明实施例中,基于目标对象经常访问的场所,将目标对象划分到相应的用户群体中,不仅提高了识别用户人群的准确率,还可以生成用户画像信息,便于应用服务提供商实现精准投放多媒体信息。
附图说明
图1为本发明实施例提供的一种识别用户人群的流程示意图;
图2为本发明实施例提供的一种识别用户为校园用户的流程示意图;
图3为本发明实施例提供的一种识别用户人群的装置的结构示意图;
图4为本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
针对现有技术中无法确定用户当前经常访问的学校的问题,本发明实施例中提供了一种新的解决方案。该方案为:首先,获取目标对象在预设时间段内的历史访问记录集合,以及分别确定各条历史访问记录对应的访问时间;其次,通过学校信息库分别确定各条历史访问记录对应的学校,生成相应的学校集合;再次,基于各条历史访问记录对应的访问时间,为各条历史访问记录添加时间标记信息,并基于预设需求规则和各个时间标记信息,计算目标对象针对学校集合中各个学校的访问活跃度;最后,将访问活跃度最高的学校确定为目标对象的目标访问学校,并将目标对象与目标访问学校作为校园用户信息输出。
下面结合附图对本发明优选的实施方式作出详细说明。
具体地,参阅图1所示,本发明实施例中识别用户人群的详细过程如下:
S101:获取目标对象在预设时间段内的历史访问记录集合。
可选的,在获取目标对象在预设时间段内的历史访问记录集合之前,需要生成一个场所信息库,该场所信息库包含了场所以及所述场所对应的网络虚拟地址、网络覆盖区域等信息。
该场所信息库的建立过程具体如下:
首先,从预设的场所网络虚拟地址库中获取各个场所以及各个场所对应的网络虚拟地址。
其次,基于预设的映射库,确定各个场所对应的物理地址。
再次,基于各个物理地址,确定各个场所对应的网络覆盖区域。
具体地,以一个物理地址为例,确定对应的一个场所的网络覆盖区域的过程为:以一个场所的物理地址为中心,采用预设半径划分出对应的一个网络覆盖区域。
由于各个场所中所使用的局域网的覆盖区域有限,因此,可以根据网络覆盖区域来唯一确定场所。
最后,基于各个场所,各个场所的网络虚拟地址以及各个网络覆盖区域,生成场所信息库。
例如,在教育网IP库中获取各个学校以及各个学校对应的IP域;再将各个学校的名称依次输入到云地点检索模型中,得到各个学校对应的经纬度坐标;将各个经纬度坐标确定为对应学校的中心点,根据学校占地面积设置相应的半径,划分出各个学校对应的网络覆盖区域;最后建立表征“学校-IP域-网络覆盖区域”这一映射关系的学校信息库。
又例如,在公司IP库中获取各个公司以及各个公司对应的IP域;再将各个公司的名称依次输入到云地点检索模型中,得到各个公司对应的经纬度坐标;将各个经纬度坐标确定为对应公司的中心点,根据公司占地面积设置相应的半径,划分出各个公司对应的网络覆盖区域;最后建立表征“公司-IP域-网络覆盖区域”这一映射关系的公司信息库。
在本发明实施例中,还可以基于预设的场所物理地址库,建立表征“场所-网络虚拟地址-物理地址”这一映射关系的场所信息库,由于同一场所的名称在两个地址库中的命名方式不同,例如,在学校网络虚拟地址库中记载为“复旦大学邯郸校区”,而在学校物理地址库中记载为“复旦大学(邯郸校区)”,这使得采用这种方式在匹配同一场所时的过程更加复杂。因此,采用映射库的方式建立场所信息库,将避免上述问题,使得整个匹配过程方便、快捷,以及场所信息库中采用统一的命名方式记载各个场所的名称。
S102:基于预设的场所信息库,分别确定各条历史访问记录对应的场所,生成相应的场所集合。
可选的,在确定各条历史访问记录对应的场所之前,需要先获取场所信息库中各个场所的网络虚拟地址以及各个场所的网络覆盖区域。
具体地,针对各条历史访问记录分别执行以下操作,以确定各条历史访问记录对应的场所,包括:先获取一条历史访问记录中包含的一个地址信息;再确定与该地址信息对应的一个网络虚拟地址或者一个网络覆盖区域;最后,将该网络虚拟地址或者该网络覆盖区域,确定为这条历史访问记录对应的场所。
例如,获取用户的一条历史访问记录的IP地址,将所述IP地址与学校信息库中收录的各个IP域进行匹配,若所述IP地址与其中一个IP域匹配成功,则将所述一个IP域对应的学校A,确定为这条历史访问记录对应的学校。
又例如,获取用户的一条历史访问记录中包含的经纬度坐标,将所述经纬度坐标与各个网络覆盖区域的经纬度坐标进行匹配,若所述经纬度坐标与其中一个网络覆盖区域内的经纬度坐标一样,则将所述一个网络覆盖区域对应的学校B,确定为这条历史访问记录对应的学校。
又例如,获取用户的一条历史访问记录的IP地址,发现所述IP地址无法与学校信息库中收录的各个IP域匹配成功,若所述一条历史访问记录中包含经纬度坐标,则可以将所述经纬度坐标与各个网络覆盖区域的经纬度坐标进行匹配,并匹配成功的一个网络覆盖区域对应的学校C,确定为这条历史访问记录对应的学校。
若目标对象通过内网访问网站,在历史访问记录的IP地址中将保留内网的IP域,可以通过匹配IP域的方式,确定出历史访问记录对应的场所;若目标对象是通过智能终端访问网站,且所述智能终端已开启定位功能,在历史访问记录中将保存有上传的经纬度坐标,可以通过匹配经纬度坐标的方式,确定出历史访问记录对应的场所。因此,无论目标对象是通过哪种途径访问网站,采用网络虚拟地址与物理地址相结合的方式,均可以确定出各条历史访问记录对应的场所,从而提高识别覆盖度。
S103:确定场所集合中存在符合预设条件的场所时,将场所确定为目标对象的目标访问场所。
可选的,在场所集合中筛选目标访问场所的过程如下:
针对各个场所分别执行以下操作,以确定各个场所对应的访问活跃度:
首先,获取一个场所中各条历史访问记录对应的访问时间。
例如,获取用户在xx年7月29日生成的一条历史访问记录,在确定这条历史访问记录对应的场所是复旦大学邯郸校区后,将为这条历史访问记录添加“用户在xx年7月29日访问了复旦大学邯郸校区”的时间标记信息。
又例如,获取用户在xx年11月27日生成的一条历史访问记录,在确定这条历史访问记录对应的场所是爱心养老院时,将为这条历史访问记录添加“用户在xx年11月27日访问了爱心养老院”的时间标记信息。
其次,基于各个访问时间,为各条历史访问记录添加时间标记信息。
再次,基于预设需求规则和时间标记信息,计算目标对象针对一个场所的访问活跃度。
可选的,为了便于描述,以计算目标对象针对一个场所的访问活跃度为例,具体计算过程如下:
首先,基于各个时间标记信息,分别确定目标对象在预设时间段内访问一个场所的天数;
然后,将目标对象在预设时间段内访问一个场所的天数,与预设时间段包含的天数之间的比值,作为目标对象针对该场所的访问活跃度输出。
例如,获取用户两年的历史访问记录集合,确定该用户在过去两年中511天访问复旦大学,100天访问东华大学,119没有访问任何学校,因此,用户访问复旦大学的访问活跃度是70%,用户访问东华大学的访问活跃度是13.70%。
又例如,获取用户在xx年7月份的历史访问记录集合,确定该用户在7月份中20天访问公司A,7天访问公司B,4天没有访问任何公司,因此,用户访问公司A的访问活跃度是64.52%,用户访问公司B的访问活跃度是22.58%。
又例如,获取用户当天的历史访问记录集合,确定该用户在当天只访问了复旦大学,即用户访问复旦大学的访问活跃度是100%。
最后,将访问活跃度最高的场所,确定为目标对象的目标访问场所。
S104:将目标对象、对象类型与目标访问场所作为用户信息输出。
不仅如此,在本发明实施例中,还可以将所述用户信息添加至预设的用户信息库中,若同一目标对象生成了新的用户信息,可将新的用户信息实时更新至用户信息库中。
基于上述实施例,参阅图2所示,下面采用一个具体的应用场景作出进一步详细说明。
A、建立学校兴趣点(Point Of Interest,POI)信息库。
具体地,在教育网IP库中先获取各个学校以及各个学校对应的IP域;然后,采用云地点检索服务得到各个学校对应的经纬度坐标,再基于各个经纬度坐标,确定各个学校的网络覆盖区域;最后建立一个包含“学校名称-网络覆盖区域-IP域”的映射关系的学校POI信息库。
B、将获取到的用户在N天内的历史访问记录集合,输入到学校POI信息库中,其中,每一条历史访问记录包含IP地址和上传的经纬度坐标。
C、采用IP匹配与POI定位相结合的方式,确定出各条历史访问记录对应的学校。
D、使用规则判定该用户是否在N天内属于某一学校,若是,执行步骤E。
若用户在N天内至少有M天访问某一学校,则判定该用户在N天内属于某一学校。
E、将该用户,该用户对应的匹配学校以及该用户最近活跃日期作为校园用户信息输出。
基于同一发明构思,本发明实施例中,提供一种识别校园用户人群的装置,参阅图3所示,至少包括获取单元301、处理单元302和识别单元303,其中,
获取单元301,用于获取目标对象在预设时间段内的历史访问记录集合;
处理单元302,用于基于预设的场所信息库,分别确定所述各条历史访问记录对应的场所,生成相应的场所集合;
识别单元303,用于确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所;
将所述目标对象与所述目标访问场所作为用户信息输出。
可选的,所述场所信息库的预设方法,所述获取单元301进一步用于:
从预设的场所网络虚拟地址库中获取各个场所以及所述各个场所对应的网络虚拟地址;
基于预设的映射库,确定所述各个场所对应的物理地址;
基于各个物理地址,确定所述各个场所对应的网络覆盖区域;
基于所述各个场所,各个场所的网络虚拟地址以及各个网络覆盖区域,生成所述场所信息库。
可选的,基于所述各个物理地址中的一个物理地址,确定对应的一个场所的网络覆盖区域,所述获取单元301用于:
以所述一个场所的物理地址为中心,采用预设半径划分出对应的一个网络覆盖区域。
可选的,基于预设的场所信息库,分别确定目标对象的各条历史访问记录对应的场所,所述处理单元302用于:
获取所述场所信息库中各个场所的网络虚拟地址以及各个场所的网络覆盖区域;
针对所述各条历史访问记录分别执行以下操作,以确定所述各条历史访问记录对应的场所:
获取一条历史访问记录中包含的一个地址信息;
确定与所述一个地址信息对应的一个网络虚拟地址或者一个网络覆盖区域;
将所述一个网络虚拟地址或者所述一个网络覆盖区域对应的场所,确定为所述一条历史访问记录对应的场所。
可选的,确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所,所述识别单元303用于:针对各个场所分别执行以下操作,以确定所述各个场所对应的访问活跃度:
获取一个场所中各条历史访问记录对应的访问时间;
基于所述各个访问时间,为所述各条历史访问记录添加时间标记信息;
基于预设需求规则和所述时间标记信息,计算所述目标对象针对所述一个场所的访问活跃度;
将访问活跃度最高的场所,确定为所述目标对象的目标访问场所。
可选的,基于预设需求规则和各个时间标记信息,计算所述目标对象针对所述一个场所的访问活跃度,所述识别单元303用于:
基于所述时间标记信息,确定所述目标对象在所述预设时间段内访问所述一个场所的天数;
将所述目标对象在所述预设时间段内访问一个场所的天数,与所述预设时间段包含的天数之间的比值,作为所述目标对象针对所述一个场所的访问活跃度输出。
可选的,将所述目标对象、所述对象类型与所述目标访问场所作为用户信息输出,所述识别单元303进一步用于:
将所述用户信息添加至预设的用户信息库中。
基于同一发明构思,本发明实施例中,提供一种计算设备,参阅图4所示,至少包括存储器401和处理器402,其中,存储器401和处理器402通过通信总线完成相互间的通信;
存储器401,用于存储程序指令;
处理器402,用于获取目标对象在预设时间段内的历史访问记录集合;
基于预设的场所信息库,分别确定所述各条历史访问记录对应的场所,生成相应的场所集合;
确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所;
将所述目标对象与所述目标访问场所作为用户信息输出。
基于同一发明构思,本发明实施例中,提供一种存储介质,至少包括:
获取目标对象在预设时间段内的历史访问记录集合;
基于预设的场所信息库,分别确定所述各条历史访问记录对应的场所,生成相应的场所集合;
确定所述场所集合中存在符合预设条件的场所时,将所述场所确定为所述目标对象的目标访问场所;
将所述目标对象与所述目标访问场所作为用户信息输出。
综上所述,通过场所信息库分别确定目标对象在预设时间段内的各条历史访问记录对应的场所,生成相应的场所集合;再确定场所集合中存在符合预设条件的场所时,将场所确定为目标对象的目标访问场所;最后,将目标对象和目标访问场所,作为用户信息输出。
在本发明实施例中,可以通过调整需求规则,在海量目标对象群中识别出长期访问特定场所的用户,或者识别出某一时间段内访问特定场所的用户,或者识别出实时访问特定场所的用户,这样,不仅可以刻画出目标对象当前访问活跃的场所或者长期访问活跃的场所,还能够识别出目标对象归属为哪一类用户群体,以此建立一个全面的用户画像,使得应用服务提供商基于校园用户信息库中存储的各个用户画像,实现多媒体信息的精准投放或者推送。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
- 一种识别用户人群的方法以及装置
- 基于红外传感器的电梯待梯人群识别装置及基于人群识别的电梯调度方法