掌桥专利:专业的专利平台
掌桥专利
首页

一种智能在线培训服务信息推送算法

文献发布时间:2023-06-19 10:02:03


一种智能在线培训服务信息推送算法

技术领域

本发明涉及一种智能在线培训服务信息推送算法,属于数据智能处理的技术领域。

背景技术

现如今在线培训服务的普及和飞速发展,使得部分人能够在家就能享受到在线培训服务,在线培训服务的教育形式也很多种,有直播教课,也有录播教课,也有录制动画演示的形式,然而,新的在线培训服务上线,让更多人的知道,即推广显得尤为重要,除了采取传统的电视广告,以及各种张贴广告的形式,还可以采取最有针对的性的,根据需要人群,直接推送,比如上网的时候,插入对应的在线培训服务信息,或者给手机发送信息。如何有针对性地查找到目标推送对象是目前的亟待解决的问题。

发明内容

为了解决上述技术问题,本发明提供一种智能在线培训服务信息推送算法,其具体技术方案如下:

一种智能在线培训服务信息推送算法,包括以下步骤,

步骤1:获取ID:获取客户端入网的ID,以ID为唯一标识建立数据库,形成数据库群,数据库群的数据库数量与ID数量一致;

步骤2:设置敏感信息库:选取多个与在线培训服务关联的敏感词组,形成敏感信息库;

步骤3:设置关联词组:在线培训服务分为多种,每种有独立的敏感信息库,所述敏感信息库中的多个敏感词组设置关联词组,同一敏感词组可同时位于多个关联词组中;

步骤4:获取浏览网页:获取客户端的浏览网页,判断浏览网页网址字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为一级辨识,进入步骤5,否则不标记,进入步骤6,将其存储于ID目录下的数据库中;

步骤5:在数据库中,向前浏览网页网址字符串,在设定的时间长度,若出现一级辨识的数量超过预设值,则将该ID设定为目标对象,推送在线培训服务信息,若否,进入步骤6;

步骤6:获取浏览内容:获取浏览网页上的内容,包括视频、音频、图片、字母和文字,并存储在数据中,

步骤7:提取浏览信息:提取网页内容中的信息,转换为字符串,并判断字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为二级辨识,否则不标记,并存储在数据中,

步骤8:计算时间量程内的一级辨识和二级辨识的综合量在总浏览量中的占比,并存储在数据中;

步骤9:给客户端ID推送信息:设置步骤7中的占比阈值,当占比达到阈值,给客户端ID推送信息,否则不推送。

进一步的,所述步骤4中的时间长度为15天,预设值为3次。

进一步的,所述关联词组为敏感词组连续或间隔出现均可,当选中的敏感词组在同一网址字符串或者网页内容中同时出现时,便认定为出现关联词组,敏感词组之间可以有非敏感词组字符。

进一步的,所述步骤8的时间量程为7~15天。

进一步的,所述步骤8的一级辨识的计算过程为:

统计时间量程内的,所有点击的网址字符中敏感词组,在不同网址中存在能够组成关联词组时,判定该ID设定为目标对象,推送在线培训服务信息,若不存在,则以点开网址的数量为分母,以出现敏感词组的网址为分子,分子与分母的比值大于0.1时,判定该ID设定为目标对象,推送在线培训服务信息,否则,暂不推送,继续提取网页内容。

进一步的,所述步骤8中二级辨识的计算过程为:将最新浏览网页上的敏感词组,与时间量程内的所有其他敏感词组匹配,判断是否能形成关联词组,若能,则判定该ID设定为目标对象,推送在线培训服务信息,否则,不推送。

本发明的有益效果是:

本发明能够自动建搜每个ID的登录网址也网页信息,根据在线培训服务的敏感词,智能筛选出对在线培训服务感兴趣的潜在目标客户,然后定向推送匹配的现在培训服务,针对性强,命中率高。

当在线培训服务有多个时,给每个在线培训服务建立各自的敏感信息库,每个ID建立独立的数据库,形成时间链上的数据,当ID有网址访问时,用本专利方法判断是否要推送在线培训服务,以及推送哪个在线服务培训。

附图说明

图1是本发明的流程图。

具体实施方式

如图1所示,本发明的智能在线培训服务信息推送算法,包括以下步骤,

步骤1:获取ID:获取客户端入网的ID,以ID为唯一标识建立数据库,形成数据库群,数据库群的数据库数量与ID数量一致;

步骤2:设置敏感信息库:选取多个与在线培训服务关联的敏感词组,形成敏感信息库;关联词组为敏感词组连续或间隔出现均可,当选中的敏感词组在同一网址字符串或者网页内容中同时出现时,便认定为出现关联词组,敏感词组之间可以有非敏感词组字符。

步骤3:设置关联词组:在线培训服务分为多种,每种有独立的敏感信息库,所述敏感信息库中的多个敏感词组设置关联词组,同一敏感词组可同时位于多个关联词组中;

步骤4:获取浏览网页:获取客户端的浏览网页,判断浏览网页网址字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为一级辨识,进入步骤5,否则不标记,进入步骤6,将其存储于ID目录下的数据库中;

步骤5:在数据库中,向前浏览网页网址字符串,在设定的时间长度,若出现一级辨识的数量超过预设值,则将该ID设定为目标对象,推送在线培训服务信息,若否,进入步骤6;

步骤6:获取浏览内容:获取浏览网页上的内容,包括视频、音频、图片、字母和文字,并存储在数据中,

步骤7:提取浏览信息:提取网页内容中的信息,转换为字符串,并判断字符串中是否含有关联词组,若有,判断关联词组位于哪种在线培训服务,并给该ID发送对应的在线服务信息,若没有,则判断是否有敏感词组,若有,则标记为二级辨识,否则不标记,并存储在数据中,

步骤8:一级辨识的计算过程为:

统计时间量程内的,所有点击的网址字符中敏感词组,在不同网址中存在能够组成关联词组时,判定该ID设定为目标对象,推送在线培训服务信息,若不存在,则以点开网址的数量为分母,以出现敏感词组的网址为分子,分子与分母的比值大于0.1时,判定该ID设定为目标对象,推送在线培训服务信息,否则,暂不推送,继续提取网页内容。

二级辨识的计算过程为:将最新浏览网页上的敏感词组,与时间量程内的所有其他敏感词组匹配,判断是否能形成关联词组,若能,则判定该ID设定为目标对象,推送在线培训服务信息,否则,不推送。

步骤4中的时间长度为15天,预设值为3次。在实际使用过程中,也可设置其他数值,根据使用需求而定。

步骤8的时间量程为7~15天。该时间长度可随意设置,为了确保不增加计算负担,又比较合适地筛选信息,时间长度设置为7~15天是个比较合适的范围。

当待推送的在线服务培训有多个时,可同时进行上述方法,每个在线培训服务建立自己的独立的敏感信息库,当ID采集到的网址或网页信息中包括多个在线培训服务的关联词组时,推送该多个在线培训服务,只有一个时,就推送一个,都没有时,就不推送。快捷高效,避免盲目推送,造成市场反馈差评,推送给专门有需求的人。

以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

相关技术
  • 一种智能在线培训服务信息推送算法
  • 一种基于人工智能算法技术的在线继续教育资源分配和管理方法
技术分类

06120112389171