掌桥专利:专业的专利平台
掌桥专利
首页

基于知识图谱的社会治理事件挖掘方法及装置

文献发布时间:2023-06-19 19:28:50


基于知识图谱的社会治理事件挖掘方法及装置

技术领域

本发明涉及程序优化技术领域,尤其涉及一种基于知识图谱的社会治理事件挖掘方法、装置、电子设备及计算机可读存储介质。

背景技术

伴随人民生活水平和科学技术的不断发展,衍生出大量各种各样的与民生相关的软件程序,其中关于热点治理事件类的网络新闻讨论程序属于活跃度最高的程序之一,由于网络新闻讨论程序具有高活跃度的特征,因此及时更新网络新闻讨论程序的软硬件水平以保证网络新闻讨论程序的流畅运行具有重要意义。

目前常用的网络新闻讨论程序优化方法,主要根据网络新闻讨论程序的账户活跃度和所生成的社交讨论文本数量实现针对性优化,如某块网络新闻讨论程序在前一个月共有100万个账户活跃,且在上个月该网络新闻讨论程序共生成100G的社交讨论文本,在当月时,该网络新闻讨论程序共有110万个账户活跃,共生成110G的社交讨论文本,因此网络新闻讨论程序开发人员根据上个月和当月的账户活跃度及社交讨论文本的增长情况,适应性的提高网络新闻讨论程序的软硬件水平,以支持下个月网络新闻讨论程序的正常运行。

上述方法虽然可实现网络新闻讨论程序优化,但并没有结合网络新闻讨论程序优化的程序属性,即网络新闻讨论程序内每个社交账号的活跃于网络新闻讨论程序的主要目的在于围绕某个热点的社会治理事件展开具有个人主观的讨论,因此目前缺乏一种基于挖掘出热点治理事件及相关讨论文本,进而实现网络新闻讨论程序优化方法,以更准确的确定网络新闻讨论程序的优化方向。

发明内容

本发明提供一种基于知识图谱的社会治理事件挖掘方法、装置及计算机可读存储介质,其主要目的在于挖掘出热点治理事件及相关讨论文本,从而准确确定网络新闻讨论程序的优化方向。

为实现上述目的,本发明提供的一种基于知识图谱的社会治理事件挖掘方法,包括:

接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层;

根据所述新闻发布层及新闻讨论层构建新闻讨论网络,其中新闻讨论网络的构建过程包括:

获取网络新闻讨论程序中所有的社交账号,并根据新闻讨论层中每个社交账号是否发起过新闻讨论帖为依据,将所有的社交账号分为新闻讨论账号和新闻浏览账号;

获取每个新闻讨论账号所发起新闻讨论帖的讨论文本,得到讨论文本集;

对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值;

根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,其中聚类文本集的聚类文本的数量小于或等于所述讨论文本集的讨论文本的数量;

从所述聚类文本集中去除新闻讨论账号数量小于指定讨论账号数量,及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集;

根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络;

根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,其中所述热点治理事件判断模型的构建过程,包括:

获取每个新闻讨论网络中的所有的社交账号,其中所有的社交账号包括新闻讨论账号和新闻浏览账号;

根据热点治理事件判断模型判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,其中行为倾向包括高频讨论、中频讨论及低频讨论;

根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,其中高频讨论判断模型和低频讨论判断模型统称为热点治理事件判断模型;

利用所述热点治理事件判断模型分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,将讨论文本增量记录在所述社会治理事件挖掘层的同时,基于每种行为倾向类型的讨论文本增量调整支持网络新闻讨论程序的硬件程序与软件程序,从而实现网络新闻讨论程序优化。

可选地,所述新闻发布层记录每个在网络新闻讨论程序中注册的社交账号的社交行为,其中社交行为包括评论、转帖、点赞及分享行为;所述新闻讨论层记录每个社交账号所发起的新闻讨论帖内的讨论文本;所述社会治理事件挖掘层根据新闻发布层、新闻讨论层的信息记录每个社交账号的行为倾向,并根据每个社交账号的行为倾向确定出与社会治理事件相关的讨论文本和社交账号。

可选地,所述对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值,包括:

从所述讨论文本集中依次提取出每个讨论文本,并计算出所提取的讨论文本的命名实体,其中命名实体包括人名、地名、机构名、实物名、讨论文本的标题、动词、日期、地址;

计算每个命名实体在所有的讨论文本中的权重,并根据每个命名实体的权重构建所提取的讨论文本的权重向量;

根据所述权重向量计算所述讨论文本集中每个讨论文本与其他讨论文本的文本相似度,得到文本相似值。

可选地,所述计算每个命名实体在所有的讨论文本中的权重,包括:

采用如下公式计算得到每个命名实体的权重:

/>

其中,

可选地,所述根据每个命名实体的权重构建所提取的讨论文本的权重向量,包括:

根据所提取的讨论文本中每个命名实体在讨论文本集出现的总次数,对每个命名实体执行排序,得到具有顺序关系的命名实体集,其中命名实体集为

构建命名实体集的权重向量,其中权重向量为:

其中,

可选地,所述根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,包括:

接收预先设定的文本相似阈值,将文本相似值高于文本相似阈值的两组讨论文本聚类为聚类文本,其中聚类操作为:

将两组讨论文本按照首尾相连的顺序合并为合并文本;

去除合并文本中的停用词,并将两组讨论文本中相同的命名实体仅在合并文本显现一次,将两组讨论文本中不相同的命名实体分开显示至合并文本的文首位置,得到所述聚类文本。

可选地,所述判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,包括:

基于LSTM模型、RNN模型或CNN模型构建出治理事件讨论频率模型;

并获取每个社交账号在对应的新闻讨论网络中的高频文本及社交行为,并将高频文本及社交行为作为所述治理事件讨论频率模型的输入文本,计算得到对应的行为倾向判断结果,其中行为倾向判断结果包括高频率讨论账号、中频率讨论账号及低频率讨论账号。

可选地,所述根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,包括:

计算当前时刻下高频率讨论账号、中频率讨论账号及低频率讨论账号占新闻讨论网络中的所有的社交账号的比例,得到高频讨论比例值、中频讨论比例值及低频讨论比例值;

获取所述网络新闻讨论程序的账号增长率,根据所述账号增长率、高频讨论比例值、中频讨论比例值及低频讨论比例值,计算得到高频讨论微分方程和低频讨论微分方程;

基于所述高频讨论微分方程和低频讨论微分方程,分别构建得到高频讨论判断模型及低频讨论判断模型。

可选地,所述高频讨论微分方程和低频讨论微分方程分别为:

/>

其中,

为了解决上述问题,本发明还提供一种基于知识图谱的社会治理事件挖掘装置,所述装置包括:

指令接收模块,用于接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层;

新闻讨论网络构建模块,用于根据所述新闻发布层及新闻讨论层构建新闻讨论网络,其中新闻讨论网络的构建过程包括:

获取网络新闻讨论程序中所有的社交账号,并根据新闻讨论层中每个社交账号是否发起过新闻讨论帖为依据,将所有的社交账号分为新闻讨论账号和新闻浏览账号;

获取每个新闻讨论账号所发起新闻讨论帖的讨论文本,得到讨论文本集;

对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值;

根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,其中聚类文本集的聚类文本的数量小于或等于所述讨论文本集的讨论文本的数量;

从所述聚类文本集中去除新闻讨论账号数量小于指定讨论账号数量,及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集;

根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络;

热点治理事件判断模型构建模块,用于根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,其中所述热点治理事件判断模型的构建过程,包括:

获取每个新闻讨论网络中的所有的社交账号,其中所有的社交账号包括新闻讨论账号和新闻浏览账号;

根据热点治理事件判断模型判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,其中行为倾向包括高频讨论、中频讨论及低频讨论;

根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,其中高频讨论判断模型和低频讨论判断模型统称为热点治理事件判断模型;

程序优化模块,用于利用所述热点治理事件判断模型分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,将讨论文本增量记录在所述社会治理事件挖掘层的同时,基于每种行为倾向类型的讨论文本增量调整支持网络新闻讨论程序的硬件程序与软件程序,从而实现网络新闻讨论程序优化。

为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

存储器,存储至少一个指令;及

处理器,执行所述存储器中存储的指令以实现上述所述的基于知识图谱的社会治理事件挖掘方法。

为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于知识图谱的社会治理事件挖掘方法。

本发明实施例为解决背景技术所述问题,先接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层,其中新闻发布层及新闻讨论层的主要目的在于构建出新闻讨论网络,新闻讨论网络是根据每个社交账号所发布的讨论文本,社交行为(如评论、转帖、点赞、分享)而构建的以讨论文本为网络中心点的新闻讨论网络,通过新闻讨论网络可高效的展示出社交账号与社交账号之间的交互过程,故进一步地,根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,热点治理事件判断模型的主要作用是可分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,其中行为倾向类型包括高频讨论、中频讨论及低频讨论,本发明实施例分别预测高频讨论及低频讨论在网络新闻讨论程序的未来增量,从而根据每种社交账号类型的增量情况,选择性的优化网络新闻讨论程序的软硬件。因此本发明提出的基于知识图谱的社会治理事件挖掘方法、装置、电子设备及计算机可读存储介质,其主要目的在于挖掘出热点治理事件及相关讨论文本,从而准确确定网络新闻讨论程序的优化方向。

附图说明

图1为本发明一实施例提供的基于知识图谱的社会治理事件挖掘方法的流程示意图;

图2为本发明一实施例提供的基于知识图谱的社会治理事件挖掘装置的功能模块图;

图3为本发明一实施例提供的实现所述基于知识图谱的社会治理事件挖掘方法的电子设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本申请实施例提供一种基于知识图谱的社会治理事件挖掘方法。所述基于知识图谱的社会治理事件挖掘方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于知识图谱的社会治理事件挖掘方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。

参照图1所示,为本发明一实施例提供的基于知识图谱的社会治理事件挖掘方法的流程示意图。在本实施例中,所述基于知识图谱的社会治理事件挖掘方法包括:

S1、接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层。

需解释的是,社会治理事件主要是政府、事业单位等根据所治理及管辖区域面临的形势情况,而开展的推动改进和进步的经验做法、或产生的影响和反映等事件,且社会治理事件由于具有实时性和强关注性,因此在网络新闻讨论程序中占据极其重要的位置。

进一步地,社会治理事件挖掘指令一般由网络新闻讨论程序管理人员或关心社会治理事件的相关人员发出。示例性的,网络新闻讨论程序的管理人员的为了及时抓取出社会治理事件,并根据社会治理事件的热度营造更良好的网络新闻讨论程序的讨论风气,因此需要不断监测挖掘出社会治理事件及社会治理事件背后所引发的一系列讨论文本。

示例性的,小张为网络新闻讨论程序的管理人员,其主要负责一款为某市市民开发的日常新闻讨论程序。当下在该市恰好政府正在执行市容整改,日常新闻讨论程序的发帖量、讨论量等急剧增加,因此小张发起社会治理事件挖掘指令并启动日常新闻讨论程序,其主要目的在于及时挖掘出和市容整改相关的新闻讨论帖等。

进一步地,需解释的是,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层,其中新闻发布层的主要作用在于记录每个在网络新闻讨论程序中注册的社交账号的社交行为,其中社交行为包括评论、转帖、点赞、分享等行为;新闻讨论层的主要作用在于记录每个社交账号所发起的新闻讨论帖内的讨论文本;社会治理事件挖掘层的主要作用在于根据新闻发布层、新闻讨论层的信息记录每个社交账号的行为倾向,并根据每个社交账号的行为倾向确定出具有重要影响的与社会治理事件相关的讨论文本和社交账号。

S2、根据所述新闻发布层及新闻讨论层构建新闻讨论网络。

需解释的是,为了更高效的挖掘出网络新闻讨论程序的社会治理事件,本发明实施例先构建出新闻讨论网络。详细地,所述根据所述新闻发布层及新闻讨论层构建新闻讨论网络,包括:

获取网络新闻讨论程序中所有的社交账号,并根据新闻讨论层中每个社交账号是否发起过新闻讨论帖为依据,将所有的社交账号分为新闻讨论账号和新闻浏览账号;

获取每个新闻讨论账号所发起新闻讨论帖的讨论文本,得到讨论文本集;

对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值;

根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,其中聚类文本集的聚类文本的数量小于或等于所述讨论文本集的讨论文本的数量;

从所述聚类文本集中去除新闻讨论账号数量小于指定讨论账号数量,及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集;

根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络。

示例性的,日常新闻讨论程序中共有社交账号100万,其中一百万的社交账号中有10万社交账号曾经发起过与市容整改相关的新闻讨论帖,因此该10万社交账号为新闻讨论账号,相应的,另外90万社交账号为新闻浏览账号。进一步地,获取10万新闻讨论账号所发起的所有新闻讨论帖的讨论文本,得到讨论文本集,可理解的是,10万新闻讨论账号对应至少有10万个讨论文本,假设每个新闻讨论账号只发起一个新闻讨论帖的情况下。

需解释的是,由于讨论文本集中可能存在大量相似度很高的讨论文本,因此本发明实施例需执行文本相似度计算,从而根据文本相似值合并讨论文本。详细地,所述对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值,包括:

从所述讨论文本集中依次提取出每个讨论文本,并计算出所提取的讨论文本的命名实体,其中命名实体包括人名、地名、机构名、实物名、讨论文本的标题、动词、日期、地址;

计算每个命名实体在所有的讨论文本中的权重,并根据每个命名实体的权重构建所提取的讨论文本的权重向量;

根据所述权重向量计算所述讨论文本集中每个讨论文本与其他讨论文本的文本相似度,得到文本相似值。

示例性的,市容整改社交程序中共有20万个讨论文本集,其中讨论文本A的命名实体包括:马路整改、垃圾、马路破烂、绿植。因此计算(马路整改、垃圾、马路破烂、绿植)在所有的讨论文本中的权重,详细地,所述计算每个命名实体在所有的讨论文本中的权重,包括:

采用如下公式计算得到每个命名实体的权重:

其中,

进一步地,所述根据每个命名实体的权重构建所提取的讨论文本的权重向量,包括:

根据所提取的讨论文本中每个命名实体在讨论文本集出现的总次数,对每个命名实体执行排序,得到具有顺序关系的命名实体集,其中命名实体集为

构建命名实体集的权重向量,其中权重向量为:

其中,

示例性的,讨论文本A的命名实体包括:马路整改、垃圾、马路破烂、绿植,而马路整改、马路破烂在讨论文本集中的总次数最少,因为讨论文本A的权重向量为

需解释的是,本发明实施例所采用的文本相似度计算模型可采用LSTM模型,即将两组不同的讨论文本及每组讨论文本所自带的权重向量输入至LSTM,从而可计算出两组讨论文本的文本相似度,进而得到文本相似值。

进一步地,本发明实施例设置文本相似阈值,即文本相似值高于文本相似阈值的两组讨论文本,本发明实施例默认为同一类讨论文本,故将两组讨论文本合并为一组聚类文本。详细地,所述根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,包括:

接收预先设定的文本相似阈值,将文本相似值高于文本相似阈值的两组讨论文本聚类为聚类文本,其中聚类操作为:

将两组讨论文本按照首尾相连的顺序合并为合并文本;

去除合并文本中的停用词,并将两组讨论文本中相同的命名实体仅在合并文本显现一次,将两组讨论文本中不相同的命名实体分开显示至合并文本的文首位置,得到所述聚类文本。

进一步地,本发明实施例为了达到快速锁定社会治理事件的讨论目的,因此去除新闻讨论账号数量小于指定讨论账号数量及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集,并根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络。

示例性的,如高频文本集中存在高频文本B,高频文本B中共有10个新闻讨论账号、1000个新闻浏览账号参与,因此根据该1000个新闻浏览账号的评论、转帖、点赞、分享等行为,构建得到以高频文本B为网络中心点、1000个新闻浏览账号的评论、转帖、点赞、分享等行为为网络边缘点的新闻讨论网络。

S3、根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型。

详细地,所述根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,包括:

获取每个新闻讨论网络中的所有的社交账号,其中所有的社交账号包括新闻讨论账号和新闻浏览账号;

判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,其中行为倾向包括高频率讨论、中频率讨论及低频率讨论;

根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,其中高频讨论判断模型和低频讨论判断模型统称为热点治理事件判断模型。

示例性的,假设上述市容整改社交程序中存在新闻讨论网络S,其中新闻讨论网络S共有新闻讨论账号20个和新闻浏览账号3000个,由此新闻讨论网络S的所有的社交账号共有3020个。

进一步地,本发明实施例可使用包括但不限于LSTM模型、RNN模型、CNN模型等,通过这类深度学习模型可识别新闻讨论网络S中每个社交账号的行为倾向。

详细地,所述判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,包括:

基于LSTM模型、RNN模型或CNN模型构建出治理事件讨论频率模型;

并获取每个社交账号在对应的新闻讨论网络中的高频文本及社交行为,并将高频文本及社交行为作为所述治理事件讨论频率模型的输入文本,计算得到对应的行为倾向判断结果,其中行为倾向判断结果包括高频率讨论账号、中频率讨论账号及低频率讨论账号。

进一步地,所述根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,包括:

计算当前时刻下高频率讨论账号、中频率讨论账号及低频率讨论账号占新闻讨论网络中的所有的社交账号的比例,得到高频讨论比例值、中频讨论比例值及低频讨论比例值;

获取所述网络新闻讨论程序的账号增长率,根据所述账号增长率、高频讨论比例值、中频讨论比例值及低频讨论比例值,计算得到高频讨论微分方程和低频讨论微分方程;

基于所述高频讨论微分方程和低频讨论微分方程,分别构建得到高频讨论判断模型及低频讨论判断模型。

示例性的,上述新闻讨论网络S共有3020个社交账号,其中,高频率讨论账号有1000个,低频率讨论账号有1500个,中频率讨论账号有520个,因此可计算出高频讨论比例值、中频讨论比例值及低频讨论比例值。

此外,网络新闻讨论程序的账号增长率可根据历史账号的增长情况计算得到,如上述市容整改社交程序在2022年9月社交账号为100万,2022年10月社交账号为110万、2022年11月社交账号为120万,则账号增长率为10%。

进一步地,所述高频讨论微分方程和低频讨论微分方程分别为:

其中,

本发明实施例中,可使用机器学习方法构建得到高频讨论判断模型及低频讨论判断模型,示例性的,如使用支持向量机,并将高频讨论微分方程和低频讨论微分方程作为约束条件,可构建得到高频讨论判断模型及低频讨论判断模型,由于支持向量机为已公开技术,在此不再赘述。

S4、利用所述热点治理事件判断模型分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,将讨论文本增量记录在所述社会治理事件挖掘层的同时,基于每种行为倾向类型的讨论文本增量调整支持网络新闻讨论程序的硬件程序与软件程序,从而实现网络新闻讨论程序优化。

可理解的是,热点治理事件判断模型包括高频讨论判断模型及低频讨论判断模型,不管是高频讨论判断模型还是低频讨论判断模型,具由当前时刻

示例性的,如以高频讨论微分方程为约束条件构建基于支持向量机的高频讨论判断模型,此时构建时间为2022年12月,且高频讨论的讨论文本为100万,现利用高频讨论判断模型预测在2023年5月,网络新闻讨论程序中高频讨论的讨论文本增量为70万,即在2023年5月共有170万高频讨论的讨论文本。

进一步地,可理解的是,当行为倾向类型的讨论文本增量均为正时,表明不管是高频讨论、低频讨论的用户数量均呈现增加,因此需适当提高网络新闻讨论程序的硬件水平,并优化软件程序,从而保证网络新闻讨论程序的正常运行;此外,若高频讨论的讨论文本增量为正、低频讨论的的讨论文本增量为负,表明高频讨论用户数量呈增加趋势,低频讨论用户数量呈减少趋势,此时表明网络新闻讨论程序内的讨论文本容易引起更多人的共鸣,社交网络的讨论风气更好,因此在适当提高网络新闻讨论程序的硬件水平并优化软件程序的同时,还需增加具有可讨论性的社会治理事件,以提高网络新闻讨论程序低频讨论用户的参与感;若高频讨论的讨论文本增量为负、低频讨论的的讨论文本增量为正,表明高频讨论用户数量呈减少趋势,低频讨论用户数量呈增加趋势,此时表明网络新闻讨论程序内的讨论文本容易引起争吵,网络新闻讨论程序内的社交账号对于社会治理事件的讨论意见分歧较大,因此在适当提高网络新闻讨论程序的硬件水平并优化软件程序的同时,还需多发布引发共鸣类的社会治理事件,以活跃网络新闻讨论程序中高频讨论用户;若高频讨论的讨论文本增量和低频讨论的的讨论文本增量均为负时,表明高频讨论用户数量和低频讨论用户数量均呈减少趋势,此时无需优化网络新闻讨论程序的硬件和软件程序,而是将注意力集中在网络新闻讨论程序的社会治理事件的整改,从而进一步提高社会治理事件的质量。

本发明实施例为解决背景技术所述问题,先接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层,其中新闻发布层及新闻讨论层的主要目的在于构建出新闻讨论网络,新闻讨论网络是根据每个社交账号所发布的讨论文本,社交行为(如评论、转帖、点赞、分享)而构建的以讨论文本为网络中心点的新闻讨论网络,通过新闻讨论网络可高效的展示出社交账号与社交账号之间的交互过程,故进一步地,根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,热点治理事件判断模型的主要作用是可分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,其中行为倾向类型包括高频讨论、中频讨论及低频讨论,本发明实施例分别预测高频讨论及低频讨论在网络新闻讨论程序的未来增量,从而根据每种社交账号类型的增量情况,选择性的优化网络新闻讨论程序的软硬件。因此本发明提出的基于知识图谱的社会治理事件挖掘方法、装置、电子设备及计算机可读存储介质,其主要目的在于挖掘出热点治理事件及相关讨论文本,从而准确确定网络新闻讨论程序的优化方向。

如图2所示,是本发明一实施例提供的基于知识图谱的社会治理事件挖掘装置的功能模块图。

本发明所述基于知识图谱的社会治理事件挖掘装置100可以安装于电子设备中。根据实现的功能,所述基于知识图谱的社会治理事件挖掘装置100可以包括指令接收模块101、新闻讨论网络构建模块102、热点治理事件判断模型构建模块103及程序优化模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

所述指令接收模块101,用于接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层;

所述新闻讨论网络构建模块102,用于根据所述新闻发布层及新闻讨论层构建新闻讨论网络,其中新闻讨论网络的构建过程包括:

获取网络新闻讨论程序中所有的社交账号,并根据新闻讨论层中每个社交账号是否发起过新闻讨论帖为依据,将所有的社交账号分为新闻讨论账号和新闻浏览账号;

获取每个新闻讨论账号所发起新闻讨论帖的讨论文本,得到讨论文本集;

对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值;

根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,其中聚类文本集的聚类文本的数量小于或等于所述讨论文本集的讨论文本的数量;

从所述聚类文本集中去除新闻讨论账号数量小于指定讨论账号数量,及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集;

根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络;

所述热点治理事件判断模型构建模块103,用于根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,其中所述热点治理事件判断模型的构建过程,包括:

获取每个新闻讨论网络中的所有的社交账号,其中所有的社交账号包括新闻讨论账号和新闻浏览账号;

根据热点治理事件判断模型判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,其中行为倾向包括高频讨论、中频讨论及低频讨论;

根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,其中高频讨论判断模型和低频讨论判断模型统称为热点治理事件判断模型;

所述程序优化模块104,用于利用所述热点治理事件判断模型分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,将讨论文本增量记录在所述社会治理事件挖掘层的同时,基于每种行为倾向类型的讨论文本增量调整支持网络新闻讨论程序的硬件程序与软件程序,从而实现网络新闻讨论程序优化。

详细地,本发明实施例中所述基于知识图谱的社会治理事件挖掘装置100中的所述各模块在使用时采用与上述的图1中所述的基于知识图谱的社会治理事件挖掘方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。

如图3所示,是本发明一实施例提供的实现基于知识图谱的社会治理事件挖掘方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11和总线12,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于知识图谱的社会治理事件挖掘方法程序。

其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于知识图谱的社会治理事件挖掘方法程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于知识图谱的社会治理事件挖掘方法程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。

所述总线12可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线12可以分为地址总线、数据总线、控制总线等。所述总线12被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的基于知识图谱的社会治理事件挖掘方法程序是多个指令的组合,在所述处理器10中运行时,可以实现:

接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层;

根据所述新闻发布层及新闻讨论层构建新闻讨论网络,其中新闻讨论网络的构建过程包括:

获取网络新闻讨论程序中所有的社交账号,并根据新闻讨论层中每个社交账号是否发起过新闻讨论帖为依据,将所有的社交账号分为新闻讨论账号和新闻浏览账号;

获取每个新闻讨论账号所发起新闻讨论帖的讨论文本,得到讨论文本集;

对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值;

根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,其中聚类文本集的聚类文本的数量小于或等于所述讨论文本集的讨论文本的数量;

从所述聚类文本集中去除新闻讨论账号数量小于指定讨论账号数量,及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集;

根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络;

根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,其中所述热点治理事件判断模型的构建过程,包括:

获取每个新闻讨论网络中的所有的社交账号,其中所有的社交账号包括新闻讨论账号和新闻浏览账号;

根据热点治理事件判断模型判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,其中行为倾向包括高频讨论、中频讨论及低频讨论;

根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,其中高频讨论判断模型和低频讨论判断模型统称为热点治理事件判断模型;

利用所述热点治理事件判断模型分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,将讨论文本增量记录在所述社会治理事件挖掘层的同时,基于每种行为倾向类型的讨论文本增量调整支持网络新闻讨论程序的硬件程序与软件程序,从而实现网络新闻讨论程序优化。

具体地,所述处理器10对上述指令的具体实现方法可参考图1至图3对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。

本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:

接收社会治理事件挖掘指令,根据所述社会治理事件挖掘指令启动指定的网络新闻讨论程序,其中,网络新闻讨论程序根据用户行为分为新闻发布层、新闻讨论层及社会治理事件挖掘层;

根据所述新闻发布层及新闻讨论层构建新闻讨论网络,其中新闻讨论网络的构建过程包括:

获取网络新闻讨论程序中所有的社交账号,并根据新闻讨论层中每个社交账号是否发起过新闻讨论帖为依据,将所有的社交账号分为新闻讨论账号和新闻浏览账号;

获取每个新闻讨论账号所发起新闻讨论帖的讨论文本,得到讨论文本集;

对所述讨论文本集中每个讨论文本均执行文本相似度计算,得到文本相似值;

根据所述文本相似值对所述讨论文本集执行聚类,得到聚类文本集,其中聚类文本集的聚类文本的数量小于或等于所述讨论文本集的讨论文本的数量;

从所述聚类文本集中去除新闻讨论账号数量小于指定讨论账号数量,及新闻浏览账号数量小于指定浏览账号数量的聚类文本,得到高频文本集;

根据所述新闻发布层索引出高频文本集中每个高频文本的多个社交行为,并以高频文本为网络中心点、每个高频文本的多个社交行为为网络边缘点,构建得到所述新闻讨论网络;

根据所述新闻讨论网络,构建网络新闻讨论程序中的热点治理事件判断模型,其中所述热点治理事件判断模型的构建过程,包括:

获取每个新闻讨论网络中的所有的社交账号,其中所有的社交账号包括新闻讨论账号和新闻浏览账号;

根据热点治理事件判断模型判断每个社交账号在对应的新闻讨论网络中的行为倾向,得到高频率讨论账号、中频率讨论账号及低频率讨论账号,其中行为倾向包括高频讨论、中频讨论及低频讨论;

根据中频率讨论账号,构建高频率讨论账号对应的高频讨论判断模型,及低频率讨论账号的低频讨论判断模型,其中高频讨论判断模型和低频讨论判断模型统称为热点治理事件判断模型;

利用所述热点治理事件判断模型分析网络新闻讨论程序在未来的每种行为倾向类型的讨论文本增量,将讨论文本增量记录在所述社会治理事件挖掘层的同时,基于每种行为倾向类型的讨论文本增量调整支持网络新闻讨论程序的硬件程序与软件程序,从而实现网络新闻讨论程序优化。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

相关技术
  • 一种基于知识图谱的数据推理方法、装置、服务器和介质
  • 一种基于知识图谱的推荐方法及装置
  • 基于知识图谱的车辆故障检测方法、装置及存储介质
  • 一种自动创建多层次事件和场景图谱特征的方法、装置及其应用
  • 基于知识图谱的社会治理领域要素的深度挖掘方法
  • 基于知识图谱的社会治安综合治理领域数据融合方法
技术分类

06120115924748