基于多平台的议题网络关注度信息处理方法、系统及应用
文献发布时间:2023-06-19 16:06:26
技术领域
本发明属于网络空间认知域技术领域,尤其涉及一种基于多平台的议题网络关注度信息处理方法、系统及应用。
背景技术
目前,议题网络关注度反映的是一段时间内议题在网络上被关注的程度,是议题网络影响力评价的重要指标之一。
关于议题网络关注度的计算一般分为两种,一种是直接通过爬取网络数据,统计议题的相关发帖数目来表示;另外一种是爬取议题相关发帖的互动数据,包括点赞、评论、转发、阅读等,对其进行简单的求和来指代议题网络关注度。
通过上述分析,现有技术存在的问题及缺陷为:(1)现有技术仅使用发帖数据无法科学完整地表示网民对议题的关注情况。(2)现有技术仅使用社交平台数据无法完全涵盖全网的关注情况。(3)现有技术对于议题网络发帖的互动数据,缺乏一个有效的权重配比,但事实上发帖数据和互动数据对于关注度的呈现是不一样的。(4)现有技术对于不同地区的网络议题,数据采集并未带有明显的地域性,使得获得的数据不能准确的反映议题在目标地区及目标群体中的关注度,判断的结果准确性差。(5)现有技术关注度信息存在时效性差和数据量不准确问题,导致在有突发事件导致关注度有突变时关注度的变化预测不准确。
解决以上问题及缺陷的难度为:需要解决上述技术难点,需要拥有对目标议题辐射范围及数据有效范围进行界定的能力,同时需要拥有对相关数据的实时监控采集能力,对社交数据及新闻媒体数据各项指标影响力权重有深入研究。
解决以上问题及缺陷的意义为:提出一种更具有地域代表性、更能反映议题在目标群体中的关注度的计算方法,提高目标议题关注度的计算科学性和提高关注度对实际情况的拟合能力。
基于议题网络关注度计算存在的问题,本方案提出了一种基于多平台的议题网络关注度的计算方法,其中采用的数据囊括了社交平台、新闻媒体、地方报纸杂志等多源数据,解决了传统计算关注度存在时效性和数据量的问题,利用网络上获取到的数据,实时地计算各大议题的实时关注度,及时反映出突发事件导致关注率有突变时关注度的变化,弥补了议题网络关注度计算方法的空白。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供了一种基于多平台的议题网络关注度信息处理方法、系统及应用。
所述技术方案如下:一种基于多平台的议题网络关注度信息处理方法包括:利用网络获取社交平台、新闻媒体、地方报纸杂志数据,并实时计算上述及数据的关注度,及时计算出突发事件导致关注率有突变时关注度的变化。
具体包括以下步骤:
步骤一,依据议题网络关注度的计算对象,使用话题聚类算法及关键字提取算法提取议题的社交平台数据、新闻媒体数据及地方报纸杂志数据;
步骤二,从提取的议题相关话题的发帖数据及发帖的互动数据两个维度分别计算各自的网络关注度,并以发帖数据和互动数据的加权和作为议题社交平台的网络关注度;
步骤三,基于新闻媒体的影响力及新闻媒体的报道信息计算新闻媒体的关注度;
步骤四,基于报纸杂志的影响力及报纸杂志的报道信息计算报纸杂志的关注度;
步骤五,将议题最终网络关注度计算为社交媒体的网络关注度、新闻媒体的网络关注度与报纸杂志的关注度之加权和。
在一实施例中,所述步骤二具体包括:(1)计算议题相关的发帖数,以及TOP50议题的发帖数,计算每个社交平台上该议题的关注度,计算公式如下:
其中net_attention_post代表该平台的议题发帖关注度,num_pos表示该议题的相关发帖数量,num_total_post表示该平台的发帖总数量;
(2)发帖的互动关注度是由帖子下的转发、点赞、评论数据结合专家建议给出的权重加以计算得到;计算公式如下:
其中,net_attention_interaction是发帖的互动关注度,num_share是帖子的转发数,num_like是帖子的点赞数,num_comment是发帖的评论数,total_netizen_num是该平台的网民总数;
(3)议题的单个社交平台网络关注度计算:
attention
其中attention
(4)议题社交平台的总体的网络关注度计算:
attention
在一实施例中,所述步骤三具体包括:1)基于新闻媒体的Alexa网站排名,对新闻网站的权重进行分配,具体计算方式如下:
其中x
2)新闻媒体对议题的网络关注度计算方式如下:
其中attention
在一实施例中,所述步骤四具体包括:(i)基于地方报纸杂志排名,对报纸杂志的权重进行分配,具体计算方式如下:
其中x
(ii)报纸杂志对议题的网络关注度计算方式如下:
其中attention
在一实施例中,在步骤五中具关注度之和为:
ttention=attention
本发明的另一目的在于提供一种基于多平台的议题网络关注度信息处理系统包括:
社交平台,用于从议题发帖和互动数据进行议题的网络关注度评估;
新闻媒体单元,用于对议题的报道数量以及参与报道的媒体数量评估对议题的关注程度;
地方报纸杂志单元,用于采用刊登相关议题文章的机构数量以及刊登相关议题的文章总数量反映关注度。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于多平台的议题网络关注度信息处理方法。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于多平台的议题网络关注度信息处理方法。
本发明的另一目的在于提供一种网络信息数据处理终端,所述网络信息数据处理终端用于实现所述基于多平台的议题网络关注度信息处理方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
本发明基于关注的目标议题,在数据采集方面,不同于现有技术的一锅端,首先分析议题影响范围,确定数据采集的目标群体及目标区域,在数据层面上更大程度的确保结果具有更好的代表性。
不同于现有技术的简单将发帖及互动数据的关注度进行求和,本发明基于对网络互动数据的深入分析,创新性地提出了为网络互动指标添加科学、合理的权重配比,以加权和来反映最终的关注度,为议题的网络关注度计算提供了更科学合理的理论支撑。
在信息时代中,网络的影响辐射到线下。故本发明结合了新闻媒体、地方报纸杂志,与社交媒体数据构成三个大的数据来源构建议题网络关注度计算模型,依托实时采集技术,实现了网络关注度动态的实时综合计算。
当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明的公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明实施例提供的基于多平台的议题网络关注度信息处理方法流程图。
图2是本发明实施例提供的基于多平台的议题网络关注度信息处理系统示意图。
图中:1、社交平台;2、新闻媒体单元;3、地方报纸杂志单元。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
议题网络关注度是动态变化的,因此本发明方法是基于一段时间内议题在各个社交平台、新闻媒体及地方报纸杂志的相关数据进行计算的。
如图1所示,本发明实施例提供的基于多平台的议题网络关注度信息处理方法包括:
第1步,依据议题网络关注度的计算对象,提取议题的社交平台数据、新闻媒体数据及地方报纸杂志数据;
第2步,从议题相关发帖及发帖的互动数据两个维度计算议题社交平台的网络关注度,具体步骤如下:
(2.1)计算议题相关的发帖数,以及TOP50议题的发帖数,来计算每个社交平台上该议题的关注度,计算公式如下:
其中net_attention_post代表该平台的议题发帖关注度,num_pos表示该议题的相关发帖数量,num_total_post表示该平台的发帖总数量。
(2.2)发帖的互动关注度是由帖子下的转发、点赞、评论数据结合专家建议给出的权重加以计算得到。计算公式如下:
其中,net_attention_interaction是发帖的互动关注度,num_share是帖子的转发数,num_like是帖子的点赞数,num_comment是发帖的评论数,total_netizen_num是该平台的网民总数。
(2.3)议题的单个社交平台网络关注度计算:
attention
其中attention
(2.4)议题社交平台的总体的网络关注度计算:
attention
第3步,基于新闻媒体的影响力及新闻媒体相关报道的信息计算新闻媒体的关注度,具体步骤如下:
(3.1)基于新闻媒体的Alexa网站排名,对新闻网站的权重进行分配,具体计算方式如下:
其中x
(3.2)新闻媒体对议题的网络关注度计算方式如下:
其中attention
第4步,基于报纸杂志的影响力及报纸杂志相关的报道信息计算报纸杂志的关注度,具体步骤如下:
(4.1)基于地方报纸杂志排名,对报纸杂志的权重进行分配,具体计算方式如下:
其中x
(4.2)报纸杂志对议题的网络关注度计算方式如下:
其中attention
第5步,议题最终网络关注度计算为社交媒体的网络关注度、新闻媒体的网络关注度与报纸杂志的关注度之和。
ttention=attention
如图2所示本发明实施例提供的基于多平台的议题网络关注度信息处理系统包括:
社交平台1,是议题在网络上的最为直接的讨论阵地,主要从议题相关发帖和互动数据(点赞、转发、评论)进行议题在社交平台的网络关注度评估,其中发帖主要从发帖数量进行评价;互动数据主要是从转发数、点赞数、评论数,辅以专家建议判定的权重配比加以计算来进行评价。
新闻媒体单元2,作为网络信息传播的重要渠道,是反映大众对议题关注情况的另外一个重要维度。从新闻媒体单元2关于议题的报道数量以及参与报道的媒体数量来评估对议题的关注程度。
地方报纸杂志单元3,刊登内容很大程度上会受网络热点议题影响,是议题网络关注度的线下直观体现。且地方报纸杂志单元3更关注的是与本地相关的议题,能反映出网络议题在当地的影响力。这里采用刊登相关议题文章的机构数量以及刊登相关议题的文章总数量来反映关注度。
本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。
- 基于多平台的议题网络关注度信息处理方法、系统及应用
- 基于关注度的同源信息搜索引擎聚合显示方法的获取网页用户关注度PageFocus的系统