掌桥专利:专业的专利平台
掌桥专利
首页

一种舆情传播力分析方法

文献发布时间:2023-06-19 09:58:59


一种舆情传播力分析方法

技术领域

本发明属于信息分析技术领域,尤其涉及一种舆情传播力分析方法。

背景技术

随着网络发展,特别是新媒体技术的高速发展与迭代,全球信息的边界越来越模糊,用户可通过多种渠道了解世界。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论。

新媒体在带来便捷性的同时,也带来了巨大的监管压力。网友通过网络来表达观点,通过转发与转载等方式,可以在非常短的时间内在造成巨大的舆论影响。如果舆论是负面的,有可能会造成负面情绪的蔓延,如果处理不及时,会带来不好的影响。

因此,需要一种舆情传播力分析方法,能够对网络舆情进行实时、准确、快速的监控和分析,让相关人员可了解舆情的实时情况,在需要干预时能及时作出应对。

发明内容

本发明的目的在于,提供一种舆情传播力分析方法,能够对网络舆情进行实时、准确、快速的监控和分析,让相关人员可了解舆情的实时情况,在需要干预时能及时作出应对。

本发明提供的基础方案为:

一种舆情传播力分析方法,包括:

S1,从指定的信息入口处采集数据信息;

S2,对采集的数据信息进行标准化处理;

S3,用预设的信息情感模型,对标准化处理后的数据信息进行情感分析,情感分析的结果包括正面属性、中性属性和负面属性;

S4,将情感分析的结果存储到数据库中,并对情感分析后的数据结果进行统计;

S5,筛选出带有负面属性数据结果,进行传播路径分析和关键传播点分析;

S6,展示统计结果以及带有负面属性的分析结果。

基础方案工作原理及有益效果:

使用本方法,从指定的信息入口采集数据信息,并对采集的信息进行标准化处理后,会用预设的信息情感模型,对标准化处理后的数据信息进行情感分析。之后,对情感分析的结果进行统计,并将带有负面属性数据的结果筛选出来。

当发现带有负面属性的分析结果时,会将这些带有负面属性的数据结果筛选出来,并对其进行路径传播分析和关键传播点分析。

通过路径传播分析,可以对其传播途径进行层层挖掘,了解这些负面属性信息的具体传播过程,便于从源头对其进行处理。通过关键传播点分析,可以了解到关键性的传播节点,即那些拥有大量转发/回复/跟帖的关键用户,便于在对舆情传播进行控制时,找到重点突破对象。

使用本方法,可以实时、准确、快速的进行网络舆情的监控和分析,让相关人员可了解舆情的实时情况。并能够在存在负面舆情时,快速找到其传播链和关键传播节点,在需要干预时能及时准确的作出相应措施。

进一步,S1中,采集数据的步骤包括:

S11,把预设的数据采集的页面作为入口点,爬取起始页面上的信息,并且把爬取内容组成有效的结构化数据;

S12,将用户的UID和当前页面的URL组成新的URL,存入到数据采集列表入口中;

S13,将爬取到的数据存储到本地数据库中。

这样的设置,便于爬取当前页面内容,以及后续的数据更新。

进一步,S2中,标准化处理包括分词、文本分类和聚类。

进一步,S3中,预设的信息情感模型的训练步骤包括:

S311,抓取用于训练的信息内容;

S312,对用于训练的信息进行特征提取;

S313,根据用于训练的信息特征以及机器学习算法模块进行训练并建立信息情感模型。

进一步,S3中,情感分析的步骤包括:

S321,抓取待识别信息内容;

S322,对待识别信息进行特征提取;

S323,根据待识别信息特征用预设的信息情感模型判断信息是属于正面、中性还是负面。

进一步,S312及S322中,特征提取时,使用的技术均包括自然语言分析中的智能分词技术和文本相似技术。

进一步,S1中,采集数据的信息入口包括网站、客户端、微博、头条号和微信公众号。

通过全网多级渠道采集数据信息,能够从多个维度对舆情进行全方位的智能分析,使分析结果更加客观和全面。

进一步,S1中,按照预设的频率进行数据信息采集。

可以根据具体的情况,设置数据信息采集的频率,合理利用系统资源。

进一步,S6中,展示的方式为可视化图标展示。

可以更加一目了然的对统计结果进行了解。

附图说明

图1为本发明一种舆情传播力分析方法实施例一的流程图。

具体实施方式

下面通过具体实施方式进一步详细说明:

实施例一

如图1所示,一种舆情传播力分析方法,包括:

S1,按照预设的频率,从指定的信息入口处采集数据信息;具体的,采集数据的信息入口包括网站、客户端、微博、头条号和微信公众号。

具体的,包括:S11,把预设的数据采集的页面作为入口点,爬取起始页面上的信息,并且把爬取内容组成有效的结构化数据;S12,将用户的UID和当前页面的URL组成新的URL,存入到数据采集列表入口中;S13,将爬取到的数据存储到本地数据库中。

S2,对采集的数据信息进行标准化处理;本实施例中,标准化处理包括分词、文本分类和聚类。

S3,用预设的信息情感模型,对标准化处理后的数据信息进行情感分析,情感分析的结果包括正面属性、中性属性和负面属性。

其中,预设的信息情感模型的训练步骤包括:S311,抓取用于训练的信息内容;S312,对用于训练的信息进行特征提取;S313,根据用于训练的信息特征以及机器学习算法模块进行训练并建立信息情感模型。

情感分析的步骤包括:S321,抓取待识别信息内容;S322,对待识别信息进行特征提取;S323,根据待识别信息特征用预设的信息情感模型判断信息是属于正面、中性还是负面。

S312及S322中,特征提取时,使用的技术均包括自然语言分析中的智能分词技术和文本相似技术。

S4,将情感分析的结果存储到数据库中,并对情感分析后的数据结果进行统计;

S5,筛选出带有负面属性数据结果,进行传播路径分析和关键传播点分析;

S6,展示统计结果以及带有负面属性的分析结果。本实施例中,展示的方式为可视化图标展示。

具体实施过程如下:

使用本方法,采集数据的信息入口包括网站、客户端、微博、头条号和微信公众号。通过全网多级渠道采集数据信息,能够从多个维度对舆情进行全方位的智能分析,使分析结果更加客观和全面。

从指定的信息入口采集数据信息,并对采集的信息进行标准化处理后,会用预设的信息情感模型,对标准化处理后的数据信息进行情感分析。之后,对情感分析的结果进行统计,并将带有负面属性数据的结果筛选出来。

当发现带有负面属性的分析结果时,会将这些带有负面属性的数据结果筛选出来,并对其进行路径传播分析和关键传播点分析。

通过路径传播分析,可以对其传播途径进行层层挖掘,了解这些负面属性信息的具体传播过程,便于从源头对其进行处理。通过关键传播点分析,可以了解到关键性的传播节点,即那些拥有大量转发/回复/跟帖的关键用户,便于在对舆情传播进行控制时,找到重点突破对象。

实际使用时,本发明能够对网站、客户端、微博、头条号、微信公众号、等数信息端口全方位采集,不留死角,定向采集+非定向补充采集数据,每天约二十万+数据。分布式集群采集,单个采集器支持200个网站、1000个采集器并行,网站、论坛等最快3分钟轮询一次,微博信息实时推送。数台云服务器,7*24小时无间断采集;自动类聚达1000篇/分钟,1亿篇文章关键词检索响应时间0.03秒。模板和脚本引擎实现元数据抽取;信息抽取准确率达99%以上。自动分析页面层级关系,采集到最深层内容;可采集论坛跟帖、微博评论、网站评论。

使用本方法,可以实时、准确、快速的进行网络舆情的监控和分析,让相关人员可了解舆情的实时情况。并能够在存在负面舆情时,快速找到其传播链和关键传播节点,在需要干预时能及时准确的作出相应措施。

实施例二

由于部分互联网用户在表述自己的观点,尤其是当自己的观点带有负向情绪时,为了显示自己的表达能力和技巧,不会直接说出自己想说的话,而是将自己想表达的内容通过一种隐晦的方式暗藏在表达的内容中,而其表达的内容,从语言上分析完全不存在负向的内容。对于这些内容,采用实施例一中的技术方案,并不能发现发表者真正想表达的东西。而这些用户由于自己的表达方式及技巧,通常都拥有较大的受众群体和影响力。虽然产生了负面的传播效应,但是使用实施例的技术方案却发现不了负面传播的源头。

现在的技术中,虽然有使用如NLP等语言分析技术来进行反讽内容的分析。但是,互联网的语言习惯更新非常快,一个训练好的分析模型,经常用不了多久时间,便已无效,需要重新投入训练。一来效率低下,二来在时效性方面难以保证,很多反讽内容由于未被识别出,难以对其进行及时性的处理。

未解决上述问题,本实施例中,与实施例一不同的是,本实施例中,

还包括:

S11,当采集数据信息包括留言信息时,将数据信息分类为发表信息和留言信息,并进行关联;

S41,将发表信息的情感分析数据,和与其关联的留言信息的情感分析数据进行对比分析,若对比分析结果为发表信息正常但关联的留言信息异常时,将发表内容标记为疑似内涵内容;

S61,展示疑似内涵内容。

具体实施过程如下:

当出现互联网用户为了显示自己的表达能力和技巧,通过隐晦的方式将自己的负向观点暗藏在表达的内容中时,正常的分析方法,只会将这些内容当作正常的内容进行处理,即使采取现有的NLP系统来进行反讽分析,时效性上也难以保障。

使用本方法,在采集数据信息包括留言信息时,会将数据信息分类为发表信息和留言信息,并进行关联。之后,会将发表信息的情感分析数据和与其关联的留言信息的情感分析数据进行对比分析,若对比分析结果为发表信息正常但关联的留言信息异常时,将发表内容标记为疑似内涵内容。这样,虽然不能够百分百准确的将带有负面观点的内涵文章识别出来,但是,却已经足够将绝大多数这类文章识别出来并标记。在然后,对这些疑似内涵内容进行展示,由工作人员进行核对识别。

虽然由于互联网用户的跳脱性思维,采用本方法,有时会出现因为正常的调侃评论而将其识别为内涵文章的情况。但是,这类情况只是少数。

除此,当负向观点已经有一定传播时,通过本方法,和现有的其他方法相比,也能够快速的排查、锁定到传播这类内涵文章的关键传播节点。

以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

相关技术
  • 一种舆情传播力分析方法
  • 一种基于媒体与人际影响的舆情传播模型及其传播方法
技术分类

06120112378793