掌桥专利:专业的专利平台
掌桥专利
首页

基于人工智能的舆情风险确定方法、装置、服务器及介质

文献发布时间:2024-04-18 19:58:30


基于人工智能的舆情风险确定方法、装置、服务器及介质

技术领域

本申请涉及自然语言处理技术领域,尤其涉及一种基于人工智能的舆情风险确定方法、装置、服务器及存储介质。

背景技术

当发生金融舆情事件时,如果不及时准确地对金融舆情事件进行处理,金融舆情事件的负面影响会导致金融企业的股价下跌和信誉受损等。因此,需要对金融舆情事件进行风险识别,然后根据风险识别结果来确定金融舆情事件的应对预案,以减少金融舆情事件带来的负面影响。目前,主要是通过机器学习模型对报道文章进行分析来实现金融舆情事件的风险识别,然而,仅使用报道文章无法准确地识别金融舆情事件的风险。

发明内容

本申请实施例提供一种基于人工智能的舆情风险确定方法、装置、服务器及存储介质,旨在提高金融舆情事件的风险等级的识别准确性。

第一方面,本申请实施例提供一种基于人工智能的舆情风险确定方法,包括:

获取金融舆情事件对应的报道文章集合,所述报道文章集合包括不同新闻媒体发布的与所述金融舆情事件关联的报道文章;

确定每个所述报道文章中的各句子的风险类型,并根据所述句子的风险类型,确定所述金融舆情事件的第一风险等级;

确定每个所述新闻媒体的媒体层级,并将最高的所述媒体层级对应的新闻媒体作为目标新闻媒体;

根据所述目标新闻媒体的媒体层级和所述目标新闻媒体发布的与所述金融舆情事件关联的报道文章的发布版面位置,确定所述金融舆情事件的第二风险等级;

通过预设的命名实体识别模型从每个所述报道文章中提取命名实体,并根据所述命名实体,确定所述金融舆情事件的第三风险等级;

根据所述第一风险等级、所述第二风险等级和所述第三风险等级,确定所述金融舆情事件的目标风险等级。

第二方面,本申请实施例还提供一种舆情风险确定装置,所述舆情风险确定装置包括:

获取模块,用于获取金融舆情事件对应的报道文章集合,所述报道文章集合包括不同新闻媒体发布的与所述金融舆情事件关联的报道文章;

内容风险确定模块,用于确定每个所述报道文章中的各句子的风险类型,并根据所述句子的风险类型,确定所述金融舆情事件的第一风险等级;

媒体确定模块,用于确定每个所述新闻媒体的媒体层级,并将最高的所述媒体层级对应的新闻媒体作为目标新闻媒体;

媒体风险确定模块,用于根据所述目标新闻媒体的媒体层级和所述目标新闻媒体发布的与所述金融舆情事件关联的报道文章的发布版面位置,确定所述金融舆情事件的第二风险等级;

关联风险确定模块,用于通过预设的命名实体识别模型从每个所述报道文章中提取命名实体,并根据所述命名实体,确定所述金融舆情事件的第三风险等级;

综合风险确定模块,用于根据所述第一风险等级、所述第二风险等级和所述第三风险等级,确定所述金融舆情事件的目标风险等级。

第三方面,本申请实施例还提供一种服务器,所述服务器包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上第一方面所述的舆情风险确定方法。

第四方面,本申请实施例还提供一种存储介质,所述存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如第一方面所述的舆情风险确定方法。

本申请实施例提供一种舆情风险确定方法、装置、服务器及存储介质,该方法通过金融舆情事件对应的报道文章集合中的每个报道文章内的各句子的风险类型,可以准确地确定金融舆情事件在内容维度下的风险等级,并且确定每个新闻媒体的媒体层级,并将最高的媒体层级对应的新闻媒体作为目标新闻媒体,根据目标新闻媒体的媒体层级和所述目标新闻媒体发布的与金融舆情事件关联的报道文章的发布版面位置,确定金融舆情事件在媒体维度下的风险等级,同时还根据每个报道文章中的命名实体,确定金融舆情事件在命名实体维度下的风险等级,最后通过综合考虑金融舆情事件在内容维度、媒体维度和命名实体维度下的风险等级、可以准确地确定金融舆情事件的风险等级,极大地提高了金融舆情事件的风险等级的识别准确性。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种舆情风险确定方法的流程示意图;

图2是图1中的舆情风险确定方法的子步骤流程示意图;

图3是本申请实施例中的风险类型集合的一示意图;

图4是本申请实施例提供的另一种舆情风险确定方法的流程示意图;

图5是本申请实施例提供的一种舆情风险确定装置的示意性框图;

图6是本申请实施例提供的另一种舆情风险确定装置的示意性框图;

图7是本申请实施例提供的一种服务器的结构示意性框图。

本申请目的的实现、功能特点及优点将结合实施例,参阅附图做进一步说明。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

当发生金融舆情事件时,如果不及时准确地对金融舆情事件进行处理,金融舆情事件的负面影响会导致金融企业的股价下跌和信誉受损等。因此,需要对金融舆情事件进行风险识别,然后根据风险识别结果来确定金融舆情事件的应对预案,以减少金融舆情事件带来的负面影响。目前,主要是通过机器学习模型对报道文章进行分析来实现金融舆情事件的风险识别,然而,仅使用报道文章无法准确地识别金融舆情事件的风险。

为解决上述问题,本申请实施例提供一种基于人工智能的舆情风险确定方法、装置、服务器及存储介质。该方法基于金融舆情事件对应的报道文章集合中的每个报道文章内的各句子的风险类型,可以准确地确定金融舆情事件在内容维度下的风险等级,并且确定每个新闻媒体的媒体层级,并将最高的媒体层级对应的新闻媒体作为目标新闻媒体,根据目标新闻媒体的媒体层级和所述目标新闻媒体发布的与金融舆情事件关联的报道文章的发布版面位置,确定金融舆情事件在媒体维度下的风险等级,同时还根据每个报道文章中的命名实体,确定金融舆情事件在命名实体维度下的风险等级,最后通过综合考虑金融舆情事件在内容维度、媒体维度和命名实体维度下的风险等级、可以准确地确定金融舆情事件的风险等级,极大地提高了金融舆情事件的风险等级的识别准确性。

本申请实施例中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参阅图1,图1是本申请实施例提供的一种基于人工智能的舆情风险确定方法的流程示意图。

如图1所示,该舆情风险确定方法包括步骤S101至步骤S106。

步骤S101、获取金融舆情事件对应的报道文章集合。

本实施例中,该报道文章集合包括不同新闻媒体发布的与金融舆情事件关联的报道文章。该金融舆情事件可以是与设定的金融企业相关的任一舆情事件,该金融舆情事件可以用舆情文本进行描述。例如,在客户A驾驶车辆出现交通事故后,向保险公司B申请交强险的(机动车交通事故责任强制保险)理赔,保险公司B派遣员工C去事故现场进行勘察,但员工C超过约定时间很长一段时间才到达事故现场,并且到达事故现场后,对客户A的态度极其不好,还与客户A发生争吵,客户A将此事曝光到网络,服务器可以从网络中获取描述描述该事件的舆情文本,进而得到与保险公司B相关的金融舆情事件。

在一些实施例中,服务器使用预设爬虫程序从网络中爬取与设定的金融企业名称相关的报道文章;通过聚类模型对爬取的全部新闻报告文章进行聚类处理,得到不同金融舆情事件各自对应的报道文章集合,并将每个报道文章集合存储至分布式存储系统的存储分区,一个报道文章集合对应一个存储分区;对于每个报道文章集合,根据报道文章集合中的报道文章的新闻正文,生成舆情文本,该舆情文本用于描述金融舆情事件,并将该舆情文本与存储分区进行关联绑定。其中,预设爬虫程序可以基于实际情况进行设置,本申请实施例对此不做具体限定。

在一些实施例中,终端设备显示舆情风险评估界面,并在舆情风险评估界面中显示用户输入或者上传的舆情文本;响应于用户对该舆情风险评估界面中的确认按键的触发操作,根据该舆情文本生成舆情风险评估请求,将该舆情风险评估请求发送给服务器;服务器在接收到该舆情风险评估请求时,对该舆情风险评估请求进行解析,得到舆情文本;从与舆情文本关联的存储分区中获取舆情文本描述的金融舆情事件对应的报道文章集合。

在一些实施例中,获取金融舆情事件对应的报道文章集合可以包括:服务器每隔预设时间从不同的存储分区中获取金融舆情事件对应的报道文章集合。其中,预设时间可以基于实际情况进行设置,本申请实施例对此不做具体限定。例如,预设时间为30分钟,分布式存储系统包括存储分区A、存储分区B和存储分区C,存储分区A、存储分区B和存储分区C分别与舆情文本Text1、舆情文本Text2和舆情文本Text3对应,服务器在时刻T

步骤S102、确定每个报道文章中的各句子的风险类型,并根据句子的风险类型,确定金融舆情事件的第一风险等级。

本实施例中,每个句子的风险类型可以为一个或多个,本申请实施例对此不做具体限定。其中,句子的风险类型可以包括产品质量风险、公司治理风险、组织结构风险、违法违规风险和经营不善风险等的至少一项。

在一些实施例中,确定每个报道文章中的各句子的风险类型可以包括:对每个报道文章进行分句,得到句子集合;将句子集合中的各句子输入预设的风险分类模型进行风险分类处理,得到每个句子的风险类型。其中,风险分类模型是根据多个第一训练样本对预设多分类模型进行训练得到的,第一训练样本包括训练文本和训练文本中的各句子的风险类型。可以理解的是,预设多分类模型可以基于实际情况进行设置,本申请实施例对此不做具体限定。例如,预设多分类模型为梯度提升决策树(Gradient Boosting Decision Tree,GBDT)或卷积神经网络模型(Convolutional Neural Networks,CNN)等。

在一些实施例中,如图2所示,步骤S102包括:子步骤S1021至子步骤S1026。

子步骤S1021,将全部句子的风险类型作为风险类型集合,风险类型集合包括一种或多种风险类型。

例如,如图3所示,某一金融舆情事件对应的报道文章集合10包括第一报道文章20和第二报道文章30。其中,第一报道文章20包括第一句子21、第二句子22和第三句子23,第二报道文章30包括第四句子31、第五句子32和第六句子33。第一句子21的风险类型包括Type_A和Type_B,第二句子22的风险类型为Type_C,第三句子23的风险类型为Type_B。第四句子31的风险类型为Type_B,第五句子32的风险类型包括Type_B和Type_C,第六句子33的风险类型包括Type_A和Type_C。因此,将第一句子21、第二句子22、第三句子23、第四句子31、第五句子32和第六句子33的风险类型作为风险类型集合40,风险类型集合40包括Type_A、Type_B、Type_C、Type_B、Type_B、Type_B、Type_C、Type_A和Type_C这9个风险类型,风险类型集合40包括包括Type_A、Type_B和Type_C这三种风险类型。

子步骤S1022、统计风险类型集合中的每种风险类型的数量,并确定每种风险类型的全部句子在对应报道文章中的位置。

本实施例中,句子在对应报道文章中的位置可以包括标题、摘要、正文首部、正文中部和正文尾部中的任一项。例如,如图3所示,统计得到风险类型集合40中Type_A、Type_B和Type_C的数量分别为2个、4个和3个,由于风险类型Type_A与第一句子21和第六句子33对应,则需要确定第一句子21在第一报道文章20中的位置以及第六句子33在第二报道文章30中的位置。由于风险类型Type_B与第一句子21、第三句子23、第四句子31和第五句子32对应,则需要确定第一句子21和第三句子23分别在第一报道文章20中的位置以及第四句子31和第五句子32分别在第二报道文章30中的位置。由于风险类型Type_C与第二句子22、第五句子32和第六句子33对应,则需要确定第二句子22第一报道文章20中的位置以及第五句子32和第六句子33分别在第二报道文章30中的位置。

子步骤S1023、根据每种风险类型的数量以及每种风险类型的全部句子在对应报道文章中的位置,确定每种风险类型的目标重要性评分。

例如,对于风险类型Type_A,可以根据风险类型Type_A的数量以及风险类型Type_A对应的第一句子21在第一报道文章20中的位置和第六句子33在第二报道文章30中的位置,确定风险类型Type_A的目标重要性评分。

对于风险类型Type_B,可以根据风险类型Type_B的数量以及风险类型Type_B对应的第一句子21和第三句子23分别在第一报道文章20中的位置以及第四句子31和第五句子32分别在第二报道文章30中的位置,确定风险类型Type_B的目标重要性评分。

对于风险类型Type_C,可以根据风险类型Type_C的数量以及风险类型Type_C对应的第二句子22第一报道文章20中的位置以及第五句子32和第六句子33分别在第二报道文章30中的位置,确定风险类型Type_C的目标重要性评分。

在一些实施例中,根据每种风险类型的数量以及每种风险类型的全部句子在对应报道文章中的位置,确定每种风险类型的目标重要性评分可以包括:对于每种风险类型,根据风险类型的数量,查询第一映射关系信息,得到风险类型的第一重要性评分,第一映射关系信息用于描述风险类型的数量与重要性评分之间的映射关系;根据风险类型的全部句子在对应报道文章中的位置,查询第二映射关系信息,得到风险类型的第二重要性评分,第二映射关系信息用于描述句子的位置与重要性评分之间的映射关系;对第一重要性评分和第二重要性评分进行加权求和,得到风险类型的目标重要性评分。

示例性的,对第一重要性评分和第二重要性评分进行加权求和,得到风险类型的目标重要性评分可以包括:计算第一加权系数和第一重要性评分的乘积,得到第一加权重要性评分;计算第二加权系数和第二重要性评分的乘积,得到第二加权重要性评分;对第一加权重要性评分和第二加权重要性评分进行求和,得到风险类型的目标重要性评分。其中,第一加权系数和第二加权系数之和为1,且可以基于实际情况进行设置,本申请实施例对此不做具体限定。例如,第一加权系数为0.75,第二加权系数为0.25。

子步骤S1024、按照每种风险类型的目标重要性评分的大小顺序,对每种风险类型进行排序,得到风险类型队列。

例如,风险类型Type_A、风险类型Type_B和风险类型Type_C的目标重要性评分分别为N1、N2和N3,且N2>N3>N1,则按照风险类型Type_A、风险类型Type_B和风险类型Type_C各自对应的目标重要性评分的大小顺序N2>N3>N1,对风险类型Type_A、风险类型Type_B和风险类型Type_C进行排序,可以得到风险类型队列[Type_B,Type_C,Type_A]。

子步骤S1025、将风险类型队列中的前N个风险类型确定为金融舆情事件的目标风险类型。

本实施例中,N为大于或等于1的整数。例如,风险类型队列[Type_B,Type_C,Type_A],N=2,则可以将风险类型队列[Type_B,Type_C,Type_A]中的前2个风险类型,即风险类型Type_B和风险类型Type_C确定为目标风险类型。

子步骤S1026、根据目标风险类型,确定金融舆情事件的第一风险等级。

本实施例中,可以查询风险类型与风险等级之间的映射关系表,得到目标风险类型对应的风险等级,并将查询得到的目标风险类型对应的风险等级确定为金融舆情事件的第一风险等级。其中,可以预先根据专家经验或业务经验建立风险类型与风险等级之间的映射关系表。

步骤S103、确定每个新闻媒体的媒体层级,并将最高的媒体层级对应的新闻媒体作为目标新闻媒体。

本实施例中,新闻媒体的媒体层级可以为中央权威、核心财经、综合门户、资讯客户端、自媒体和其他这6个层级中的任一层级。其中,中央权威、核心财经、综合门户、资讯客户端、自媒体和其他这6个层级中,媒体层级由低到高分别为其他、自媒体、资讯客户端、综合门户、核心财经和中央权威,中央权威这一层级最高,其他这一层级最低。

例如,发布金融舆情事件的新闻媒体包括新闻媒体R1、新闻媒体R2、新闻媒体R3和新闻媒体R4,新闻媒体R1、新闻媒体R2、新闻媒体R3和新闻媒体R4的媒体层级分别为其他、核心财经、综合门户和自媒体,由于新闻媒体R2的媒体层级最高,因此,可以将新闻媒体R2作为目标新闻媒体。

步骤S104、根据目标新闻媒体的媒体层级和目标新闻媒体发布的与金融舆情事件关联的报道文章的发布版面位置,确定金融舆情事件的第二风险等级。

本实施例中,该发布版面位置是指新闻媒体发布的与金融舆情事件关联的报道文章在新闻媒体网站上的版面位置。其中,该版面位置可以包括新闻媒体网站的首页第一屏、频道首页第一屏和其他版面位置等中的任一项。

在一些实施例中,根据目标新闻媒体的媒体层级和目标新闻媒体发布的与金融舆情事件关联的报道文章的发布版面位置,确定金融舆情事件的第二风险等级可以包括:根据目标新闻媒体的媒体层级以及目标新闻媒体发布的与金融舆情事件关联的报道文章的发布版面位置,查询媒体层级、发布版面位置与风险等级之间的映射关系表,得到与目标新闻媒体的媒体层级以及该发布版面位置对应的风险等级,并将查询得到的风险等级确定为金融舆情事件的第二风险等级。其中,可以预先根据专家经验或业务经验建立媒体层级、发布版面位置与风险等级之间的映射关系表。

步骤S105、通过预设的命名实体识别模型从每个报道文章中提取命名实体,并根据命名实体,确定金融舆情事件的第三风险等级。

本实施例中,该命名实体识别(Named Entity Recognition,NER)模型为预先根据多个样本数据对神经网络模型进行训练得到的,该样本数据包括样本文本以及标注的命名实体。其中,该命名实体可以包括金融企业的名称、金融高管人员的姓名和金融产品的名称等中的至少一项。

在一些实施例中,根据命名实体,确定金融舆情事件的第三风险等级的方式可以为:根据提取到的一个或多个命名实体,查询命名实体与风险等级之间的映射关系表,得到与一个或多个命名实体对应的风险等级,并将查询到的风险等级确定为金融舆情事件的第三风险等级。其中,可以预先根据专家经验或业务经验建立命名实体与风险等级之间的映射关系表。

步骤S106、根据第一风险等级、第二风险等级和第三风险等级,确定金融舆情事件的目标风险等级。

本实施例中,第一风险等级为金融舆情事件在内容维度下的风险等级,第二风险等级为金融舆情事件在媒体维度下的风险等级,第三风险等级为金融舆情事件在命名实体维度下的风险等级,通过综合考虑金融舆情事件在内容维度、媒体维度和命名实体维度下的风险等级、可以准确地确定金融舆情事件的风险等级,极大地提高了金融舆情事件的风险等级的识别准确性。

在一些实施例中,根据第一风险等级、第二风险等级和第三风险等级,确定金融舆情事件的目标风险等级可以包括:将第一风险等级、第二风险等级和第三风险等级中最高的风险等级确定为金融舆情事件的目标风险等级。或者,将第一风险等级、第二风险等级和第三风险等级中最高的风险等级作为候选风险等级;在该候选风险等级为多个的情况下,若该候选风险等级小于预设风险等级库中的最高风险等级,则将比该候选风险等级更高一级的风险等级确定为金融舆情事件的目标风险等级;若该候选风险等级为预设风险等级库中的最高风险等级,则将该候选风险等级确定为金融舆情事件的目标风险等级。

可以理解的是,预设风险等级库可以包括多个风险等级。举例而言,预设风险等级库包括风险等级I、风险等级II、风险等级III、风险等级IV和风险等级V,风险等级I为最高风险等级,风险等级V为最低风险等级。例如,第一风险等级为风险等级II,第二风险等级为风险等级III,第三风险等级为风险等级IV,由于风险等级II、风险等级III和风险等级IV中风险等级II最高,因此将风险等级II作为金融舆情事件的目标风险等级。又例如,第一风险等级为风险等级III,第二风险等级为风险等级III,第三风险等级为风险等级IV,由于风险等级III、风险等级III和风险等级IV中最高的风险等级有两个,即两个风险等级III,则可以将比风险等级III更高一级的风险等级II确定为金融舆情事件的目标风险等级。

在一些实施例中,如图4所示,步骤S101之后,还包括步骤S107-S110。

步骤S107、根据报道文章集合,确定金融舆情事件的报道文章总数、传播时长以及每个媒体层级对应的报道文章数量。

本实施例中,金融舆情事件的报道文章总数为报道金融舆情事件的报道文章的总数,金融舆情事件的传播时长为金融舆情事件在网络中传播的时长,媒体层级对应的报道文章数量是属于该媒体层级的新闻媒体报道的与金融舆情事件相关的报道文章的累计数量。

在一些实施例中,根据报道文章集合,确定金融舆情事件的报道文章总数、传播时长以及每个媒体层级对应的报道文章数量可以包括:统计报道文章集合中的报道文章的数量,得到金融舆情事件的报道文章总数;计算当前时间与每个报道文章的发布时间的差值,得到多个候选时长,并将多个候选时长中最大的候选时长作为传播时长;对于每个媒体层级,统计报道文章集合中的媒体层级所对应的报道文章的数量,得到媒体层级对应的报道文章数量。

举例而言,某一金融舆情事件对应的报道文章集合包括报道文章P1、报道文章P2、报道文章P3、报道文章P4和报道文章P5,并且发布报道文章P1、报道文章P2、报道文章P3、报道文章P4和报道文章P5的新闻媒体的媒体层级分别为核心财经、自媒体、综合门户、核心财经和自媒体,报道文章P1、报道文章P2、报道文章P3、报道文章P4和报道文章P5的分布时间分别为t1、t2、t3、t4和t5,则该金融舆情事件的报道文章总数为5,媒体层级为核心财经的对应的报道文章数量为2,媒体层级为综合门户对应的报道文章数量为1,媒体层级为自媒体对应的报道文章数量为2。分别计算当前时间t与t1、t2、t3、t4和t5之间的差值,得到t-t1=T1、t-t2=T2、t-t3=T3、t-t4=T4和t-t5=T5这5个候选时长,由于候选时长T3最大,则将候选时长T3确定为金融舆情事件的传播时长。

步骤S108、根据报道文章总数和传播时长,确定金融舆情事件的传播速度。

举例而言,用报道文章总数除以传播时长,得到金融舆情事件的传播速度。例如,金融舆情事件的报道文章总数为1000,传播时长为2小时,则该金融舆情事件的传播速度为1000/2=500,即每小时传播500篇与金融舆情事件相关的报道文章。

步骤S109、根据每个媒体层级对应的报道文章数量以及每个媒体层级对应的预设加权系数,确定金融舆情事件的媒体层级指数。

本实施例中,不同媒体层级对应的预设加权系数不同,且高媒体层级对应的预设加权系数大于低媒体层级对应的预设加权系数。其中,不同媒体层级对应的预设加权系数可以基于实际情况进行设置,本申请实施例对此不做具体限定。

在一些实施例中,根据每个媒体层级对应的报道文章数量以及每个媒体层级对应的预设加权系数,确定金融舆情事件的媒体层级指数可以包括:对于每个媒体层级,计算该媒体层级对应的报道文章数量与对应的预设加权系数的乘积,得到该媒体层级对应的媒体层级指数;累加每个媒体层级对应的媒体层级指数,得到金融舆情事件的媒体层级指数。

例如,报道某一金融舆情事件的新闻媒体的媒体层级包括核心财经、自媒体和综合门户,且核心财经、自媒体和综合门户对应的预设加权系数分别为k1、k2和k3,核心财经、自媒体和综合门户对应的报道文章数量分别为n1、n2和n3,则核心财经对应的媒体层级指数为k1*n1,自媒体对应的媒体层级指数为k2*n2,综合门户对应的媒体层级指数为k3*n3,该金融舆情事件的媒体层级指数为k1*n1+k2*n2+k3*n3。

步骤S110、根据报道文章总数、传播时长、传播速度和媒体层级指数,确定金融舆情事件的传播影响力等级。

本实施例中,金融舆情事件的传播影响力等级用于描述金融舆情事件的传播影响力,金融舆情事件的传播影响力等级越高,则金融舆情事件的传播影响力越强,金融舆情事件的传播影响力等级越低,则金融舆情事件的传播影响力越弱。本实施例通过报道文章总数、传播时长、传播速度和媒体层级指数,可以准确地确定金融舆情事件的传播影响力等级,通过金融舆情事件的风险等级和传播影响力等级,可以客观和全面地描述金融舆情事件的重要程度,使得金融企业可以及时地了解金融舆情事件的重要程度,从而采用对应的应对预案,极大地提高了用户体验。

在一些实施例中,根据报道文章总数、传播时长、传播速度和媒体层级指数,确定金融舆情事件的传播影响力等级可以包括:根据报道文章总数、传播时长、传播速度和媒体层级指数,确定金融舆情事件的传播影响力评分;根据金融舆情事件的传播影响力评分所处的分数区间,确定金融舆情事件的传播影响力等级。

示例性的,根据报道文章总数、传播时长、传播速度和媒体层级指数,确定金融舆情事件的传播影响力评分可以包括:通过预设对数函数分别对报道文章总数、传播速度和传播时长进行归一化处理,得报道文章总数对应的第一对数值、传播速度对应的第二对数值和传播时长对应的第三对数值;计算第一对数值与第一预设系数的乘积,得到第一评分,计算第二对数值与第二预设系数的乘积,得到第二评分,计算第三对数值与第三预设系数的乘积,得到第四评分;对第一评分、第二评分、第四评分和媒体层级指数进行求和,得到金融舆情事件的传播影响力评分。

其中,预设对数函数、第一预设系数、第二预设系数和第三预设系数可以基于实际情况进行设置,本申请实施例对此不做具体限定。例如,预设对数函数为y=log

示例性的,根据金融舆情事件的传播影响力评分所处的分数区间,确定金融舆情事件的传播影响力等级包括:根据金融舆情事件的传播影响力评分所处的分数区间,查询分数区间与传播影响力等级之间的映射关系表,得到传播影响力评分所处的分数区间对应的传播影响力等级,并将查询得到的传播影响力等级确定为金融舆情事件的传播影响力等级。其中,分数区间与传播影响力等级之间的映射关系表是预先根据专家经验或业务经验建立的。

举例而言,分数区间与传播影响力等级之间的映射关系表如下表1所示。

表1

例如,金融舆情事件的传播影响力评分为55,55处于分数区间(40,60],通过查询上述表1可知,金融舆情事件的传播影响力等级为C。又例如,金融舆情事件的传播影响力评分为79,79处于分数区间(60,80],通过查询上述表1可知,金融舆情事件的传播影响力等级为B。

在一些实施例中,根据报道文章总数、传播时长、传播速度和媒体层级指数,确定金融舆情事件的传播影响力等级可以包括:运行预设的传播影响力分级模型对报道文章总数、传播时长、传播速度和媒体层级指数进行传播影响力分级处理,得到金融舆情事件的传播影响力等级。其中,传播影响力分级模型是根据多个第二训练样本对预设神经网络模型进行训练得到的,第二训练样本包括历史金融舆情事件的报道文章总数、传播时长、传播速度、媒体层级指数以及标注的传播影响力等级。

请参阅图5,图5是本申请实施例提供的一种舆情风险确定装置的示意性框图。

如图5所示,该舆情风险确定装置200包括:

获取模块210,用于获取金融舆情事件对应的报道文章集合,所述报道文章集合包括不同新闻媒体发布的与所述金融舆情事件关联的报道文章;

内容风险确定模块220,用于确定每个所述报道文章中的各句子的风险类型,并根据所述句子的风险类型,确定所述金融舆情事件的第一风险等级;

媒体确定模块230,用于确定每个所述新闻媒体的媒体层级,并将最高的所述媒体层级对应的新闻媒体作为目标新闻媒体;

媒体风险确定模块240,用于根据所述目标新闻媒体的媒体层级和所述目标新闻媒体发布的与所述金融舆情事件关联的报道文章的发布版面位置,确定所述金融舆情事件的第二风险等级;

关联风险确定模块250,用于通过预设的命名实体识别模型从每个所述报道文章中提取命名实体,并根据所述命名实体,确定所述金融舆情事件的第三风险等级;

综合风险确定模块260,用于根据所述第一风险等级、所述第二风险等级和所述第三风险等级,确定所述金融舆情事件的目标风险等级。

在一些实施例中,所述内容风险确定模块220还用于:

将全部所述句子的风险类型作为风险类型集合,所述风险类型集合包括一种或多种风险类型;

统计所述风险类型集合中的每种所述风险类型的数量,并确定每种所述风险类型的全部句子在对应所述报道文章中的位置;

根据每种所述风险类型的数量以及每种所述风险类型的全部句子在对应所述报道文章中的位置,确定每种所述风险类型的目标重要性评分;

按照每种所述风险类型的目标重要性评分的大小顺序,对每种所述风险类型进行排序,得到风险类型队列;

将所述风险类型队列中的前N个风险类型确定为所述金融舆情事件的目标风险类型,N为大于或等于1的整数;

根据所述目标风险类型,确定所述金融舆情事件的第一风险等级。

在一些实施例中,所述综合风险确定模块260还用于:

将所述第一风险等级、所述第二风险等级和所述第三风险等级中最高的风险等级确定为所述金融舆情事件的目标风险等级。

在一些实施例中,所述内容风险确定模块220还用于:

将每个所述报道文章中的各句子输入预设的风险分类模型进行风险分类处理,得到每个所述句子的风险类型,所述风险分类模型是根据多个第一训练样本对预设多分类模型进行训练得到的,所述第一训练样本包括训练文本和所述训练文本中的各句子的风险类型。

在一些实施例中,如图6所示,舆情风险确定装置200还包括:

传播影响力因素确定模块270,用于根据所述报道文章集合,确定所述金融舆情事件的报道文章总数、传播时长以及每个所述媒体层级对应的报道文章数量;

所述传播影响力因素确定模块270,还用于根据所述报道文章总数和所述传播时长,确定所述金融舆情事件的传播速度;

所述传播影响力因素确定模块270,还用于根据每个所述媒体层级对应的报道文章数量以及每个所述媒体层级对应的预设加权系数,确定所述金融舆情事件的媒体层级指数;

传播影响力等级确定模块280,用于根据所述报道文章总数、所述传播时长、所述传播速度和所述媒体层级指数,确定所述金融舆情事件的传播影响力等级。

在一些实施例中,所述传播影响力等级确定模块280还用于:

运行预设的传播影响力分级模型对所述报道文章总数、所述传播时长、所述传播速度和所述媒体层级指数进行传播影响力分级处理,得到所述金融舆情事件的传播影响力等级,其中,所述传播影响力分级模型是根据多个第二训练样本对预设神经网络模型进行训练得到的,所述第二训练样本包括历史金融舆情事件的报道文章总数、传播时长、传播速度、媒体层级指数以及标注的传播影响力等级。

在一些实施例中,所述传播影响力因素确定模块270,还用于:

统计所述报道文章集合中的报道文章的数量,得到所述金融舆情事件的报道文章总数;

计算当前时间与每个所述报道文章的发布时间的差值,得到多个候选时长,并将多个所述候选时长中最大的所述候选时长作为所述传播时长;

对于每个所述媒体层级,统计所述报道文章集合中的所述媒体层级所对应的所述报道文章的数量,得到所述媒体层级对应的报道文章数量。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述舆情风险确定方法实施例中的对应过程,在此不再赘述。

上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的服务器上运行。

请参阅图7,图7是本申请实施例提供的一种服务器的结构示意性框图。

如图7所示,该服务器包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。

存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种舆情风险确定方法。

处理器用于提供计算和控制能力,支撑整个服务器的运行。

该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现以下步骤:

获取金融舆情事件对应的报道文章集合,所述报道文章集合包括不同新闻媒体发布的与所述金融舆情事件关联的报道文章;

确定每个所述报道文章中的各句子的风险类型,并根据所述句子的风险类型,确定所述金融舆情事件的第一风险等级;

确定每个所述新闻媒体的媒体层级,并将最高的所述媒体层级对应的新闻媒体作为目标新闻媒体;

根据所述目标新闻媒体的媒体层级和所述目标新闻媒体发布的与所述金融舆情事件关联的报道文章的发布版面位置,确定所述金融舆情事件的第二风险等级;

通过预设的命名实体识别模型从每个所述报道文章中提取命名实体,并根据所述命名实体,确定所述金融舆情事件的第三风险等级;

根据所述第一风险等级、所述第二风险等级和所述第三风险等级,确定所述金融舆情事件的目标风险等级。

在一些实施例中,所述处理器在实现根据每个所述句子的风险类型,确定所述金融舆情事件的第一风险等级时,用于实现:

将全部所述句子的风险类型作为风险类型集合,所述风险类型集合包括一种或多种风险类型;

统计所述风险类型集合中的每种所述风险类型的数量,并确定每种所述风险类型的全部句子在对应所述报道文章中的位置;

根据每种所述风险类型的数量以及每种所述风险类型的全部句子在对应所述报道文章中的位置,确定每种所述风险类型的目标重要性评分;

按照每种所述风险类型的目标重要性评分的大小顺序,对每种所述风险类型进行排序,得到风险类型队列;

将所述风险类型队列中的前N个风险类型确定为所述金融舆情事件的目标风险类型,N为大于或等于1的整数;

根据所述目标风险类型,确定所述金融舆情事件的第一风险等级。

在一些实施例中,所述处理器在实现根据所述第一风险等级、所述第二风险等级和所述第三风险等级,确定所述金融舆情事件的目标风险等级时,用于实现:

将所述第一风险等级、所述第二风险等级和所述第三风险等级中最高的风险等级确定为所述金融舆情事件的目标风险等级。

在一实施例中,所述处理器在实现确定每个所述报道文章中的各句子的风险类型时,用于实现:

将每个所述报道文章中的各句子输入预设的风险分类模型进行风险分类处理,得到每个所述句子的风险类型,所述风险分类模型是根据多个第一训练样本对预设多分类模型进行训练得到的,所述第一训练样本包括训练文本和所述训练文本中的各句子的风险类型。

在一些实施例中,所述处理器在实现获取金融舆情事件对应的报道文章集合之后,还用于实现:

根据所述报道文章集合,确定所述金融舆情事件的报道文章总数、传播时长以及每个所述媒体层级对应的报道文章数量;

根据所述报道文章总数和所述传播时长,确定所述金融舆情事件的传播速度;

根据每个所述媒体层级对应的报道文章数量以及每个所述媒体层级对应的预设加权系数,确定所述金融舆情事件的媒体层级指数;

根据所述报道文章总数、所述传播时长、所述传播速度和所述媒体层级指数,确定所述金融舆情事件的传播影响力等级。

在一些实施例中,所述处理器在实现根据所述报道文章总数、所述传播时长、所述传播速度和所述媒体层级指数,确定所述金融舆情事件的传播影响力等级时,用于实现:

运行预设的传播影响力分级模型对所述报道文章总数、所述传播时长、所述传播速度和所述媒体层级指数进行传播影响力分级处理,得到所述金融舆情事件的传播影响力等级;

其中,所述传播影响力分级模型是根据多个第二训练样本对预设神经网络模型进行训练得到的,所述第二训练样本包括历史金融舆情事件的报道文章总数、传播时长、传播速度、媒体层级指数以及标注的传播影响力等级。

在一些实施例中,所述处理器在实现根据所述报道文章集合,确定所述金融舆情事件的报道文章总数、传播时长以及每个所述媒体层级对应的报道文章数量时,用于实现:

统计所述报道文章集合中的报道文章的数量,得到所述金融舆情事件的报道文章总数;

计算当前时间与每个所述报道文章的发布时间的差值,得到多个候选时长,并将多个所述候选时长中最大的所述候选时长作为所述传播时长;

对于每个所述媒体层级,统计所述报道文章集合中的所述媒体层级所对应的所述报道文章的数量,得到所述媒体层级对应的报道文章数量。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的服务器的具体工作过程,可以参考前述舆情风险确定方法实施例中的对应过程,在此不再赘述。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台服务器(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本申请实施例还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参阅本申请舆情风险确定方法的各个实施例。

其中,所述存储介质可以是易失性的,也可以是非易失性的。所述存储介质可以是前述实施例所述的服务器的内部存储单元,例如所述服务器的硬盘或内存。所述存储介质也可以是所述服务器的外部存储设备,例如所述服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。

进一步地,所述存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种实体关系图的确定方法、装置、服务器及存储介质
  • 确定方法、装置、服务器、移动终端和可读存储介质
  • 一种美容方案确定方法、装置、服务器、用户终端、美容仪及存储介质
  • 确定广告竞价的方法、装置、服务器以及存储介质
  • 基于网络舆情的风险商户识别及处置方法、装置及服务器
  • 应用人工智能的新闻舆情文本处理方法、服务器及介质
技术分类

06120116497069