掌桥专利:专业的专利平台
掌桥专利
首页

确定对象风险状态的方法、装置、设备和存储介质

文献发布时间:2023-06-19 11:08:20


确定对象风险状态的方法、装置、设备和存储介质

技术领域

本公开涉及信息处理技术领域,具体涉及大数据、深度学习和自然语言处理技术领域,更具体地涉及一种确定对象风险状态的方法、装置、设备和存储介质。

背景技术

随着经济的发展,市场上的经营主体越来越多。为了对市场进行维护,便于用户根据需求来选择经营主体,通常需要对经营主体进行评估。例如,在经营主体需要贷款时,对经营主体的资产进行评估,以确定经营主体是否存在无力偿还贷款的风险。在经营主体运营危化品时,需要对经营主体的安全风险等进行评估,以合理的管理经营主体的营业范围,提高用户购买的危化品的安全性等。

发明内容

提供了一种能够提高状态准确性的确定对象风险状态的方法、装置、设备和存储介质。

根据第一方面,提供了一种确定对象风险状态的方法,包括:获取目标对象的稳定性信息和舆情信息,该稳定性信息包括目标对象的风险指示信息和关联目标对象的法律信息;采用情感分析模型确定舆情信息的置信度,得到目标对象的置信度信息;在舆情信息和法律信息中检测目标关键词,得到检测结果;以及根据风险指示信息、置信度信息和检测结果,确定目标对象的风险状态。

根据第二方面,提供了一种确定对象风险状态的装置,包括:信息获取模块,用于获取目标对象的稳定性信息和舆情信息,该稳定性信息包括风险指示信息和关联目标对象的法律信息;置信度信息确定模块,用于采用情感分析模型确定舆情信息的置信度,得到目标对象的置信度信息;关键词检测模块,用于在舆情信息和法律信息中检测目标关键词,得到检测结果;以及风险状态确定模块,用于根据风险指示信息、置信度信息和检测结果,确定目标对象的风险状态。

根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的确定对象风险状态的方法。

根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的确定对象风险状态的方法。

根据第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的确定对象风险状态的方法。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开实施例的确定对象风险状态的方法、装置、设备和存储介质的应用场景示意图;

图2是根据本公开实施例的确定对象风险状态的方法的流程示意图;

图3是根据本公开实施例的得到目标对象的置信度信息的原理示意图;

图4是根据本公开实施例的检测目标关键词得到检测结果的原理示意图;

图5是根据本公开实施例的获取目标对象的舆情信息的原理示意图;

图6是根据本公开实施例的确定对象风险状态的原理示意图;

图7是根据本公开实施例的确定对象风险状态的装置的结构框图;以及

图8是用来实现本公开实施例的确定对象风险状态的方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

本公开提供了一种确定对象风险状态的方法,包括信息获取过程、置信度确定过程、关键词检测过程和风险状态确定过程。在信息获取过程中,获取目标对象的稳定性信息和舆情信息,该稳定性信息包括目标对象的风险指示信息和关联目标对象的法律信息。在置信度确定过程中,采用情感分析模型确定舆情信息的置信度,得到目标对象的置信度信息。在关键词检测过程中,在舆情信息和法律信息中检测目标关键词,得到检测结果。在风险状态确定过程中,根据风险指示信息、置信度信息和检测结果,确定目标对象的风险状态。

以下将结合图1对本公开提供的方法和装置的应用场景进行描述。

图1是根据本公开实施例的确定对象风险状态的方法、装置、设备、介质和程序产品的应用场景图。

如图1所示,该实施例的应用场景100例如可以包括第一设备110和第二设备120。该第一设备110与第二设备120之间可以通过网络通信,网络例如可以包括有线或无线通信网络。

根据本公开的实施例,第一设备110例如可以提供有人机交互界面,用户可以使用第一设备110与第二设备120进行交互,以接收或发送消息等。第一设备110可以安装有各种客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、网盘类应用、邮箱客户端、社交平台软件等(仅为示例)。

第一设备110可以是具有显示屏且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便捷计算机和台式计算机等等。第二设备120可以是提供各种服务的电子设备,例如服务器、台式计算机等等。例如,第二设备120可以为应用程序服务器、分布式系统的服务器,或者是结合了区块链的服务器。或者,服务器还可以为虚拟服务器或云服务器等,以用于向第一设备110安装的客户端应用的运行提供支持。

在一实施例中,第二设备120例如可以对第一设备110发送的请求信息进行分析等处理,并将处理结果反馈给第一设备110。其中,请求信息例如可以用于请求音频、视频、文本或图像等任意信息。例如,请求的信息可以为目标对象的风险状态。

在一实施例中,如图1所示,该应用场景100还包括维护有稳定性信息的信息数据库130和维护有舆情信息的舆情数据库140。其中,稳定性信息可以为能够指示市场中各经营主体的信用、各经营主体的经营稳定性的信息,舆情信息可以包括各新闻平台产生的新闻信息、或者各社交类应用发布的文本等。信息数据库130和舆情数据库140可以为两个独立的数据库,也可以为基于同一实体设备运行的虚拟数据库,或者也可以为同一实体设备中的两个存储分区。

在一实施例中,第二设备120在响应获取目标对象的风险状态的请求信息时,可以对信息数据库130中目标对象的稳定性信息和舆情数据库140中与目标对象关联的舆情信息进行综合评估,根据评估结果确定目标对象的风险状态,并向第一设备110反馈目标对象的风险状态。

需要说明的是,本公开提供的确定对象风险状态的方法可以由第二设备120执行。相应地,本公开提供的确定对象风险状态的装置可以设置在第二设备120中。

应该理解,图1中的第一设备、第二设备、信息数据库和舆情数据库的类型和数目仅仅是示意性的。根据实现需要,可以具有任意类型和数目的第一设备、第二设备、信息数据库和舆情数据库。

以下将结合图1描述的应用场景,通过图2~图6对本公开提供的确定对象风险状态的方法进行详细描述。

图2是根据本公开实施例的确定对象风险状态的方法的流程示意图。

如图2所示,该实施例的确定对象风险状态的方法200可以包括操作S210、操作S230、操作S250和操作S270。

在操作S210,获取目标对象的稳定性信息和舆情信息。

根据本公开的实施例,在获取信息时,以目标对象的对象标识作为查询条件,从前文描述的舆情数据库中查询到与目标对象关联的舆情信息,从前文描述的信息数据库中查询到目标对象的稳定性信息。目标对象的对象标识例如可以为目标对象的名称、目标对象的编号等能够唯一指示目标对象的信息。

根据本公开的实施例,目标对象可以为企业、个人、组织机构等实体。稳定性信息可以包括风险指示信息和法律信息。其中,风险指示信息可以为根据历史风险状态所确定的评估值,或者可以为根据目标对象的属性信息所确定的评估值。属性信息例如可以包括以下信息中的至少之一:目标对象的类型、目标对象的资产信息和目标对象的年龄等。法律信息例如可以包括与目标对象关联的以下信息中的至少之一:裁判文书、开庭公告、被执行人信息和失信人信息等。关联目标对象的法律信息可以包括涉及目标对象的法律信息,或者涉及与目标对象具有关联关系的其他对象的法律信息。

在一实施例中,风险指示信息可以根据目标对象所涉及的业务范围来确定。例如,若目标对象为个人,目标对象的风险指示信息可以根据个人所从事工作对应的业务范围来确定。若目标对象为企业,目标对象的风险指示信息可以根据企业所运营产品的种类范围来确定。例如,在目标对象为运营危化品的企业时,目标对象的风险指示信息可以根据企业运营的危化品的种类、种类数、危化品的性质等来确定。例如,若企业运营的危化品为燃点较低的易燃产品时,该企业的风险指示信息指示企业的风险较高,即稳定性较差。若企业运营的危化品为燃点较高的易燃产品时,该企业的风险指示信息指示企业的风险较低,即稳定性较好。

根据本公开的实施例,舆情信息可以包括新闻平台或社交平台产生的以下信息中的至少之一:音频、视频、文本和图像。目标对象的舆情信息可以为记载有已发生事迹的信息,已发生事迹可以为目标对象发生的事迹或与目标对象关联的其他对象发生的事迹。

在操作S230,采用情感分析模型确定舆情信息的置信度,得到目标对象的置信度信息。

根据本公开的实施例,可以采用情感分析模型(例如循环神经网络模型等)来确定舆情信息的负向置信度,该负向置信度例如可以用于表征舆情信息表示的内容所指示的目标对象的风险程度。若风险程度越大,则该负向置信度越大。该实施例中目标对象的置信度信息可以根据舆情信息的负向置信度来确定。例如,针对目标对象的置信度信息可以为目标对象的置信度,该负向置信度与目标对象的置信度彼此正相关,该正相关的类型可以根据实际需求进行设定,本公开对此不做限定。

在操作S250,在舆情信息和法律信息中检测目标关键词,得到检测结果。

根据本公开的实施例,可以将目标对象的名称、舆情信息和法律信息拼接后作为自然语言处理模型的输入,经由自然语言处理模型输出检测结果。自然语言处理模型可以为卷积神经网络模型等。通过综合考虑舆情信息和法律信息来确定检测结果,可以避免误导性舆情信息对检测结果的影响。从而可以在一定程度上提高确定的检测结果的准确性。或者,可以采用自然语言处理模型提取舆情信息和法律信息中的关键词,将提取的关键词与预定词库中的词进行比对,确定提取的关键词中属于预定词库的词为目标关键词。该检测结果例如可以为检测到的目标关键词的个数。

根据本公开的实施例,可以分别对舆情信息和法律信息进行字符识别,确定舆情信息包括的带有负面感情色彩的词汇的量,作为第一数量。类似的,确定法律信息包括的带有负面感情色彩的词汇的量,作为第二数量。在得到第一数量和第二数量后,可以根据向舆情信息和法律信息分配的权重,来确定第一数量和第二数量的权重和,将确定的权重和作为检测结果。

在操作S270,根据风险指示信息、置信度信息和检测结果,确定目标对象的风险状态。

根据本公开的实施例,可以预先为风险指示信息、置信度信息和检测结果分配有预定权重。操作S270可以先将风险指示信息、置信度信息和检测结果数值化,随后根据预定权重,确定数值化得到的三个数值的加权和为目标对象的风险指示值,并根据该风险指示值确定风险状态。风险指示值与风险状态例如可以具有映射关系。例如,若风险指示值高于第一预定风险值,则该风险状态为高风险状态。若风险指示值介于第一预定风险值和第二预定风险值之间,则该风险状态为中风险状态。若风险指示值小于第二预定风险值,则该风险状态为低风险状态。可以理解的是,第一预定风险值大于第二预定风险值,该第一预定风险值和第二预定风险值的取值可以根据实际需求进行设定,本公开对此不做限定。在一实施例中,也可以将确定的风险指示值作为确定风险状态。

根据本公开的实施例,在确定目标对象的风险状态时,可以先将风险指示信息、置信度信息和检测结果均转换为预定计分制的数值,分别得到第一数值、第二数值和第三数值。例如,若预定计分制为百分制,风险指示信息为最高值为31的评估值a,则风险指示信息的百分制值A=a×100/31。在得到第一数值、第二数值和第三数值后,可以将该三者的加权和作为目标对象的风险指示值。在一实施例中,为第一数值、第二数值和第三数值分配的权重均相等,则可以确定第一数值、第二数值和第三数值的平均值为目标对象的风险指示值。可以理解的是,预定计分制可以为百分制、十分制、五分制等任意的计分规则,该预定计分制可以根据实际需求进行设定,本公开对此不做限定。确定的风险指示值可以指示目标对象的风险状态。

本公开实施例在确定目标对象的风险状态时,通过综合已有的风险指示信息、根据目标对象的舆情信息和法律信息确定的置信度信息和检测结果来确定风险评状态,可以增加确定风险状态的考量角度。从而可以更全面的评估企业的风险状态,提高确定的风险状态的准确性。

图3是根据本公开实施例的确定目标对象的置信度信息的原理示意图。

根据本公开的实施例,在确定目标对象的置信度信息时,例如可以先根据舆情信息置信度的分析结果从舆情信息中筛选出负面舆情信息,再根据负面舆情信息来确定目标对象的置信度信息,以此避免正面舆情信息对目标对象的置信度信息的影响,提高确定的目标对象的置信度信息的准确性,同时降低信息处理效率。

根据本公开的实施例,可以先确定每个舆情信息的正向置信度和负向置信度。正向置信度表征该每个舆情信息描述的内容为正面、积极内容的置信度。负向置信度表征该每个舆情信息描述的内容为负面、消极内容的置信度。该负面、消极内容可以指示目标对象的风险程度。若内容消极程度越大,则目标对象的风险程度越高。

示例性地,可以根据舆情信息包括的带有负面感情色彩的词汇的量来确定舆情信息是否为负面舆情信息。例如,若带有负面感情色彩的词汇占舆情信息中词汇总量的比例超过预定比例时,则确定舆情信息为负面舆情信息。预定比例可以根据实际需求进行设定,本公开对此不做限定。

示例性地,可以采用情感分析模型来确定舆情信息的正向置信度和负向置信度。根据正向置信度和负向置信度的大小关系来确定舆情信息是否为负面舆情信息。例如,若负向置信度大于正向置信度,则可以确定舆情信息为负面舆情信息。

根据本公开的实施例,情感分析模型例如可以基于深度学习模型构建得到。其中,深度学习模型例如可以为循环神经网络模型。循环神经网络模型例如可以为长短期记忆网络(Long-Short-Term Memory,LSTM)模型、门控循环单元(Gate Recurrent Unit,GRU)模型等,也可以为双向转换编码器(Bidirectional Encoder Representation fromTransformers,Bert)模型等。通过采用基于深度学习模型构建的情感分析模型,可以实现对舆情信息的语义深入分析和信息挖掘,从而可以提高确定的目标对象的置信度信息的准确性。

示例性地,情感分析模型可以基于自然语言处理云平台(NaturalLanguageProcessing Cloud,NLPC)维护的情感分析算子(例如NLPC-Sentiment-Classify-104)构建得到。

示例性地,如图3所示的实施例300,获取的舆情信息可以为多个,该实施例可以轮询的获取多个舆情信息310中的每个舆情信息311,先采用情感分析模型320确定该每个舆情信息311的正向置信度331和负向置信度341。在得到正向置信度331和负向置信度341后,对于该每个舆情信息311,可以确定正向置信度331和负向置信度341之间的大小关系351。对于从多个舆情信息310中轮询到的每个舆情信息均执行上述操作,可以得到多个舆情信息310中所有舆情信息的正向置信度和负向置信度之间的大小关系,即得到与多个舆情信息310一一对应的多个大小关系。根据该每个舆情信息的正向置信度和负向置信度之间的大小关系(即根据该多个大小关系),可以从多个舆情信息中抽取到负面舆情信息。该负面舆情信息例如可以为正向置信度小于负向置信度的舆情信息,或者可以为负向置信度与正向置信度的差值大于预定差值的舆情信息。预定差值可以根据实际需求进行设定,该预定差值可以为大于零的任意值,本公开对此不做限定。

示例性地,在得到负面舆情信息360后,可以根据负面舆情信息360的正向置信度和负面舆情信息360的负向置信度,确定目标对象的置信度信息。例如,可以根据负面舆情信息360的负向置信度与正向置信度之间的差异来确定目标对象的置信度信息。其中,在负面舆情信息360为多个的情况下,可以将与多个负面舆情信息360一一对应的多个差异之和作为目标对象的置信度信息。

根据本公开的实施例,在确定负面舆情信息360的个数较多时,还可以确定目标对象的置信度信息为预定的最大置信度。在负面舆情信息360的个数较少时,根据负面舆情信息360的负向置信度与正向置信度之间的差异确定目标对象的置信度信息。

示例性地,如图3所示,在得到负面舆情信息360后,可以先确定负面舆情信息的个数,得到信息个数370。随后根据该信息个数370的大小来确定目标对象的置信度信息380。例如,在负面舆情信息360的个数大于等于第一预定个数的情况下,确定目标对象的置信度信息380为第一预定值。在负面舆情信息360的个数小于第一预定个数的情况下,可以先确定每个负面舆情信息的正向置信度和负向置信度之间的差异,作为针对每个负面舆情信息的差异。目标对象的置信度信息380根据针对所有负面舆情信息的差异来确定。第一预定个数可以与作为目标对象的置信度信息的置信度值相等,或者第一预定个数与作为目标对象的置信度信息的置信度值彼此正相关。可以理解的是,该第一预定个数与作为目标对象的置信度信息的置信度值可以根据实际需求进行设定,本公开对此不做限定。

示例性地,可以采用负向置信度与正向置信度的差值来表征针对每个负面舆情信息的差异。或者可以采用负向置信度与正向置信度的差值的平方来表征针对每个负面舆情信息的差异。在得到针对每个负面舆情信息的差异后,可以对表征所有负面舆情信息的差异的所有值求和,将求和得到的值作为目标对象的置信度值。

图4是根据本公开实施例的检测目标关键词得到检测结果的原理示意图。

根据本公开的实施例,可以预先维护有预定词库,该预定词库中包括多个词,多个词由能够反映安全风险的词表示。该实施例在确定检测结果时,可以先对舆情信息和法律信息进行语义识别,提取舆情信息和法律信息中的每个信息提取目标关键词。对舆情信息和法律信息进行目标关键词召回,该召回的目标关键词的数量可以反映目标对象的风险程度。例如,召回的目标关键词数量越多,则目标对象的风险程度越高。相较于对整个信息进行语义分析,该方法可以在保证检测精度的同时,提高对目标对象的风险状态的确定效率。

根据本公开的实施例,在对舆情信息进行目标关键词召回时,可以仅对前文确定的负面舆情信息进行目标关键词召回,以此提高目标关键词召回的准确性和目标关键词召回率。

示例性地,如图4所示,该实施例400可以轮询的获取负面舆情信息410和法律信息420构成的信息集中的每个信息431。对于获取到的每个信息431,检测每个信息431中属于预定词库440的关键词,得到针对该每个信息431的目标关键词451。在轮询得到针对负面舆情信息410和法律信息420中各信息的目标关键词451后,可以先确定得到的所有目标关键词的总数,得到关键词总个数460。根据该关键词总个数460即可确定检测结果470。

示例性地,在识别每个信息以得到针对每个信息的目标关键词时,可以先对每个信息进行预处理,该预处理包括分词处理和去除停用词的处理。通过该预处理,可以得到多个字符串。通过将该多个字符串中的每个字符串与预定词库440中的词进行匹配,在匹配到与每个字符串匹配的词时,将该匹配的词作为针对该每个字符串所属的信息的目标关键词。在进行匹配时,例如可以先确定字符串与预定词库中的词之间的相似度,若相似度大于预定相似度,则确定字符串与预定词库中的词相匹配。相似度例如可以采用余弦相似度或皮尔逊相关系数等来表示。可以理解的是,预定相似度可以根据实际需求进行设定,本公开对此不做限定。

示例性地,在对每个信息预处理后,还可以采用基于预定词库440建立的关键词召回模型来确定针对每个信息的目标关键词。关键词召回模型可以包括快速文本分类器FastText模型或双向长短期记忆网络与条件随机场构成的模型(Bi-LSTM-CRF)等。该关键词召回模型的输入为预处理后的信息,输出为预处理后的信息中各字符串的类别,该类别包括基于预定词库440中的词构建的风险词类别。将属于风险词类别的字符串作为针对每个信息的目标关键词。属于风险词类别的词为指示负面或消极内容的词。

根据本公开的实施例,检测结果例如可以为指示风险大小的风险值。关键词总个数460可以与检测结果470彼此正相关。在得到关键词总个数460后,根据正相关关系可以计算得到风险值。正相关关系可以根据风险值所采用的计分制来确定,或者可以根据实际需求来确定,本公开对此不做限定。

示例性地,在确定关键词总个数较大时,还可以确定风险值为最大值。例如,可以先确定关键词的总个数是否大于等于第二预定个数,若是,则确定检测结果(即风险值)为第二预定值。否则,根据风险值与关键词总个数之间的正相关关系,确定检测结果。在关键词的总个数小于第二预定个数时,例如可以将关键词的总个数作为检测结果。第二预定个数可以与风险值相等,或者第二预定个数与风险值可以具有风险值与关键词总个数之间的正相关关系。可以理解的是,该第二预定个数与风险值可以根据实际需求进行设定,本公开对此不做限定。

示例性地,对于不同类型的目标对象,预定词库440可以具有不同的词。例如,在目标对象为实体企业时,预定词库440中的词可以包括有:设备老旧、设备重量问题、设备故障、工艺缺陷、装置失败、基础设计不符合要求、污染物排放超标、技术缺陷、设计缺陷、装备缺陷、操作失误、违规操作、无证上岗、未经培训、违规作业、未按照规范操作等。在目标对象为金融机构时,该标签例如可以包括:跑路、被纳入黑名单、负债等。可以理解的是,上述预定词库包括的词仅作为示例以利于理解本公开,本公开对此不做限定。

图5是根据本公开实施例的获取目标对象的舆情信息的原理示意图。

根据本公开的实施例,如图5所示,该实施例500的舆情数据库550中例如可以存储有对象标识530与舆情信息510之间的映射关系540,以便于从舆情数据库550中按需获取目标对象的舆情信息。

示例性地,在新闻平台等生成新的舆情信息510后,本公开实施例可以先采用词法分析模型520对舆情信息510进行实体特征提取,将该提取的实体特征中表示实体名称的词作为对象标识530。通过对对象标识530与舆情信息510建立映射关系540,可以得到存入舆情数据库550中的信息。在建立映射关系540时,例如可以将对象标识530作为舆情信息510的索引。

示例性地,在从舆情数据库550中获取舆情信息时,可以根据目标对象的对象标识从预定舆情数据库550中获取目标对象的舆情信息。例如可以将目标对象的对象标识560作为查询条件查询舆情数据库550,将以目标对象的对象标识560为索引的舆情信息作为目标对象的舆情信息570。

示例性地,词法分析模型520例如可以采用联合的词法分析模型(LexicalAnalysis of Chinese,LAC)等模型,该词法分析模型可以提供分词、词性标注和专名识别等功能。采用该词法分析模型,例如可以从舆情信息中提取出组织机构名称,将该组织机构名称作为对象标识。在一实施例中,可以采用自然语言处理云平台中的nlpc-lac算子作为词法分析模型。该nlpc-lac算子使用栈式GRU模型来实现,其中,模型的训练和预测可以基于飞桨(Paddlepaddle)来实现。该实施例通过采用词法分析模型来确定对象标识,可以提高提取的对象标识的准确性,并因此可以提高获取的舆情信息的准确性。

以下将举一实例,结合图6对本公开实施例的确定对象风险状态的原理进行整体描述。

图6是根据本公开实施例的确定对象风险状态的原理示意图。

如图6所示,该实施例600中,目标对象例如可以为经营危化品的企业。对该经营危化品的企业的评估可以依赖于舆情数据库601和信息数据库602。其中,舆情数据库601例如可以为用户信息仓库(User Data Warehouse),该用户信息仓库用平台化的存储管理、数据管理、数据建设过程管理和元数据管理技术,提供全面、一致、高质量和面向分析的用户行为基础信息,该基础信息包括与用户关联的网络文本。信息数据库602例如可以为存储稳定性信息的数据库,该数据库存储有企业的法定代表人、注册资本、成立日期、股东、工商信息、裁判文书、知识产权出质等信息。

在确定风险状态时,该实施例可以通过操作S610从舆情数据库601中过滤得到有效的舆情信息,该有效的舆情信息为针对目标对象的舆情信息。在对舆情数据库601中的信息进行过滤时,例如还可以仅过滤得到新闻信息,以此保证获取的舆情信息的权威性。其中,可以根据信息的来源过滤得到新闻信息。

在确定风险状态时,还可以通过操作S620从信息数据库602中获取目标对象的法律信息,通过操作S630从信息数据库602中获取针对该运营危化品的企业的基本风险评分。该基本风险评分可以作为前文描述的风险指示信息,在此不再赘述。

对于过滤得到的有效舆情信息,可以采用NLPC中的情感分析算子向每个舆情信息添加情感倾向置信度(操作S640)。该情感倾向置信度包括前文描述的正向置信度和负向置信度。随后根据为有效的舆情信息添加的情感倾向置信度来获取舆情评分(操作S650),以作为目标对象的置信度信息。该操作S650例如可以采用前文描述的先确定负面舆情信息,再根据负面舆情信息的正向置信度和负向置信度确定目标对象的置信度信息的方法来实现,在此不再赘述。

对于过滤得到的有效舆情信息和获取的法律信息,可以分别经由操作S660添加安全生产标签,作为目标关键词。该操作S660可以采用前文描述的基于预定词库识别信息,以得到针对信息的目标关键词的方法来实现,在此不再赘述。

根据添加的安全生产标签,可以通过操作S670获取安全生产标签召回评分,以作为前文描述的检测结果。该操作S670可以采用前文描述的根据关键词的总个数,确定目标对象的检测结果的方法来实现,在此不再赘述。

在获取到舆情评分、安全生产标签召回评分和基本风险评分后,可以通过操作S680来确定企业风险评估得分,以指示目标对象的风险状态。该操作S680可以采用前文描述的根据风险指示信息、置信度信息和检测结果确定目标对象的风险状态的方法来实现,在此不再赘述。

通过该实施例描述的方法,可以弥补现有技术中对经营危化品的企业进行风险评估时因考量角度少所存在的不足,并通过结合自然语言处理工具实现信息的挖掘处理,可以有效提高风险评估的计算维度,从而方便用户更全面的评估运营危化品的企业的风险。

基于前文描述的确定对象风险状态的方法,本公开还提供了一种确定对象风险状态的装置。以下将结合图7对该装置进行详细描述。

图7是根据本公开实施例的确定对象风险状态的装置的结构框图。

如图7所示,该实施例的确定对象风险状态的装置700可以包括信息获取模块710、置信度确定模块730、关键词检测模块750和风险状态确定模块770。

信息获取模块710用于获取目标对象的稳定性信息和舆情信息,稳定性信息包括风险指示信息和关联目标对象的法律信息。在一实施例中,信息获取模块710可以用于执行前文描述的操作S210,在此不再赘述。

置信度确定模块730用于采用情感分析模型确定舆情信息的置信度,得到目标对象的置信度信息。在一实施例中,置信度确定模块730可以用于执行前文描述的操作S230,在此不再赘述。

关键词检测模块750用于在舆情信息和法律信息中检测目标关键词,得到检测结果。在一实施例中,关键词检测模块750可以用于执行前文描述的操作S250,在此不再赘述。

风险状态确定模块770用于根据风险指示信息、置信度信息和检测结果,确定目标对象的风险状态。在一实施例中,风险状态确定模块770可以用于执行前文描述的操作S270,在此不再赘述。

根据本公开的实施例,舆情信息的数量为多个,置信度确定模块730可以包括置信度确定子模块、负面信息确定子模块和信息确定子模块。置信度确定子模块用于针对多个舆情信息中的每个舆情信息,采用情感分析模型确定每个舆情信息的正向置信度和负向置信度。负面信息确定子模块用于根据每个舆情信息的正向置信度和每个舆情信息的负向置信度之间的大小关系,确定多个舆情信息中的负面舆情信息。信息确定子模块用于根据负面舆情信息的正向置信度和负面舆情信息的负向置信度,确定目标对象的置信度信息。

根据本公开的实施例,上述情感分析模型基于深度学习模型构建。

根据本公开的实施例,上述置信度确定子模块包括个数确定单元和置信度确定单元。个数确定单元用于确定负面舆情信息的个数。置信度确定单元用于:在负面舆情信息的个数大于等于第一预定个数的情况下,确定目标对象的置信度信息为第一预定值;以及在负面舆情信息的个数小于第一预定个数的情况下,先针对负面舆情信息中的每个负面舆情信息,确定每个负面舆情信息的正向置信度和每个负面舆情信息的负向置信度之间的差异,作为针对每个负面舆情信息的置信度差异;随后根据针对每个负面舆情信息的置信度差异,确定目标对象的置信度信息。

根据本公开的实施例,上述关键词检测模块750例如可以包括关键词确定子模块和检测结果确定子模块。关键词确定子模块用于针对负面舆情信息和法律信息中的每个信息,检测每个信息中属于预定词库的关键词,作为针对每个信息的目标关键词。检测结果确定子模块用于根据针对负面舆情信息和法律信息的目标关键词的总个数,确定检测结果。预定词库包括多个词,多个词由反映安全风险的词表示。

根据本公开的实施例,检测结果确定子模块用于在目标关键词的总个数大于等于第二预定个数的情况下,确定检测结果为第二预定值。检测结果确定子模块还用于在目标关键词的总个数小于第二预定个数的情况下,确定检测结果为目标关键词的总个数。

根据本公开的实施例,上述信息获取模块710用于根据目标对象的对象标识,从预定舆情信息库中获取目标对象的舆情信息。预定舆情信息库中存储的舆情信息以与舆情信息关联的对象标识为索引,与舆情信息关联的对象标识经由词法分析模型分析舆情信息得到。

根据本公开的实施例,确定对象风险状态的装置700还包括指示信息确定模块,用于根据目标对象所涉及的业务范围,确定目标对象的风险指示信息。

根据本公开的实施例,风险状态确定模块770包括数值转换子模块和状态确定子模块。数值转换子模块用于将风险指示信息、置信度信息和检测结果分别转换为预定计分制的数值,得到第一数值、第二数值和第三数值。状态确定子模块用于根据向第一数值、第二数值和第三数值分配的预定权重,确定第一数值、第二数值和第三数值的加权和,以用于指示目标对象的风险状态。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8是用来实现本公开实施例的确定对象风险状态的方法的电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如确定对象风险状态的方法。例如,在一些实施例中,确定确定对象风险状态的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的确定对象风险状态的方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行确定对象风险状态的方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 确定对象风险状态的方法、装置、设备和存储介质
  • 一种主机风险状态确定方法、装置、电子设备及存储介质
技术分类

06120112809333