掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本申请属于智慧金融技术领域,具体涉及一种面向资管决策的辅助推理系统。

背景技术

资管投资决策是在分析、调查的基础上,对投资活动活出的判断和决策。在进行该活动时,往往会结合最新的热点事件,分析目标公司的未来营收的走势。

投资领域的研究当前主流的是依靠研究员和投资经理人工的研究,从各个渠道获取大量信息,根据自己的研究框架进行分析,得出结论。该研究方法存在弊端:人工成本昂贵;数据分析不及时;对数据的获取和提取能力有限,研究范围受限;研究分析结果有疏漏;标准化程度低。

本申请的目的在于提供一种认知检测系统,以解决上述基于人工的方式的缺陷。本申请基于研究员的研究逻辑,使用推理系统的方式实现,一方面可以扩大研究范围,另外一方面可以提高研究效率。

发明内容

本申请提出了一种面向资管决策的辅助推理系统,使用基于研究员总结出的规则,通过概念和算子,计算新的规则。从而该推理过程相较于人的研究过程更为快速,更为及时。

为实现上述目的,本申请提供了如下方案:

一种面向资管决策的辅助推理系统,包括:事件抽取系统模块、数据库系统模块、推理系统模块和结果存储展示模块;

所述事件抽取系统模块用于从新闻文本中抽取出结构化的事件;

所述数据库系统模块用于获取某个公司的业务、相关产品以及某种商品的价格、进出口量信息;

所述推理系统模块用于根据提前定义好的规则对抽取出的结构化事件进行推理分析,得到推理链条;

所述结果存储展示模块用于对所述推理系统模块的结果进行存储并展示。

优选的,所述事件抽取系统模块包括:输入模块、文本处理模块和输出模块。

优选的,所述输入模块用于所述事件抽取系统模块的文本输入;

所述文本处理模块用于处理所述输入模块输入的新闻文本;

所述输出模块将所述文本处理模块抽取出的信息进行输出。

优选的,所述数据库系统模块包括:产业链模块、公司信息模块和商品信息模块。

优选的,所述产业链模块用于获取行业上下游产品关系;

所述公司信息模块用于获取公司的基本信息及主营业务;

所述商品信息模块用于获取商品的价格、库存和进出口量。

优选的,所述推理系统模块包括:概念集合模块、算子集合模块和知识规则模块。

优选的,所述概念集合模块用于总结推理链条;

所述算子集合模块用于概念之间的计算;

所述知识规则模块用于通过知识规则推出知识规则的结论。

优选的,所述结果存储展示模块包括:结果文件存储模块和结果展示模块;

所述结果文件存储模块用于将所述推理系统模块的推理结果进行文件存储;

所述结果展示模块用于将所述结果文件存储模块的结果进行展示。

本申请的有益效果为:

本申请与传统基于人的研究逻辑相比,本申请设计的推理系统,通过对公司、行业相关实体进行概念建模,将研究员的知识结构化,运用该结构化的知识推理影响链条。以解决上述基于研究员的方式的缺陷,从而降低分析成本;对发生事件及时响应,做出分析,给出带有解释的决策和判断;减少人为因素所造成的疏漏;提供标准化的全面化的技术型分析,以供投资者参考使用。

本申请使用基于研究员总结出的规则,通过概念和算子,计算新的规则。因该过程基于研究员的经验总结,并结合涉及整个行业内的相关实体,该推理过程和人的研究推理链条较为接近。同时,因该过程使用推理引擎做到自动化,从而该推理过程相较于人的研究过程更为快速,更为及时。

附图说明

为了更清楚地说明本申请的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例一的系统模块示意图;

图2为本申请实施例一的事件抽取系统模块示意图;

图3为本申请实施例一的数据库系统模块示意图;

图4为本申请实施例一的推理系统模块示意图;

图5为本申请实施例一的“概念-算子”的构建示意图;

图6为本申请实施例一的从“概念-算子”到规则构建示意图;

图7为本申请实施例一的推理示意图;

图8为本申请实施例一的文件存储展示模块示意图

图9为本申请实施例二的文件存储展示模块示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。

实施例一

如图1所示,为本申请实施例一的一种资管投资辅助推理系统结构示意图,包括:事件抽取系统模块、数据库系统模块、推理系统模块和结果存储展示模块;

如图2所示,事件抽取系统模块包括:输入模块、文本处理模块和输出模块;

输入模块用于事件抽取系统模块的文本输入,将新闻事件的文本作为整个系统的输入;

文本处理模块用于处理输入模块输入的新闻文本,通过事件抽取技术将其中的时间、地点、相关人物等信息抽取出来;假设x为事件名,而si∈{s0,s1,……,sn}表示x事件的抽取事件论元,n表示该事件的抽取论元总数,则prompt_ext构建如下:

[event]x[/event][asso_type]s

其中,event表示事件,而asso_type表示实体类型。将prompt构造好以后,在其后拼接上原始文本,并对超出长度的文本进行截断处理,最终生成模型的输入x_ext如下:

[Prompt_ext]+[Text]

之后将文本输入至经过资管事件微调后的T5生成模型进行预测,本模型由编码器和解码器组成,编码器负责编码文本的语义特征信息,解码器用于生成抽取结果。模型具体结构如下:

编码器由12个编码块顺序堆叠组成,每个编码块存在多头注意力网络层、前馈神经网络层,并且每一层均应用残差避免深度神经网络的梯度消失与爆炸问题。每个多头注意力网络由16个自注意力网络组成。

解码器由12个解码块顺序堆叠组成,每个解码块存在掩码多头注意力层、多头注意力层、前馈神经网络层,每一层同样使用残差技术。掩码多头注意力层在多头注意力层的基础上添加掩码机制防止训练时的信息泄漏问题。解码块的多头注意力层的key和value为编码器的特征向量。

输入文本至生成模型后,将自回归的生成结构化的输出,输出结果y1如下:

[X触发词:[[s0:……,s1:……,……,sn:……]]

输出模块将文本处理模块抽取出的信息通过实现定义的事件模板输出为结构化的事件,用于推理模块的推理;

如图3所示,数据库系统模块包括:产业链模块、公司信息模块和商品信息模块;

产业链模块用于获取行业上下游产品的“父子产品”关系,在该关系中,父产品是处在行业上游的产品,子产品是处在行业下游的产品,父产品的价格变化会引起子产品价格的变化。如“汽油”产品的父产品是“石化工程”、“原油”,“汽油”产品的子产品是“汽车”、“橡胶”、“香料”、“油漆”。在该例子中,上游的“原油”、“石油工程”是“汽油”的成产原料、生产工具,而“汽油”同时又为下游的“汽车”、“橡胶”、“香料”、“油漆”提供产品;

公司信息模块用于获取公司的基本信息及主营业务,基本信息包括:公司名称、公司代码、公司简称和所属国家,主营业务是指企业为完成其经营目标而从事的日常活动中的主要活动。如中国石油天然气股份有限公司所属国家为中国,主营业务包括勘探与生产和炼油与化工;

商品信息模块用于获取商品的价格、库存、进出口量等信息;

如图4所示,推理系统模块包括概念集合模块、算子集合模块、知识规则模块;

概念集合模块是行业内、公司内“概念”的集合,这些“概念”来自于研究员知识中、行业研报出现的行业内的、公司内的实体,此处的研究员知识指研究员通过自身经验,总结的带有前提和结论的推理链条,实体指的是现实世界中客观存在的并可以相互区分的对象或事物。如图5所示,研究员知识的推理链条中出现了“原油”、“汽油”这两个实体,均定义为“商品”概念,“销售业务”这个实体,定义为“业务”这一概念;

算子集合模块用于概念之间的计算。每个算子都是一个函数,而上述概念集合模块中的概念是函数的输入和输出变量。算子的输入、输出均为概念集合中的若干概念。可通过算子、概念经过计算得到新的概念。如图5所示,“业务的商品”这一算子可求得某项业务所涉及的商品,通过输入“业务”概念,可以得到“商品”概念。如图7所示,“概念-算子”的计算方式有两种,一种是通过规则求得,另一种是通过数据库获取;

知识规则模块包括行业内的、公司内的研究员总结出的知识。图5展示了通过研究员的经验知识定义出概念和算子,图6则展示了使用定义的算子来表示研究员知识而形成的规则库,而知识规则库中的规则是对研究员知识的抽象、总结和泛化。规则1所述的形式化规则为“若商品价格上升且有子产品,则该产品的子产品价格也上升”。规则2所述的形式化规则为“若某业务涉及的商品的价格上升,则该业务的业务收入上升”。每一条形式化的规则包含两部分,即前提和结论。前提和结论均由若干个知识方程构成,每一条知识方程都是由“概念-算子”组成的等式。图7则展示了使用知识规则的推理过程:通过事件抽取从原始文本中获取信息,转化为如初始条件所示的知识方程。初始知识方程和来自数据库的数据满足规则1的前提,从而推出规则1的结论,“汽油价格上升”。结论也是由知识方程构成;

如图8所示,结果存储展示模块包括:结果文件存储模块、结果展示模块;

结果文件存储模块用于将推理系统的推理结果存储为文本文件及其他结构化结果的文件。在文本文件中,以文本形式存储推理链条的结果,即直接将推理链条的文本内容输出到文本文件中。一条完整的推理链条是从初始条件开始推理,到公司的评估指标(EPS、PE)截止。如从“原油的库存”开始到公司的评估指标是一条完整的推理链条。从“进出口政策”开始到公司的评估指标是另一条完整的推理链条。在结构化结果的文件中,独立存储每一个推理链条的信息,并记录推理链条当中节点的先后关系。如图4所示的推理过程中的节点先后关系,先由节点1推出节点1的结果,“汽油价格上升”。再由节点1的结果推理出节点2的结果,“汽油销售业务的业务收入增加”。在结构化结果的文件中,记录推理链条节点1和节点2这样的先后关系;

结果展示模块用于将结果存储模块的文件通过图形化界面展示为可视化结果,通过结构化结果文件记录的不同推理链条节点的先后关系,将不同的推理链条分开展示,对于每一个推理链条,画出推理链条中节点的先后关系;

实施例二

具体地,事件抽取系统使用的是提前训练好的事件抽取模型。输入模块接受用户的输入的文本,该文本既可以是新闻文本,又可以是用户自己设置的事件。文本处理模块将输入的文本进行处理,匹配到相关的事件类型,并将该文本中的事件信息填充入该事件类型的结构化模板。输出模块将最终抽取出的事件类型和结构化的事件信息作为推理系统模块的输入。在图9中,事件抽取模型从输入的文本中抽取出事件,并将其转化为推理系统模块中“概念-算子”表示的知识方程。将知识方程存入事实列表中,事实列表是知识等式的集合,记录当前从数据库、文本获取的或由规则的前提推出的知识方程形式的事实。如图6所示,产业链模块用于获取行业上下游产品的关系;公司信息模块用于获取公司的基本信息及主营业务;商品信息模块用于获取商品的价格、库存、进出口量等信息。如图9所示,将数据库中的行业上下游产品的“父子关系”、公司的基本信息及主营业务、商品的价格、库存、进出口量等转化为知识方程形式,存入事实列表。

概念集合模块包括行业内的、公司内的实体;算子集合模块用于概念之间的计算。算子的输入、输出均为概念集合中的若干概念。可通过算子、概念经过计算得到新的概念;知识规则模块包括行业内的、公司内的研究员总结出的知识,通过知识规则的前提可推出知识规则的结论;

从事实列表中搜索是否有满足规则前提的知识方程。若有,则触发该规则由该前提推出该规则的结论的知识方程,并存入事实列表。重复搜索事实列表,重复触发规则的过程,直至推理链条到达公司的评估指标,该推理链条结束。

结果文件存储模块用于将推理系统的推理结果存储为文本文件及其他结构化结果的文件;结果展示模块用于将结果存储模块的文件通过图形化界面展示为可视化结果;

在推理过程中,结果文件存储模块记录每一次规则的触发,并记录每一条完整推理链条中规则触发的先后顺序。在结果展示模块中,将记录的推理链条通过图形化界面展示为可视化结果,将不同的推理链条分开展示,对于每一个推理链条,画出推理链条中节点的先后关系。

以上所述的实施例仅是对本申请优选方式进行的描述,并非对本申请的范围进行限定,在不脱离本申请设计精神的前提下,本领域普通技术人员对本申请的技术方案做出的各种变形和改进,均应落入本申请权利要求书确定的保护范围内。

技术分类

06120115638672