掌桥专利:专业的专利平台
掌桥专利
首页

一种公益诉讼重点领域案件趋势分析系统

文献发布时间:2023-06-19 11:29:13


一种公益诉讼重点领域案件趋势分析系统

技术领域

本发明属于公益诉讼数据分析技术领域,涉及一种公益诉讼重点领域案件趋势分析系统。

背景技术

新一轮科技革命兴起,特别是云计算、大数据、人工智能的发展,不仅更新了我们认识世界的思维方法,也给检察办案工作提供了新途径、新手段。将大数据、人工智能等信息技术,全面应用到检察公益诉讼工作中是非常有必要的。

目前检察机关对于公益诉讼检察案件数据的预测通过常用表格统计分析,形成案件的宏观数量趋势预测,缺少结合多维度特征的态势预测分析,只能对案件数据进行采集归类、可视化展示等,无法协助检察机关从全局的角度归纳、分析海量的案件数据,也不能对案件数据进行未来态势预测分析,不能帮助进行决策和辅助办案不稳提升办案效率和质量。

发明内容

针对上述问题,本发明提出了一种公益诉讼重点领域案件趋势分析系统,很好的解决了现有技术中无法进行态势预测分析以及效率低下的问题。

为了实现上述目的,本发明采用的技术方案如下:一种公益诉讼重点领域案件趋势分析系统,包括:

数据层,用于文本数据的储存和读取;

技术层,用于对数据层中的文本数据进行基础特征提取、趋势属性提取和趋势关系提取,并根据基础特征提取、趋势属性提取和趋势关系提取建立文本数据认知模型,并通过文本数据认知模型自动分析研判文本数据,同时根据趋势关系将研判的文本数据进行标签处理;

应用层,将标签处理的文本数据进行趋势预测和统计分析,并进行图形化显示。

进一步的,所述基础特征提取采用主体提取或聚类分类方法挖掘文本数据的业务领域。

进一步的,所述趋势属性提取采用层级注意力的弱监督属性提取方法进行,包括以下步骤:

(1.1)使用粗粒度的句子级别注意力机制选择多个与属性类型相关的案件数据;

(1.2)然后使用分段卷积神经网络和词级别的注意力机制提取每个文本数据的特征;

(1.3)最后使用细粒度的文本数据级别注意力机制筛选与实体之间的属性语义关系更相关的文本数据特征,得到整个文本数据集合的向量表示,并将该向量表示传给一个分类器来预测实体之间的属性语义关系。

进一步的,所述趋势关系提取采用混合神经网络的实体和关系的联合抽取方法进行,包括以下步骤:

(2.1)首先使用双向长短记忆网络来提取文本数据中词之间的依赖信息,形成词向量;

(2.2)然后使用卷积神经网络来获取句子的特征表示,并将该特征表示传给一个多标签分类器来预测文本数据的句子中包含的语义关系,形成关系向量;

(2.3)最后将(2.1)中的词向量与(2.2)中的关系向量进行联合,并传递给另一长短期记忆网络来预测文本数据中的每个词的标签,得到每个关系对应的实体对。

进一步的,所述趋势预测的计算步骤如下:

(3.1)从趋势属性提取中获取文本数据的时间序列特征;

(3.2)对(3.1)中的时间序列特征绘图,观测是否为平稳时间序列特征,对于非平稳时间序列特征要先进行d阶差分运算,化为平稳时间序列特征;

(3.3)对(3.2)平稳时间序列特征分别求得其自相关系数和偏自相关系数,通过对平稳时间序列特征的自相关图和偏自相关图的分析,得到最佳的阶数p和q;

(3.4)由(3.2)中得到的d和(3.3)得到的p、q,得到趋势预测的分析演算模型,公式如下:

其中,y

θ为偏自相关系数;

t为时刻;

i、j为自然数;

ε为设定的常系数。

进一步的,对得到的分析演算模型进行检验,检验步骤如下:

(4.1)通过观察时间序列特征图和ADF单位根检验来判断序列是否平稳;

(4.2)若为非平稳时间序列特征,通过差分运算使其平稳化,其中差分次数为d,然后对差分d次后的平稳时间序列特征进行白噪声检验,最后若平稳化的时间序列特征为非白噪声序列特征,则可进入步骤(4.3);

(4.3)根据文本数据的时间序列特征的自相关图和偏自相关图选择适当的阶数p和q,然后对分析演算模型进行拟合,如果自相关系数呈指数形式衰减到零,则存在移动平均过程;如果时间序列特征同时为平稳时间序列特征和非白噪声序列特征,则该时间序列特征为求和自回归移动平均过程;

(4.4)利用最小二乘法估计时间序列特征的回归系数;

(4.5)对分析演算模型进行残存白噪声检验和参数性检验,如果残存时间序列特征不是白噪声序列特征,则返回步骤(4.3)重新建立分析演算模型,直至通过(4.5)中的残存白噪声检验和参数性检验;

(4.6)利用通过参数检验和残差白噪声检验的趋势分析对文本数据进行短期预测。

与现有技术相比,本发明具有以下有益效果:

本发明中,通过人工智能、大数据分析等技术手段实现对于检察机关办案过程多产生的公益诉讼案件本文数据进行识别、提取、分析,对公益诉讼重点领域进行标签化处理并分类评估,并对文本数据进行短期预测未来态势,最后进行图形化显示,为检察机关的决策提供数据支持,还可以为一线检察部门提供办案辅助,提高办案的效率和质量。

附图说明

图1为本发明整体架构图;

图2为本发明中文本数据总量趋势预测图表;

图3为本发明中文本数据领域趋势预测图表。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明所述的一种公益诉讼重点领域案件趋势分析系统,包括数据层,用于文本数据的储存和读取;所述文本数据是指案件信息。

技术层,用于对数据层中的文本数据进行基础特征提取、趋势属性提取和趋势关系提取,并根据基础特征提取、趋势属性提取和趋势关系提取建立文本数据认知模型,并通过文本数据认知模型自动分析研判文本数据,同时根据基础特征将研判的文本数据进行标签处理;

应用层,将标签处理的文本数据进行趋势预测和统计分析,并进行图形化显示。

本实施例中,所述基础特征提取采用主体提取或聚类分类方法挖掘文本数据的业务领域,业务领域包括生态环境领域、资源保护领域、食品安全领域、药品安全领域、国有财产领域、国有土地领域等。

本实施例中,所述趋势属性提取采用层级注意力的弱监督属性提取方法进行,包括以下步骤:

(1.1)使用粗粒度的句子级别注意力机制选择多个与属性类型相关的案件数据;

(1.2)然后使用分段卷积神经网络和词级别的注意力机制提取每个文本数据的特征;

(1.3)最后使用细粒度的文本数据级别注意力机制筛选与实体之间的属性语义关系更相关的文本数据特征,得到整个文本数据集合的向量表示,并将该向量表示传给一个分类器来预测实体之间的属性语义关系。

本实施例中,所述趋势关系提取采用混合神经网络的实体和关系的联合抽取方法进行,包括以下步骤:

(2.1)首先使用双向长短记忆网络来提取文本数据中词之间的依赖信息,形成词向量;

(2.2)然后使用卷积神经网络来获取句子的特征表示,并将该特征表示传给一个多标签分类器来预测文本数据的句子中包含的语义关系,形成关系向量;

(2.3)最后将(2.1)中的词向量与(2.2)中的关系向量进行联合,并传递给另一长短期记忆网络来预测文本数据中的每个词的标签,得到每个关系对应的实体对。本发明中,标签可以分为年度、线索受理、立案、诉前程序、提起诉讼、一审、二审、领域、公益诉讼类型、违法行为、办案时长等。

本实施例中,(3.1)从趋势属性提取中获取文本数据的时间序列特征;时间序列特征为标签中的年度、办案时长或月份等标签的序列;

(3.2)对(3.1)中的时间序列特征绘图,观测是否为平稳时间序列特征,对于非平稳时间序列特征要先进行d阶差分运算,化为平稳时间序列特征;

(3.3)对(3.2)平稳时间序列特征分别求得其自相关系数和偏自相关系数,通过对平稳时间序列特征的自相关图和偏自相关图的分析,得到最佳的阶数p和q;

(3.4)由(3.2)中得到的d和(3.3)得到的p、q,得到趋势预测的分析演算模型,公式如下:

其中,y

θ为偏自相关系数;

t为时刻;

i、j为自然数;

ε为设定的常系数。

本实施例中,对得到的分析演算模型进行检验,检验步骤如下:

(4.1)通过观察时间序列特征图和ADF单位根检验来判断序列是否平稳;

(4.2)若为非平稳时间序列特征,通过差分运算使其平稳化,其中差分次数为d,然后对差分d次后的平稳时间序列特征进行白噪声检验,最后若平稳化的时间序列特征为非白噪声序列特征,则可进入步骤(4.3);

(4.3)根据文本数据的时间序列特征的自相关图和偏自相关图选择适当的阶数p和q,然后对分析演算模型进行拟合,如果自相关系数呈指数形式衰减到零,则存在移动平均过程;如果时间序列特征同时为平稳时间序列特征和非白噪声序列特征,则该时间序列特征为求和自回归移动平均过程;

(4.4)利用最小二乘法估计时间序列特征的回归系数;

(4.5)对分析演算模型进行残存白噪声检验和参数性检验,如果残存时间序列特征不是白噪声序列特征,则返回步骤(4.3)重新建立分析演算模型,直至通过(4.5)中的残存白噪声检验和参数性检验;

(4.6)利用通过参数检验和残差白噪声检验的趋势分析对文本数据进行短期预测。

本实施例中,运用上述系统对案件进行分析,如图2所示,为案件总量趋势预测的图表,X轴为年份,Y轴为案件数量,实线把历年案件数量连接起来,最后三个节点为未来三年的年度办案数量,使用虚线连接,对未来三年的案件数量呈稳步上升趋势,直观明显,利于制定策略进行应对。

本实施例中,公益诉讼中的重点领域包括生态环境领域、资源保护领域、食品安全领域、药品安全领域、国有财产领域、国有土地领域,使用上述技术方案对公益诉讼的领域进行标签处理,进而可以分类评估,并分类进行趋势预测,如图3所示,为不同业务领域案件数量趋势预测的图表,其中①为生态环境领域,②为资源保护领域,③为食品安全领域,④为药品安全领域,⑤为国有财产领域,⑥为国有土地领域,X轴为年份,Y轴为案件数量,实线把历年案件数量连接起来,最后三个节点为未来三年的年度办案数量,使用虚线连接;通过图表的直接观察,可以了解各个领域的办案数量,制定人员分配,并反应各个领域的发展动态,为检察机关的决策提供数据支持,还可以为一线检察部门提供办案辅助,提高办案的效率和质量。

尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种公益诉讼重点领域案件趋势分析系统
  • 一种案件统计及趋势分析系统
技术分类

06120112941571