掌桥专利:专业的专利平台
掌桥专利
首页

一种信用债券违约风险分析系统、方法及存储介质

文献发布时间:2023-06-19 19:28:50


一种信用债券违约风险分析系统、方法及存储介质

技术领域

本发明涉及风险分析技术领域,具体为一种信用债券违约风险分析系统、方法及存储介质。

背景技术

我国债券市场于1981年启动,截至2012年底债券市场的存量规模已超过沪深两市的股票总市值,债券市场早已作为资本市场必不可少的组成部分,在现代金融体系中发挥着至关重要的作用。经过40多年的发展,债券融资已成为我国重要融资手段之一。2021年度我国共计发行债券53,798笔,其中信用债券20,793笔;发行金额达61.76万亿元,其中信用债券20.06万亿元;存量规模已达到130.34万亿元,其中信用债券42.65万亿元,已成为全球第二大债市。

信用债券是指商业银行以及各类企业以自身信用发行的债券,一般而言广泛存在着信用风险。债券市场的发债主体在面临宏观经济结构性调整、行业周期性波动、金融去杠杆、监管趋严的市场环境中,债券违约变得更加常态化。2014年3月,“11超日债”利息无法按期全额支付,成为国内首例实质性违约的公募债券,也是首例实质性违约的上市公司信用债券。2014年至2021年,信用债券市场共发生762笔债券违约,违约日的债券余额为7175亿元,特别是后4年的债券违约数量和金额分别是前4年的5.3倍和7.6倍,其中2021年上市公司违约金额占比高达1/3。

随着信用债市场上债券违约现象的频频出现,使企业通过债券市场进行融资的资金成本提高,也使投资者在投资过程中所面临的投资风险变大,最终使整个金融领域的信用风险陡然提升。

发明内容

本发明的目的在于:提出一种信用债券违约风险分析系统、方法及存储介质,该技术方案能够用来度量信用债券违约风险,可以为投资者识别和预测潜在违约风险以及监管部门对信用债市场的监管协调方面提供参考。

为解决上述问题,本发明提供的基础方案:一种信用债券违约风险分析系统,包括:

数据处理模块,包括采集子模块与预处理子模块,所述采集子模块用于采集训练样本数据以及风险分析数据,预处理子模块用于对采集的数据进行清洗、整理;

模型训练模块包括指标管理子模块、训练子模块,所述指标管理子模块用于选取、加入指标以及对指标进行检验筛选,训练子模块用于对模型进行训练、检验、迭代更新;

风险分析模块,用于根据指标数据预测信用债券违约风险,所述风险分析模块包括宏观分析子模块、行业分析子模块、内部治理分析子模块、财务能力分析子模块;

预警模块,用于在预测到信用债券存在风险时及时发出预警。

基础方案的有益效果:数据处理模块能够采集模型训练以及风险分析所需数据,并进行清洗整理,方便后续直接使用;模型训练模块对指标进行选取、加入检验筛选出有效指标,训练子模块用于对模型进行训练维护保证模型具有有效性以及时效性;风险分析模块通过多维度的分析子模块从多个维度对信用债券违约风险进行分析,以便更准确地对违约风险进行预测,预警模块能够及时对违约风险进行预警,投资者识别和预测潜在违约风险以及监管部门对信用债市场的监管协调方面提供参考。

作为优选方案,所述指标管理子模块在进行检验筛选时将对指标分别进行显著性检验、相关性检验和多重共线性检验,对于其中的定性指标,单独采用卡方检验。

对定性指标与变量分别采用不同的检验方式进行针对性检验使检验结果更准确,对显著性、相关性、多重共线性均进行检验多方面检验剔除对违约风险影响较弱的指标,并准确检测出多重共线性,便于后续采取向前逐步回归法,保证模型具有准确性。

作为优选方案,所述风险分析模块还包括跟踪子模块,所述跟踪子模块将持续跟踪进行过风险分析且进行了持续跟踪标记的信用债券,定期采集该信用债券相关的指标数据,在发现存在风险时通过预警模块及时提醒。

持续跟踪信用债券,能够在采集的数据出现异常后,及时进行预警,降低投资者风险同时也便于监管部门持续监管。

作为优选方案,使用了如权利要求1-2中任一项所述的一种信用债券违约风险分析系统,具体包括:

S1:采集训练样本数据;

S2:设“是否违约”为因变量Y,将“违约”设为1,“未违约”设为0,设定事件Y是否发生的n个影响因素为X,构建模型;

S3:进行数据预处理;

S4:通过机器学习算法调用训练样本集训练模型;

S5:检验模型有效性;

S6:获取到债券违约风险查询请求,采集风险分析数据,通过模型得到风险分析结果。

通过S1-S4训练出具有预测信用债券违约风险的模型,通过S4检验有效性保证模型的性能与准确性,S6为实际应用步骤。

作为优选方案,所述S1中采集的训练样本数据包括违约组与对照组,在选取违约组时选择近几年的数据,保证样本的时效性,所述违约组样本还应当涉及证监会行业分类标准下的全部八大类行业,二十种门类行业。

采集的样本具有广泛性,使得最终模型的应用也足够广泛。

作为优选方案,所述S3包括:

S31:对数据进行清洗、整理;

S32:选取影响信用债券违约的指标数据,并对指标进行检验筛选。

S31对数据进行处理便于后续调用,S32进行检验筛选保证模型训练后具有较高的准确性。

作为优选方案,所述S32包括:

S32-1:对定性指标进行卡方检验;

S32-2:对变量按照“是否违约”分组后分别进行显著性检验检测,剔除存在显著性差异的指标;

S32-3:通过皮尔逊相关性检验判断因变量Y与自变量X是否存在线性关系与多重共线性,剔除不存在线性关系的指标,并对存在多重共线性的指标在Logit回归分析时针对性采用向前逐步回归法;

S32-4:经过筛选最终得到影响信用债券违约的指标。

作为优选方案,所述S32-1在检验指标是否具有显著性前,需要检查卡方检验得出的皮尔逊卡方结果有效个案数与没有发现单元格的理论频数是否符合标准。

即对卡方检验本身的有效性进行判定,符合标准时才判定卡方检验结果可用。

作为优选方案,所述S5包括:

S51:通过对测试样本集中各样本数据求解其违约概率预测值,判断预测正确率;

S52:通过绘制ROC曲线,判断模型的性能。

S51通过实际测试对模型进行检验判断其正确率,S52通过ROC曲线的AUC值判断模型的性能以判断其准确性,通过两个维度的判定确保模型的准确率较高。

一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求4-9项任一项所述的一种信用债券违约风险分析方法的步骤。

存储介质上的计算机程序能够执行上述任一项所述的一种信用债券违约风险分析方法,保证该方法能够在不同计算机设备上正常运行实施。

附图说明

图1是一种信用债券违约风险分析方法的逻辑图。

具体实施方式

下面通过具体实施方式对本申请技术方案进行进一步详细说明:

本申请所述的信用债券具体是指:以政府以外的发行债券主体的信用为基础,其经营与财务状况影响其偿还能力,因而存在一定信用风险的债券市场融资工具。本申请所述的所有债券默认都是信用债券,后边将不再进行赘述。

本申请所述上市公司信用债券的违约风险,是指发行主体未能按照协议在到期日或付息日支付本金或利息、发生消极债务重组、破产或被接管的实质性违约风险。

一种信用债券违约风险分析系统,包括数据处理模块,模型训练模块,风险分析模块,预警模块。

数据处理模块包括采集子模块与预处理子模块,采集子模块用于根据模型训练模块和风险分析模块对数据的需求,采集训练样本数据以及风险分析数据;训练样本数据分为违约组与对照组。预处理子模块用于对采集的数据进行清洗、整理,提取所需的各类型数据,并将数据划分为训练样本集和测试样本集。

模型训练模块包括指标管理子模块、训练子模块,指标管理子模块用于选取、加入指标以及对指标进行检验筛选,所述指标包括财务指标与非财务指标,指标管理子模块将分别进行显著性检验、相关性检验和多重共线性检验,对于其中的定性指标,单独采用卡方检验,通过检验判断指标是否显著,本实施例中采用P值为0.05作为标准来判断标准是否显著。训练子模块用于对模型进行训练、检验、迭代更新等。

风险分析模块,基于Logit模型,用于根据指标数据预测信用债券违约概率;风险分析模块包括宏观分析子模块,行业分析模块,内部治理分析子模块,财务能力分析子模块。

宏观分析子模块用于分析宏观经济数据以判断经济形势,宏观经济数据包括货币政策、金融监管政策等金融环境因素,以及经贸摩擦、美联储加息等外围环境因素,宏观经济数据通过爬取新闻、政策文件进行分析等方式获取,通过分析经济增速、政策宽松或紧缩、外围环境是否紧张等因素判断违约发生概率。

行业分析子模块用于通过采集的行业数据判断行业的景气度,行业分类以证监会行业大类统计为准,通过统计各行业违约情况动态预测各行业违约概率。行业数据还包括企业性质,由于民营企业内部资本有限和融资渠道有限,导致融资难、融资贵和贷款综合成本高。而国有企业拥有更雄厚的资本金和更广的融资渠道,可以更容易地获得大金额、低成本的资金,因此对所述企业性质的分类有助于更准确地判断违约风险。

内部治理分析子模块用于分析内部治理数据以判断企业治理效果,内部治理数据主要包括公司的资产规模以及大股东权质押比例,原因在于资产规模大的公司资金较雄厚,抗击市场风险的能力较强,经营也较稳健,相应发生违约的可能性较小;大股东大量占用发债主体的资金、为其提供资金或融资担保、存在密切的关联交易时,会进而引发上市公司违约风险。内部治理数据主要通过爬取年报、财报等数据进行分析的方式获取。

财务能力分析子模块用于分析企业财务能力数据,从财务因素判断企业违约概率,财务能力数据包括但不限于现金流能力、盈利能力、成长能力、运营能力、偿债能力。

于一种实施例中,风险分析模块包括跟踪子模块,所述跟踪子模块将持续跟踪进行过风险分析且进行了持续跟踪标记的信用债券,定期采集该信用债券相关的指标数据,在发现存在风险时通过预警模块及时提醒,跟踪子模块定期采集指标数据的频次将根据当前宏观经济政策、该信用债券所处行业以及企业性质等因素进行自动调整,以便在发生风险可能性较大时能采集数据及时预警,在发生风险可能性较低时降低系统占用,节约资源。

于一种实施例中,风险分析模块还包括增信分析子模块,增信分析子模块用于分析检测企业是否采取额外的增信措施,增信措施包括但不限于第三方担保、抵质押担保、债券保险、债券信托、信用准备金,增信分析子模块将从增信措施的多样性、增信力度等维度进行分析准确降低该企业相应的预测违约概率值。

还包括预警模块,预警模块主要在预测到信用债券存在风险时及时发出预警,避免损失。预警模块的提醒方式包括但不限于短信、APP内信息推送、AI电话、电子邮件。

如图1所示,一种信用债券违约风险分析方法,具体步骤如下:

S1:采集训练样本数据,设定违约组与对照组作为训练样本,在选取违约组时选择近几年的数据,保证样本的时效性,所选择违约组样本应当涉及证监会行业分类标准下的全部八大类行业,分布在二十种门类行业中,以保证样本具有广泛性;对照组样本选择与违约组市值接近,前一年末属于证监会统一行业门类下,且股票价格充分波动未发生违约的上市公司,数据的年度与违约组保持一致。为保证对照更加准确,违约组中每一个样本的对照组可采集多个。

S2:构建模型,包括:

S21:通过建立二分类Logit模型,设“是否违约”为因变量Y,将“违约”设为1,“未违约”设为0,如式1所示:

S22:设定事件Y是否发生的n个影响因素为X=(x1,x2,……,xn),假设事件Y发生的概率为p,即P(Y=1)=p,P(Y=0)=1-p,定义事件Y发生与不发生概率的比值定义为发生比,即p1-p,建立发生比的对数与各影响因素之间的线性关系方程,如式2所示:

其中,Xi=(1,X1i,X2i,…Xni),为解释变量观测向量;βi=(β0,β1,β2,…βn),为参数向量。

S23:由此事件发生的概率可表示为式3所示:

从式3可得知Logit呈S型曲线结构,围绕着p=0.5对称,且变量不需要满足正态分布。事件Y发生的概率p始终落在[0,1]区间内,当自变量变小时,P值靠近0;当自变量变大时,P值靠近1。Logit函数中,一般将p=0.5作为预测事件发生的阈值,若大于阈值判定事件发生,小于阈值判定事件不发生。

S3:进行数据预处理,包括:

S31:对数据进行清洗、整理,然后提取发生债务违约企业的各类型数据。

S32:选取影响信用债券违约的指标数据,并对指标进行检验筛选,指标包括财务指标与非财务指标,模型训练将分别进行显著性检验、相关性检验和多重共线性检验,对于其中的定性指标,单独采用卡方检验,通过检验判断指标是否显著,本实施例中采用P值为0.05作为标准来判断标准是否显著,具体包括:

S32-1:进行卡方检验,对于得出的皮尔逊卡方结果还需检查有效个案数与没有发现单元格的理论频数是否符合标准,即对卡方检验本身的有效性进行判定,符合标准时才判定卡方检验结果可用,进而发判定该进行检验的指标是否具有显著性。本实施例中对企业类型这一定性指标进行检测,检测结果如表1所示:

由表1可知,有效个案数为93且没有发现单元格的理论频数小于5,可以使用皮尔逊卡方的结果,其统计量的值为7.714,对应的渐进显著性(双侧)值为0.005<0.05,企业性质和是否违约相关且存在显著性,因此该变量可用。

S32-2:进行显著性检验,首先对变量按照“是否违约”分组后分别进行检测,本实施例中根据样本情况优选采用夏皮洛-威尔克检验,对于“是否违约”不存在显著性差异的指标剔除。

S32-3:为了检测因变量Y与自变量X之间可能存在的弱相关性,还需通过皮尔逊相关性检验做进一步判别,皮尔逊相关系数小于0.3的指标,说明两者间不存在线性关系,该指标需要剔除。皮尔逊相关系数大于0.7的指标,说明自变量X之间存在多重共线性,为了有效消除变量间的多重共线性,Logit回归分析时优选采用向前逐步回归法。

S32-4:经过筛选最终得到影响信用债券违约的指标。

S4:通过机器学习算法调用训练样本集训练模型,当有新增指标,或指标数据更新等情况时,对模型进行迭代训练。

S5:检验模型有效性,包括:

S51:Logit模型通过对测试样本集中各样本数据求解其违约概率预测值,得到Logit模型的预测正确率。

S52:通过绘制ROC曲线,如果曲线靠近左上角(即AUC值)说明模型性能越高,准确性较高,在实施中,设置AUC值的阈值以判断模型的准确率。

S6:获取到债券违约风险查询请求,采集风险分析数据,风险分析数据包括但不限于宏观经济数据、行业数据、内部治理数据、财务能力数据,财务能力数据包括但不限于现金流能力、盈利能力、成长能力、运营能力、偿债能力。

S6通过模型预测信用债券违约概率结果,并将最终结果进行反馈,违约概率处于0-1之间,本实施例中,以0.5作为违约概率高低的判定标准,高于0.5违约概率较高,对违约概率较高的信用债券将采取及时预警措施。

一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时,实现上述一种信用债券违约风险分析方法的步骤。

本领域普通技术人员可以理解实现上述一种信用债券违约风险分析方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括一种信用债券违约风险分析方法的各个实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其他介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未做过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以做出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

技术分类

06120115920096