掌桥专利:专业的专利平台
掌桥专利
首页

基于上市公司行业信息的建筑行业供应商动态画像的生成方法

文献发布时间:2023-06-19 18:37:28


基于上市公司行业信息的建筑行业供应商动态画像的生成方法

技术领域

本发明属于供应商评价技术领域,特别是涉及基于上市公司行业信息的建筑行业供应商动态画像的生成方法。

背景技术

目前基于专家知识的评分规则是建立供应商画像模型的主流方法,该方法能够将复杂问题简单化,同时考虑到不同行业应用场景的特点,建立有效可行的具体应用场景上的供应商画像方案。

而在建筑行业中,基于专家打分法的传统供应商画像模型存在以下几点不足之处:模型稳健性易受到数据缺失的挑战,在建筑行业实际的供应商画像应用场景中,由于数据可及性及安全问题,存在较多的企业数据缺失情况,而传统的供应商画像模型中缺乏对缺失数据的处理方案,在实际应用中存在较大风险性,模型的稳健性难以得到保障,模型存在较强的主观性,基于专家知识的供应商画像模型与专家经验强相关,考虑到人工评分的主观性,模型结果可能会与实际结果存在较大偏差,同时,由于个人评分主观差异性的存在,设计客观且能够排除内生性问题的评分表存在较大的困难,模型时效性难以得到保障传统的建筑行业供应商画像模型大多围绕以静态数据建立评分规则,而在如今业务瞬息万变的时代下,传统模型难以及时捕捉并反映变化;

此外,由于专家评分法的人力限制,让专家对模型进行频繁调整几乎不可行,模型的有效性受到较大挑战,在通用场景上不具有泛化能力,由于建筑行业的专家知识存在领域边界,一套具体的建筑供应商画像方案无法直接复用到其他业务场景上,对于有多种经营业务的大型建筑企业来说,传统建筑行业供应商画像模型的泛化能力差,会导致较高的构建成本问题。

发明内容

本发明提供了基于上市公司行业信息的建筑行业供应商动态画像的生成方法,解决了以上问题。

为解决上述技术问题,本发明是通过以下技术方案实现的:

本发明的基于上市公司行业信息的建筑行业供应商动态画像的生成方法,包括有数据采集单元、数据缺失填补单元、画像模型单元、画像评分测验单元和模型可视化单元;数据采集单元:包括有供应商企业数据模块和上市公司数据模块,所述数据采集单元用于采集建筑供应商企业数据和建筑二级细分行业上市公司数据;数据缺失填补单元:包括有供应商关联企业填补模块、细分行业的填补方法模块和企业规模比例系数模块,所述数据缺失填补单元用于对建筑供应商企业数据缺失的情况,使用建筑行业数据进行填充;画像模型单元;包括有动态画像评分模型架构模块、指标模块和权重模块,所述画像模型单元建筑行业供应商画像模型由三级层级架构组成;所述画像评分测验单元用于对建筑供应商模型建模参数进行了多轮调整;所述模型可视化单元用于通过评分映射规则及指标权重,得到企业供应商画像在各级指标上的得分结果。

进一步的,所述供应商企业数据模块包括内部数据和外部数据,所述内部数据通过企业内部管理信息系统中采集公司与该企业的经营记录数据,所述外部数据通过第三方公开机构采集企业自身的数据。

进一步的,所述上市公司数据模块通过提取上市公司的财务数据及基本企业信息。

进一步的,所述画像模型单元通过专家打分法和数据驱动方法,得到了各级指标由指标值、权重及评分映射规则。

进一步的,所述动态画像评分模型架构模块获得的数据情况进行了综合评估,获得三级指标架构。

进一步的,所述指标模块采用专家打分法评估各个维度指标重要性,通过改进层次分析法设计了专家评分表。

进一步的,所述权重模块通过专家评分法确定一级指标及二级指标的重要程度作为权重参考依据,且通过统计数据分布情况进行了多轮模型的迭代实验,得到最终的指标权重方案。

本发明相对于现有技术包括有以下有益效果:

建立了基于数据驱动的建筑行业供应商动态画像模型,在结合了建筑行业风险评估专家知识的基础上,通过自动化同步企业内部数据库及第三方公开数据,覆盖了财务指标、知识产权、融资风险、基础资质、经营风险与法律诉讼六大信息维度,同时引入了建筑行业上市公司数据用于模拟供应商企业缺失数据,可以通过权重调整适用于多种业务应用场景,提升了建筑行业供应商画像模型的准确性、及时性和稳健性。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的基于上市公司行业信息的建筑行业供应商动态画像的生成方法流程图;

图2为本发明中的企业预警通企业数据概览图;

图3为本发明中的万得行业上市公司处理前数据图;

图4为本发明中的万得行业上市公司处理后数据图;

图5为本发明中的财务指标概览图;

图6为本发明中的知识产权指标概览图;

图7为本发明中的融资风险指标概览图;

图8为本发明中的基础资质指标概览图;

图9为本发明中的经营风险指标概览图;

图10为本发明中法律诉讼指标概览图;

图11为本发明中建筑行业供应商画像评分分布图;

图12为本发明中供应商画像结果雷达图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,本发明的基于上市公司行业信息的建筑行业供应商动态画像的生成方法,包括有数据采集单元、数据缺失填补单元、画像模型单元、画像评分测验单元和模型可视化单元;

数据采集单元:包括有供应商企业数据模块和上市公司数据模块,数据采集单元用于采集建筑供应商企业数据和建筑二级细分行业上市公司数据;

数据缺失填补单元:包括有供应商关联企业填补模块、细分行业的填补方法模块和企业规模比例系数模块,数据缺失填补单元用于对建筑供应商企业数据缺失的情况,使用建筑行业数据进行填充;

画像模型单元;包括有动态画像评分模型架构模块、指标模块和权重模块,画像模型单元建筑行业供应商画像模型由三级层级架构组成,画像评分测验单元用于对建筑供应商模型建模参数进行了多轮调整,模型可视化单元用于通过评分;

建筑行业数据采集:本方法采集了建筑供应商企业的数据及其所在建筑二级细分行业的所有上市公司数据,通过有效的数据清洗方法将原始数据处理为可供模型处理的数值型、文本型及对应的分类型数据,同时对于建筑供应商企业数据缺失的情况,使用了行业数据按公司规模比例系数进行填充,使得模型能够在冷启动阶段就拥有较好的表现;

此外,为了更好地在实际应用中提供得分情况的参考,本方法在准备建筑企业数据的同时,使用了该企业所在建筑二级细分行业的上市公司均值模拟出对应行业上市公司的数据作为对比组纳入模型;

请参阅图2所示,供应商企业数据模块:企业数据分为内部及外部数据两部分,内部数据从合作公司视角出发,是从内部管理信息系统中采集的公司与该企业的经营记录数据,包括合作年限、履约记录、交易财务数据及信用报告等,该部分数据记录会随着交易发生持续更新,外部数据是从第三方公开机构(如万得、企业预警通等)采集的企业自身的数据,该部分数据可以定期通过API自动化同步到系统中,且覆盖了包括基础资质、财务指标、知识产权、融资风险、法律诉讼等多维度信息,能够较好地反映企业的综合情况;

请参阅图3、图4所示,上市公司数据模块:上市公司数据均来自于万得资讯,可提取上市公司的财务数据及基本企业信息,样本空间为上交所及深交所所有上市公司,行业根据中信证券行业分类,精确到二级分类,通过万得Excel插件可提取所有上市公司IPO至今的财务数据,如总资产、营业总收入、归母净利润、经营性现金流等,并进一步计算衍生数据,若某家上市公司在某年还没有上市,那么这一年该公司的财务数据设为空值,通过万得全球企业库可提取所有上市公司的基本信息,如工商信息、股权穿透、商标专利等;

此外,根据中信证券二级行业分类,对提取的行业内所有上市公司的相关数据取平均值,得到该行业的平均水平作为对比组;

数据采集单元:针对建筑供应商企业数据缺失的情况,使用建筑行业数据进行填充,依据该企业是否有关联上市公司可划分为两类情况选取填补数据基准,并使用企业规模比例系数进行加权填充,形成最终的建筑供应商企业增强数据;

建筑供应商关联企业填补法,若企业存在直接关联的上市公司,使用该上市公司的数据作为填充依据;例:A公司无公开的流动比率这一财务信息,因而选用关联的上市公司参股母公司B公司的流动比率数据1.47作为补充;

基于建筑细分行业的填补方法,若企业不存在直接关联的上市公司,使用该企业所在行业的所有上市公司数据的均值作为填充依据,例C公司无公开的净利润这一财务信息,因而选用其所属中信二级行业D行业所有上市公司在近三年(2018-2021年)的净利润行业均值522.3231作为填充依据;

企业规模比例系数,通过企业的公司规模与对应的上市公司的公司规模(或同行业上市公司规模的均值)的比值作为企业规模系数,对上市公司行业数据进行加权后填充为该企业的数据,最终得到所有指标都不存在缺失情况的企业增强数据作为模型输入,例:E公司注册资金40000万元,其所在的F行业所有上市公司注册资金均值为434889.7964,因而企业规模系数为0.091978;

建筑行业供应商画像模型:建筑行业供应商画像模型由三级层级架构组成,通过专家打分法和数据驱动方法的有效结合,得到了各级指标由指标值、权重及评分映射规则;

动态画像评分模型架构,本方法参考了供应商画像领域的前人研究结果,并对可获得的数据情况进行了综合评估,最终设计了三级指标架构,一级指标由财务指标、知识产权、融资风险、基础资质、经营风险、法律诉讼六大维度组成,其下分别设有二级指标与三级指标,为每级指标分别设计了权重,通过加权计算可获得每级指标的得分及综合得分,能够支持数据库中供应商企业在整体得分及各个画像维度得分上的横向比较,随着时间维度数据的更新,也能够展现企业在时间轴上的纵向表现;

基于专家打分法的指标重要性,考虑到供应商评价与应用场景的强关联性,本方法使用了专家打分法评估各个维度指标的重要性,通过改进层次分析法设计了专家评分表,并邀请多位不同领域的行业专家进行评分,得到了一级指标与二级指标的重要性程度,分为4级(相对不重要/一般重要/重要/非常重要),为后续模型权重确定提供了专家知识的基础;

基于数据驱动的指标权重确定,在指标权重方面,本方法考虑结合专家打分法和数据驱动方法进行平衡,通过专家评分法确定了一级指标及二级指标的重要程度作为权重参考依据,并通过统计数据分布情况进行了多轮模型的迭代实验,得到最终的指标权重方案,同时,为方便日后调整及其他应用场景的特殊规则,本方法提供了专家调整权重的接口,在实际生产中可以做到在不影响模型稳健性的前提下进行灵活调整。

在评分映射规则方面,本方法抽取出4种通用评分映射规则:分区赋分法、分位赋分法、扣分法及一票否决法,并相应设计了可调整的接口,供企业实际生产中快速迭代评分映射方案;

数据分布,使用数据库内的供应商企业数据作为训练集,使用统计方法刻画了数据的分布情况及统计性指标,同时,引入了行业数据,一方面,行业数据可以作为上界进行参考,另一方面,行业数据自身的分布能够反映供应商所在行业维度的信息,并通过在时间轴上对比行业数据的分位数可以得到当前节点的行业情况;

指标权重,基于专家打分得到的指标重要性,本方法通过对数据库内数据开展了模拟实验,得到了最终的权重方案,同时开放了参数调整的接口,能够支持企业进行灵活性调整;

请参阅图5所示,财务指标维度,该指标下设资产负债结构、盈利能力、现金流量充足性、资产流动性和供应商业务贡献力5个二级指标,权重分别为10%、30%、30%、20%和10%,资产负债结构通过资产负债率计算,盈利能力细分为销售毛利率、净利率和总资产报酬率3个三级指标,现金流量充足性洗氛围经营性现金流量与营业收入比、现金利息保障倍数和现金到期债务比3个三级指标,资产流动性细分为流动比率和速动比率2个三级指标,以上三级指标在二级指标下均是等权重的,供应商业务贡献力细分为总交易规模、近期交易规模、合作趋势3个三级指标;

请参阅图6所示,知识产权维度,该指标下设商标和专利量2个二级指标,权重分别为50%和50%;

请参阅图7所示,融资风险维度,该指标下设首次有相关还款责任、欠税记录、强制执行记录和行政处罚记录4个二级指标,权重分别为20%、 30%、30%和20%;

请参阅图8所示,基础资质维度,该指标下设公司规模、基础沿革2 个二级指标,权重分别为40%和60%,公司规模指标进一步细分为注册资金规模、分支机构数量2个三级指标,基础沿革指标进一步细分为成立时间、股东背景、工商变更频率3个三级指标;

请参阅图9所示,经营风险维度,该指标下设行业环境、公司经营、公司管理、公司违规4个二级指标,权重分别为15%、40%、5%、40%,行业环境指标进一步细分为发展前景、盈利情况、竞争强度3个三级指标,公司经营指标进一步细分为发展阶段、招投标数量、与采购方的合作年限、资质数量4个三级指标,公司管理指标进一步细分为纳税信用级别、纳税信用变化2个三级指标,公司违规指标进一步细分为严重违法次数、欠税次数2个三级指标;

请参阅图10所示,法律诉讼维度,该指标下设司法信息、行政信息2 个二级指标,权重分别为60%和40%。司法信息指标进一步细分为失信信息、立案信息2个三级指标;基础沿革指标取决于行政处罚次数1个三级指标;

评分映射规则,指标自身属性可分为正向指标及负向指标两大类。其数值含义可对应为加分或减分规则,同时对于行业数据,行业在时间轴上的分布情况及行业自身数据的分布情况都是重要的评分依据,因此基于以上的考量,本方法抽取出4种通用评分映射规则,分区赋分法、分位赋分法、扣分法及一票否决法

分区赋分法,某些指标的不同区位有不同含义,本方法根据指标所在不同区位对该公司进行赋分,例某公司的合作趋势指标,大于1时代表合作趋势在加强,小于1时代表合作趋势在减弱,A公司合作趋势指标为0.82,小于1,记0分;

分位赋分法,时间截面上的横向分位,公司的业绩表现是受到宏观经济及行业环境等外部因素制约的,在不同时间点会有不同的业绩表现,在评价具体的公司时,不应当以历史数据作为参照评估一个公司当下的表现,而应当选取同时间点的同行业公司表现作为参照,用于评估一个公司当下的表现,在评估某公司的财务指标表现时,本方法以上市公司最近一期的财务指标表现为参照,根据该公司所处行业分位数赋分,例:评价资产负债率时,top20%公司记80分,top20%~top40%公司记90分,top40%~top60%公司记100分,top60%~80%记50分,top80%~100%记30分。某公司资产负债率为2,与上市公司相比处于top20%,记80分;

时间轴上的纵向分位,在评价行业环境时,由于不同行业之间的属性存在显著差异,行业之间的直接对比是不合理的,也没有一个统一的规则对行业数据的优劣进行评价,从时间轴上看数据的纵向维度,可以得到任意行业指标当前的数值在过去一段时间内的相对高低(分位数),从而反映行业现状在历史上处于较好或较坏的位置,一般使用2010年至今的时间段作为参照对象,主要由于2010年之前国内的经济结构与当今的区别过大,不具有参考价值,例在评价行业的净资产收益率(ROE)时,假设G行业的 ROE为20%,该行业近十年的ROE中位数为15%,而H行业的ROE为30%,该行业近十年的ROE中位数35%,尽管G行业ROE的绝对数值低于H行业,但是认为G行业ROE一项指标的得分应该高于H行业;

扣分法,融资风险维度中的指标均是负向指标,大部分公司在这一维度不会有异常数据,小部分公司会出现异常数据,本方法采取倒扣分的方式对该指标进行评分,即没有违约记录的公司默认得满分,一旦出现违约记录,根据违约的严重情况扣分,例I公司近期有3次行政处罚记录,那么扣除(3*a)分,I公司在行政处罚指标的得分为(100-3*a)分,其中数值a 由风险的严重程度决定;

一票否决法,对于进入失信名单这类对供应商评级影响特别巨大的指标,采取一票否决的方法,即一旦满足某些既定条件,则指标直接计零分,另外,对于一些带有时间戳的指标,考虑到历史较为久远的事件对供应商当前的评级影响相对较小,可采用带有时间条件限制的一票否决法,例:以失信信息指标为例,若某供应商被列入国家失信名单,则该项指标直接计零分,否则计满分,以严重违法指标为例,仅考虑供应商一年内严重违法的次数,历史相对久远的违法记录不纳入考虑

请参阅图11所示,建筑供应商画像评分测算验证,本方法基于评分测算结果,对模型建模参数进行了多轮调整,使得数据库内供应商企业得分服从均值在70波动的正态分布,验证了模型评分结果能够较好地符合建筑行业企业真实情况;

此外,相较于数据库内的建筑企业,作为对比组设置的上市公司行业均值组在六大维度上都有着较高的评分,验证对比组能够作为行业标准投入实际使用参考,例抽取出数据库中的某家上市公司企业得分为78分,该结果验证了,本模型能够较好地刻画出建筑行业上市公司及非上市公司企业画像评分的差异性,本模型仿真出的行业上市公司对比组,和实际上市公司的分布贴近,能够在数据缺失的情况下,较好地度量行业情况;

请参阅图12所示,模型结果可视化,通过评分映射规则及指标权重,可得到企业供应商画像在各级指标上的得分结果,本方法选择雷达图形式进行可视化呈现,并且可追溯到原始数据对异常情况进行预警;

设计了可展开各层级指标的雷达图进行了可视化展示,同时设置了对比组(即该企业所在行业上市企业均值)的得分情况作为参考。

其中,供应商企业数据模块包括内部数据和外部数据,内部数据通过企业内部管理信息系统中采集公司与该企业的经营记录数据,外部数据通过第三方公开机构采集企业自身的数据。

其中,上市公司数据模块通过提取上市公司的财务数据及基本企业信息。

其中,画像模型单元通过专家打分法和数据驱动方法,得到了各级指标由指标值、权重及评分映射规则。

其中,动态画像评分模型架构模块获得的数据情况进行了综合评估,获得三级指标架构。

其中,指标模块采用专家打分法评估各个维度指标重要性,通过改进层次分析法设计了专家评分表。

其中,权重模块通过专家评分法确定一级指标及二级指标的重要程度作为权重参考依据,且通过统计数据分布情况进行了多轮模型的迭代实验,得到最终的指标权重方案。

有益效果:

本方法克服了专家打分法的主观性问题,并引入了数据驱动方法的客观性优势,通过将建筑行业专家评分作为指标重要性的参考引入画像,在引入了专家资深行业及业务工作经验的同时,有效克服了主观性导致的模型结果偏差,通过数据驱动方法刻画了建筑行业企业数据与建筑行业数据的分布情况,确定了科学有效的评分规则与权重体系,保证了画像评分结果的时效性,通过定期的前置数据同步服务,保证了数据库内的数据及时性,在指标设计中引入了与时间维度相关的动态指标,保证了得分结果能够把握时效性因素,同时开放了参数的通用调整接口,在生产使用中可根据业务变化情况进行灵活调整,针对建筑行业普遍存在的供应商数据缺失情景,设计了处理方案,在数据情况较差的环境中,通过企业规模系数与外部建筑行业上市公司数据,能够保证模型能够得到较为合理的评分结果作为参考依据,具有较强的稳健性;

本方法覆盖了建筑行业供应商企业常见的信息维度,通过灵活调整参数可以适用于综合性与个性的多种业务应用场景,拥有极强的泛化能力。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

技术分类

06120115629578