掌桥专利:专业的专利平台
掌桥专利
首页

施工项目的延期预测方法及预测装置

文献发布时间:2023-06-19 11:45:49


施工项目的延期预测方法及预测装置

技术领域

本发明涉及工程进度管理技术领域,特别涉及一种施工项目的延期预测方法及预测装置。

背景技术

在建筑施工过程中,进度控制是工程项目管控的重点内容,也是现场管控的核心。进度控制就是最终保证目标工期(合同工期)的实现,确保项目按时竣工。因此在执行过程中,需要评估项目目前的延期风险并对将来可能出现的延期风险进行预判。一旦出现延期风险,则及时采取补救措施,或调整、修改原计划,直至工程竣工。目前现有技术对于延期风险的评估和预测多为人工进行,这就对进度管理人员要求较高。一方面增加人力成本,另一方面人工管理难免存在疏漏,从而导致难以准确预测延期风险,影响工程进度。

发明内容

本发明的目的是提供一种能够准确、快速地对施工项目的延期风险进行自动预测的技术方案,以解决现有技术中存在的上述问题。

为实现上述目的,本发明提供一种施工项目的延期预测方法,包括以下步骤:

获取施工项目在当前阶段的施工状态数据,所述施工状态数据包括劳务维度数据、气象维度数据、安全维度数据和质量维度数据中的至少两种;

将所述施工状态数据分别输入至少两个预测子模型,所述预测子模型基于所述施工状态数据的其中一种维度数据输出所述施工项目在未来阶段的延期子概率;

将至少两个所述延期子概率输入融合模型,以输出所述施工项目在未来阶段的延期综合概率。

根据本发明提供的施工项目的延期预测方法,所述预测子模型包括劳务预测子模型、气象预测子模型、安全预测子模型和质量预测子模型中的至少两个,所述预测子模型基于xgboost算法通过以下步骤训练:

获取第一历史样本数据,所述第一历史样本数据包括历史阶段中的劳务样本数据、气象样本数据、安全样本数据、质量样本数据和工时样本数据;

基于所述工时样本数据确定所述第一历史样本数据的延期标签,所述延期标签包括正向延期和负向延期;

将所述劳务样本数据作为输入数据,将所述延期标签作为输出数据训练所述劳务预测子模型;或

将所述气象样本数据作为输入数据,将所述延期标签作为输出数据训练所述气象预测子模型;或

将所述安全样本数据作为输入数据,将所述延期标签作为输出数据训练所述安全预测子模型;或

将所述质量样本数据作为输入数据,将所述延期标签作为输出数据训练所述质量预测子模型。

根据本发明提供的施工项目的延期预测方法,所述基于所述工时样本数据确定所述第一历史样本数据的延期标签的步骤包括:

获取所述工时样本数据中各个子工程的每日工时数据;所述子工程包括主体结构工程、二次结构工程、装饰装修工程、安装工程和全阶段工程中的任意一种;

对所述每日工时数据进行筛选,以获取所述子工程在正常工期内的理想工时数据;

根据所述工时样本数据和所述理想工时数据的关系确定所述延期标签。

根据本发明提供的施工项目的延期预测方法,所述对所述每日工时数据进行筛选,以获取所述子工程在正常工期内的理想工时数据的步骤包括:

从所述每日工时数据中删除在第一连续时间段内低于第一阈值的工时数据,得到第一工时数据;

删除所述第一工时数据中的异常工时,利用插值算法对去除了异常工时之后的第一工时数据补充缺失值,并获取在第二连续时间段内高于第二阈值的第二工时数据;

从所述第二工时数据中删除上升期工时数据和下降期工时数据以得到第三工时数据,所述上升期工时数据是指在第四连续时间段内的工时最大值与第三连续时间段内的工时最大值之差大于第三阈值,所述下降期工时数据是指在第四连续时间段内的工时最大值与第三连续时间段内的工时最大值之差小于第四阈值,其中所述第四连续时间段晚于所述第三连续时间段;

对所述第三工时数据进行平滑处理以得到所述理想工时数据。

根据本发明提供的施工项目的延期预测方法,所述根据所述工时样本数据和所述理想工时数据的关系确定所述延期标签的步骤包括:

当所述工时样本数据与所述理想工时数据相比小于第五阈值时确定为停工,当所述工时样本数据与所述理想工时数据相比大于第六阈值时确定为赶工;

根据所述工时样本数据与所述理想工时数据的差值计算停工影响天数和赶工影响天数;

根据停工影响天数和赶工影响天数的差值计算延期天数;

根据所述延期天数确定延期标签,当所述延期天数大于预设天数时,确定为延期正标签;当所述延期天数小于或等于预设天数时,确定为延期负标签。

根据本发明提供的施工项目的延期预测方法,所述融合模型基于逻辑回归算法通过以下训练步骤得到:

获取第二历史样本数据,所述第二历史样本数据包括所述劳务预测子模型、所述气象预测子模型、所述安全预测子模型或所述质量预测子模型基于输入的所述第一历史样本数据输出的延期子概率样本数据;

将所述延期子概率样本数据作为输入数据,将所述第一历史样本数据的延期标签作为输出数据训练所述融合模型,以使所述融合模型基于输入的延期子概率,输出综合概率。

根据本发明提供的施工项目的延期预测方法,所述方法还包括:

输出所述施工状态数据中的具体元素对每个所述延期子概率的影响程度,以及输出每个所述延期子概率对所述综合延期概率的影响程度。

跟剧本发明提供的施工项目的延期预测方法,所述方法还包括:

根据所述延期综合概率与预设风险阈值之间的关系输出风险等级。

为实现上述目的,本发明还提供一种施工项目的延期预测装置,包括:

状态数据获取模块,适用于获取施工项目在当前阶段的施工状态数据,所述施工状态数据包括劳务维度数据、气象维度数据、安全维度数据和质量维度数据中的至少两种;

单一预测模块,适用于将所述施工状态数据分别输入至少两个预测子模型,所述预测子模型基于所述施工状态数据的其中一种维度数据输出所述施工项目在未来阶段的延期子概率;

综合预测模块,适用于将至少两个所述延期子概率输入融合模型,以输出所述施工项目在未来阶段的延期综合概率。

为实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

为实现上述目的,本发明还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

本发明提供的施工项目的延期预测方法和预测装置,分别训练多个预测子模型以及一个融合模型。首先通过预测子模型根据当前施工状态数据分别从劳务状态、质量状态、安全状态、物料状态以及气象状态等不同维度进行延期风险预测,然后通过融合模型对每个预测子模型输出的延期子概率进行综合后最终输出延期综合概率。通过多个预测子模型和一个融合模型相结合,本发明能够施工项目的延期风险进行更加全方位的准确预测,从而更加有效地指导施工进度,提高施工效率。

附图说明

图1为本发明的施工项目的延期预测方法实施例一的流程图;

图2为本发明实施例一对预测子模型进行训练的示意性性流程图;

图3为本发明实施例一对融合模型进行训练的示意性性流程图;

图4示出了本发明实施例一的预测子模型和融合模型的结构示意图;

图5为本发明实施例一的确定延期标签的示意性流程图;

图6为本发明的延期预测装置实施例一的程序模块示意图;

图7为本发明的延期预测装置实施例一的硬件结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

请参阅图1,本实施例提出一种施工项目的延期预测方法,包括以下步骤:

S100:获取施工项目在当前阶段的施工状态数据,所述施工状态数据包括劳务维度数据、气象维度数据、安全维度数据、物料维度数据和质量维度数据中的至少两种。

施工状态数据可以包括对施工进度有影响作用的多种维度数据,例如劳务维度数据、气象维度数据、安全维度数据、物料维度数据和质量维度数据等。其中劳务维度数据用于表征与施工人员相关的人工因素特征,包括地理区域、月份、工人每日工时变化率、工人上工率(A天平均工人数/B天平均工人数)、工人波动率(1A天工人标准差/B天工人平均值)等数据;气象维度数据用于表征与外部气象相关的物理环境特征,包括地理区划、月份、天气、风力、温度、空气颗粒物等数据;安全维度数据用于表征与安全检查结果相关的特征,包括隐患类别、项目状态、整改状态、整改时限、风险等级等数据;物料维度数据用于表征与原料配备相关的用度数据,包括混凝土、钢筋、砌块、砂浆等多种材料的使用量、出厂率等数据;质量维度数据用于表征与质量检查结果相关的特征,包括整改期限、隐患级别、整改状态、复查结果、工序验收等数据。以上施工状态数据可以是最近连续一段时期内的特征分布数据,例如利用最近一个月的各维度特征值分布占比构建特征。

S200:将所述施工状态数据分别输入至少两个预测子模型,所述预测子模型基于所述施工状态数据的其中一种维度数据输出所述施工项目在未来阶段的延期子概率。

本实施例中的预测子模型可以是基于xgboost算法训练得到的。具体的,上述预测子模型可以分别为劳务预测子模型、气象预测子模型、安全预测子模型和质量预测子模型。图2为本发明实施例一对预测子模型进行训练的示意性性流程图,如图2所示,预测子模型的训练过程可以包括如下步骤:

S210:获取第一历史样本数据,所述第一历史样本数据包括历史阶段中的劳务样本数据、气象样本数据、安全样本数据、质量样本数据、物料样本数据和工时样本数据。其中劳务样本数据、气象样本数据、安全样本数据、质量样本数据和物料样本数据相当于步骤S100中的劳务维度数据、气象维度数据、安全维度数据、物料维度数据和质量维度数据,此处不再赘述。需要说明的是,工时样本数据是指记录了不同工种每天工作时长的历史数据。上述工种包括木工、砌筑工、水电工、油漆工、等,可以理解,一个完整工项目中不同的子工程对应不同的工种,其中子工程通常包括主体结构工程、二次结构工程、装饰装修工程、安装工程等,相应的,木工可能对应于主体结构工程,砌筑工可能对应于二次结构工程、水电工可能对应于安装工程,油漆工可能对应于装饰装修工程等。总之,在不同的施工项目中可以根据实际需要建立工种和子工程之间不同的映射关系,从而根据工种和映射关系确定对应的子工程。这样本实施例的预测子模型就可以针对不同的子工程预测延期子概率,例如预测主体结构工程的延期子概率、预测二次结构工程的延期子概率。当然当第一历史样本数据中包括主体结构工程、二次结构工程、装饰装修工程、安装工程等全部子工程阶段时,本实施例的预测子模型可以预测整个施工周期的延期子概率。

进一步,本实施例在输出每个延期子模型的延期子概率的基础上,还可以输出不同输入数据对输出的延期子概率的影响程度。例如对于气象预测子模型,其输入的气象维度数据包括地理区划、月份、天气、风力、温度、空气颗粒物等气象特征,这些气象特征对于输出的延期子概率的影响程度可以通过python中的模型解释包SHAP进行输出,例如按照影响程度从高到底的顺序输出各个气象特征。这样有利于清楚显示不同输入特征对于输出结果的贡献程度,从而可以在后期进行针对性地调整。

S220:基于所述工时样本数据确定所述第一历史样本数据的延期标签,所述延期标签包括正向延期和负向延期。

延期标签是根据工时样本数据中反映出的实际延期情况确定的标签,在一个示例中,延期标签可以包括正向延期和负向延期,其中正向延期表示存在延期风险,负向延期表示不存在延期风险。

S230:将所述劳务样本数据作为输入数据,将所述延期标签作为输出数据训练所述劳务预测子模型;或

将所述气象样本数据作为输入数据,将所述延期标签作为输出数据训练所述气象预测子模型;或

将所述安全样本数据作为输入数据,将所述延期标签作为输出数据训练所述安全预测子模型;或

将所述质量样本数据作为输入数据,将所述延期标签作为输出数据训练所述质量预测子模型。

可以理解,对于不同的预测子模型可以输入不同的样本数据,从而实现不同的预测子模型从不同维度预测延期风险的目的。

S300:将至少两个所述延期子概率输入融合模型,以输出所述施工项目在未来阶段的延期综合概率,其中所述融合模型基于逻辑回归算法训练得到的。

图3为本发明实施例一对融合模型进行训练的示意性性流程图,如图3所示,融合模型的训练过程可以包括如下步骤:

S310:获取第二历史样本数据,所述第二历史样本数据包括所述劳务预测子模型、所述气象预测子模型、所述安全预测子模型或所述质量预测子模型基于输入的所述第一历史样本数据输出的延期子概率样本数据。

如前所述,每个预测子模型输出的延期子概率可以包括正向延期子标签或负向延期子标签,上述正向延期子标签或负向延期子标签进一步作为本实施例中融合模型的输入数据。

S320:将所述延期子概率样本数据作为输入数据,将所述第一历史样本数据的延期标签作为输出数据训练所述融合模型,以使所述融合模型基于输入的延期子概率,输出综合概率。

进一步,本实施例在输出融合模型的延期综合概率的基础上,还可以输出不同延期子概率对输出的综合概率的影响程度。例如气象维度的延期子概率、安全维度的延期子概率、物料维度的延期子概率等不同延期子概率对延期综合概率的影响程度,具体可以通过python中的模型解释包SHAP进行输出,例如按照影响程度从高到底的顺序输出各个延期子概率。这样有利于清楚显示不同输入特征对于输出结果的贡献程度,从而可以在后期进行针对性地调整。

进一步,在步骤S300之后,本实施例还包括步骤S400:根据延期综合概率与预设风险阈值之间的关系输出风险等级。例如分别预设第一风险阈值F1和第二风险阈值F2,其中F1=F2时,输出高风险等级;当延期风险概率F1

图4示出了本发明实施例一的预测子模型和融合模型的结构示意图。如图4所示,源自数据中台的施工状态数据分别输入劳务预测子模型、质量预测子模型、安全预测子模型、物料预测子模型和天气预测子模型。接下来,劳务预测子模型、质量预测子模型、安全预测子模型、物料预测子模型和天气预测子模型的输出分别作为融合模型的输入数据,最终输出延期风险概率的综合预测结果。其中与融合模型相连的还包括可解释模块,用于解释不同预测子模型的输出对于综合预测结果的影响程度。

图5为本发明实施例一确定延期标签的示意性流程图。如图5所示,步骤S220基于工时样本数据确定第一历史样本数据的延期标签的步骤包括:

S221:获取所述工时样本数据中各个子工程的每日工时数据;所述子工程包括主体结构工程、二次结构工程、装饰装修工程、安装工程和全阶段工程中的任意一种。具体的,每日工时数据可以是排除了监理、后勤、管理等工种之后保留的施工人员的工时数据。

S222:对所述每日工时数据进行筛选,以获取所述子工程在正常工期内的理想工时数据。具体筛选过程包括:

从每日工时数据中删除在第一连续时间段内低于第一阈值的工时数据,得到第一工时数据。例如删除在最近三天原始工时全部低于第一阈值并且最近n天内至少有m(m

删除所述第一工时数据中的异常工时,之后再利用插值算法补充删掉的数据,并从去除了异常工时之后的第一工时数据中获取在第二连续时间段内高于第二阈值的第二工时数据。异常工时指的是某日工时明显低于前期日平均工时和后期日平均工时的数据。例如对于第n天的工时数据Tn,假设第n天之前m天的日平均工时为T1,第n天之后m天的日平均工时为T2,若Tn

从所述第二工时数据中删除上升期工时数据和下降期工时数据以得到第三工时数据,所述上升期工时数据是指在第四连续时间段内的工时最大值与第三连续时间段内的工时最大值之差大于第三阈值,所述下降期工时数据是指在第四连续时间段内的工时最大值与第三连续时间段内的工时最大值之差小于第四阈值,其中所述第四连续时间段晚于所述第三连续时间段。此步骤的目的是排除施工前期准备阶段和施工后期收尾阶段时工时波动较大的数据。例如,将目标日期之后K天工时最大值比之前K天工时最大值大p1%以上的日期记为前期准备阶段,小于p2%则记为后期收尾阶段。

对所述第三工时数据进行平滑处理以得到所述理想工时数据。可以基于指数平均法、SG滤波法等任意数据平滑技术对一共是数据进行平滑处理,并可以对边缘部分进行二次项拟合,最终可以得到理想状态下进行饱满施工的工时数据,用该理想工时数据作为基准数据,可以确定实际工时数据是否符合预期进度。

S223:根据所述工时样本数据和所述理想工时数据的关系确定所述延期标签。具体包括:

当所述工时样本数据与所述理想工时数据相比小于第五阈值时确定为停工,当所述工时样本数据与所述理想工时数据相比大于第六阈值时确定为赶工。例如当工时样本数据小于理想工时数据的p3%(p3<100)时记为停工,当工时样本数据大于理想工时数据的p4%(p4>100)时记为赶工。

根据所述工时样本数据与所述理想工时数据的差值计算停工影响天数和赶工影响天数。具体的,停工影响天数=(理想工时数据-工时样本数据)/理想工时数据;赶工影响天数=(工时样本数据-理想工时数据)/理想工时数据。

根据停工影响天数和赶工影响天数的差值计算延期天数,例如延期天数=停工影响天数-赶工影响天数。

根据所述延期天数确定延期标签,当所述延期天数大于预设天数时,确定为延期正标签;当所述延期天数小于或等于预设天数时,确定为延期负标签。在一个示例中,上述预设天数可以为1天。

通过上述步骤,本实施例可以快速、准确地为不同的工时样本数据添加对应的延期标签,并基于延期标签分别对预测子模块和融合模块进行训练,有助于提高延期预测的准确性。

请继续参阅图6,示出了一种施工项目的延期预测装置,在本实施例中,延期预测装置60可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述延期预测方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述延期预测装置60在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:

状态数据获取模块61,适用于获取施工项目在当前阶段的施工状态数据,所述施工状态数据包括劳务维度数据、气象维度数据、安全维度数据和质量维度数据中的至少两种;

单一预测模块62,适用于将所述施工状态数据分别输入至少两个预测子模型,所述预测子模型基于所述施工状态数据的其中一种维度数据输出所述施工项目在未来阶段的延期子概率;

综合预测模块63,适用于将至少两个所述延期子概率输入融合模型,以输出所述施工项目在未来阶段的延期综合概率。

本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备70至少包括但不限于:可通过系统总线相互通信连接的存储器71、处理器72,如图7所示。需要指出的是,图7仅示出了具有组件71-72的计算机设备70,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

本实施例中,存储器71(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器71可以是计算机设备70的内部存储单元,例如该计算机设备70的硬盘或内存。在另一些实施例中,存储器71也可以是计算机设备70的外部存储设备,例如该计算机设备70上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器71还可以既包括计算机设备70的内部存储单元也包括其外部存储设备。本实施例中,存储器71通常用于存储安装于计算机设备70的操作系统和各类应用软件,例如实施例一的延期预测装置60的程序代码等。此外,存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器72在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制计算机设备70的总体操作。本实施例中,处理器72用于运行存储器71中存储的程序代码或者处理数据,例如运行延期预测装置60,以实现实施例一的延期预测方法。

本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储延期预测装置60,被处理器执行时实现实施例一的延期预测方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

流程图中或在此以其它方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

本技术领域的普通技术人员可以理解,实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 施工项目的延期预测方法及预测装置
  • 移动物预测装置、假想活动物预测装置、程序模块、移动物预测方法以及假想活动物预测方法
技术分类

06120113046237