掌桥专利:专业的专利平台
掌桥专利
首页

一种存量房属性的确定方法、装置、电子设备及存储介质

文献发布时间:2023-06-19 19:28:50


一种存量房属性的确定方法、装置、电子设备及存储介质

技术领域

本申请涉及数据处理领域,尤其涉及一种存量房属性的确定方法、装置、电子设备及存储介质。

背景技术

随着中国的城镇化发展进入新的阶段,以大拆大建为主的城市发展和更新模式将逐渐成为过去时。这必将导致新房的市场供给量减少,国内出租定价的对象也将进一步向普租房源倾斜。实际上,在很多一线城市,普租房源价格已经成为在市场上有代表性,其价格成为决定市场出租房源定价走势的风向标。因此,普租房源的合理估价,避免过高或过低估价导致存量房市场异常波动,具有十分重要的现实意义。

目前,我国的存量房市场的出租主体大都以个人为主,通常不能掌握完整的市场信息、缺少定价经验。在交易过程中,出租方往往依靠个人主观判断和中介经纪人的建议对待售存量房进行定价,而租客则通常会横向对比并主观判断租房性价比最高的房屋。定价相对过高导致存量房长时间无法出租和定价相对过低导致交易违约的事件时常发生。因此,如何确定待售存量房的合理价格,同样是困扰存量房交易双方的问题。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种存量房属性的确定方法、装置、电子设备及存储介质。

根据本申请实施例的一个方面,提供了一种存量房属性的确定方法,包括:

获取存量房属性预测任务,其中,所述存量房属性预测任务包括待预测目标存量房对应的第一存量房参数,以及所述目标存量房所处目标区域中现有存量房的目标挂盘数据;

从所述目标挂盘数据中获取与所述第一存量房参数相匹配的至少一个目标挂盘数据,并确定每个所述目标挂盘数据与所述第一存量房参数之间的目标差异数据;

将所述目标差异数据以及所述第一存量房参数对输入目标属性预测模型,得到所述目标存量房与所述现有存量房之间的属性差异数据;

基于所述属性差异数据以及所述挂盘数据确定所述目标存量房对应的目标属性值。

进一步的,所述从所述目标挂盘数据中获取与所述第一存量房参数相匹配的至少一个目标挂盘数据,包括:

从所述挂盘数据中提取所述现有存量房对应的第二存量房参数;

计算所述第一存量房参数与所述第二存量房参数之间的相似度;

将所述相似度大于预设相似度的第二存量房参数对应的挂盘数据确定为所述目标挂盘数据。

进一步的,所述确定每个所述目标挂盘数据与所述第一存量房参数之间的目标差异数据,包括:

从所述目标挂盘数据中提取所述现有存量房对应的第三存量房参数;

将所述第三存放量房参数与所述第一存量房参数之间的差异数据,确定为所述目标差异数据。

进一步的,在获取存量房属性预测任务之前,所述方法还包括:

获取存量房挂盘数据集,其中,所述存量房挂盘数据集中包括多个不同区域内存量房的挂盘数据;

从所述挂盘数据集合中获取每个区域对应的区域挂盘数据集,其中,所述区域挂盘数据集包括所述区域内每个存量房对应的挂盘数据;

将所述区域挂盘数据集中的挂盘数据进行两两匹配,得到挂盘数据对,并计算每个挂盘数据对应的差异数据对;

利用所述差异数据对训练预设监督模型,以使所述预设监督模型学习所述差异数据对中的差异数据之间的关系,得到所述区域对应的属性预测模型。

进一步的,所述将所述目标差异数据以及所述第一存量房参数对输入目标属性预测模型,得到所述目标存量房与所述现有存量房之间的属性差异数据,包括:

从至少一个属性预测模型中获取所述目标区域对应的目标属性预测模型;

基于所述第一存量房参数与每个所述目标差异数据生成数据对;

将每个所述数据对输入所述目标属性预测模型,得到所述目标存量房与所述现有存量房之间的属性差异数据。

进一步的,所述基于所述属性差异数据以及所述挂盘数据确定所述目标存量房对应的目标属性值,包括:

分别计算每个属性差异数据与所述挂盘数据中挂盘属性值的第一和值,并将所述第一和值确定为所述目标存量房对应的至少一个参考属性值;

基于所述参考属性值确定所述目标存量房对应的目标属性值。

进一步的,所述基于所述参考属性值确定所述目标存量房对应的目标属性值,包括:

计算至少一个所述参考属性值对应的第二和值;

将所述第二和值与所述参考属性值对应的数量的商值,确定为所述目标存量房对应的目标属性值。

根据本申请实施例的再一个方面,还提供了一种存量房属性的确定的确定装置,包括:

获取模块,用于获取存量房属性预测任务,其中,所述存量房属性预测任务包括待预测目标存量房对应的第一存量房参数,以及所述目标存量房所处目标区域中现有存量房的目标挂盘数据;

确定模块,用于从所述目标挂盘数据中获取与所述第一存量房参数相匹配的至少一个目标挂盘数据,并确定每个所述目标挂盘数据与所述第一存量房参数之间的目标差异数据;

计算模块,用于将所述目标差异数据以及所述第一存量房参数对输入目标属性预测模型,得到所述目标存量房与所述现有存量房之间的属性差异数据;

处理模块,用于基于所述属性差异数据以及所述挂盘数据确定所述目标存量房对应的目标属性值。

根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。

根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。

本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点:申请实施例提供方法通过构建模型综合考虑了存量房属性对同小区内待租房源出租定价差异的影响,实现了待估存量房的合理出租估价。一方面,估价结果以同小区存量房挂盘数据为参考,确保估价结果不会偏离市场水平;另一方面,构建了同小区存量房价格互推模型,消除了参考存量房数据中房屋属性差异对价格的影响,使得估价结果更为准确、合理;最后,提供了估价结果置信度,可以句此更好地判断估价结果的准确性和参考价值。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种存量房属性的确定方法的流程图;

图2为本申请实施例提供的一种存量房属性的确定装置的框图;

图3为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本申请实施例提供了一种存量房属性的确定方法、装置、电子设备及存储介质。本发明实施例所提供的方法可以应用于任意需要的电子设备,例如,可以为服务器、终端等电子设备,在此不做具体限定,为描述方便,后续简称为电子设备。

根据本申请实施例的一方面,提供了一种存量房属性的确定方法的方法实施例。图1为本申请实施例提供的一种存量房属性的确定方法的流程图,如图1所示,该方法包括:

步骤S11,获取存量房属性预测任务,其中,存量房属性预测任务包括待预测目标存量房对应的第一存量房参数,以及目标存量房所处目标区域中现有存量房的目标挂盘数据。

本申请实施例提供的方法应用于能够进行数据处理的智能终端,智能终端可以是手机、电脑、iPad等等。具体的,用户当前需要进行存量房的属性预测时,可以直接基于智能终端选择当前待进行属性预测的目标存量房,并查询目标存量房对应的第一存量房参数,以及目标存量房所处目标区域中现有存量房的目标挂盘数据,其中,目标区域可以理解为目标存量房所在小区。最终,基于目标存量房的第一存量房参数以及目标挂盘数据生成存量房属性预测任务。

需要说明的是,存量房是指已被购买或自建并取得所有权证书的房屋,也指存量房一般是指未居住过的二手房,即通常所讲的“库存待售”的房产。第一存量房参数包括:房源ID(house_id)、所在区域(小区)ID(resblock_id)、建筑面积(area)、卧室数(bedroom)、卫生间数(toilet)、装修水平(decoration)、朝向(orientation)、所在楼层(floor)、是否有电梯(lift)、户型结构(structure)、建筑类型(buildtype)等。挂盘数据可以包括:属性值(属性值可以是挂盘价格也可以是评价)、房源ID(house_id)、所在区域(小区)ID(resblock_id)、建筑面积(area)、卧室数(bedroom)、卫生间数(toilet)、装修水平(decoration)、朝向(orientation)、所在楼层(floor)、是否有电梯(lift)、户型结构(structure)、建筑类型(buildtype)等等。

步骤S12,从目标挂盘数据中获取与第一存量房参数相匹配的至少一个目标挂盘数据,并确定每个目标挂盘数据与第一存量房参数之间的目标差异数据。

在本申请实施例中,步骤S12,从目标挂盘数据中获取与第一存量房参数相匹配的至少一个目标挂盘数据,包括以下步骤A1-A3:

步骤A1,从挂盘数据中提取现有存量房对应的第二存量房参数。

步骤A2,计算第一存量房参数与第二存量房参数之间的相似度。

步骤A3,将相似度大于预设相似度的第二存量房参数对应的挂盘数据确定为目标挂盘数据。

在本申请实施例中,智能终端首先从挂盘数据中提取现有存量房对应第二存量房参数,其次将第一存量房参数转换成第一参数向量,以及将第二存量房参数转换成第二参数向量,计算第一参数向量与第二参数向量之间的相似度。再者,将相似度与预设相似度进行对比,将相似度大于预设相似度的第二存量房参数对应的挂盘数据确定为目标挂盘数据。

在本申请实施例中,确定每个目标挂盘数据与第一存量房参数之间的目标差异数据,包括:从目标挂盘数据中提取现有存量房对应的第三存量房参数;将第三存放量房参数与第一存量房参数之间的差异数据,确定为目标差异数据。

在本申请实施例中,从目标挂盘数据中提取现有存量房对应的第三存量房参数,并确定第三存放量房参数与第一存量房参数之间的目标差异数据。其中,目标差异数据可以包括:建筑面积差、卧室数量差、卫生间数量差、所在楼层差(floor)、是否有电梯等等。

步骤S13,将目标差异数据以及第一存量房参数对输入目标属性预测模型,得到目标存量房与现有存量房之间的属性差异数据。

在本申请实施例中,在获取存量房属性预测任务之前,方法还包括以下步骤B1-B4:

步骤B1,获取存量房挂盘数据集,其中,存量房挂盘数据集中包括多个不同区域内存量房的挂盘数据。

步骤B2,从挂盘数据集合中获取每个区域对应的区域挂盘数据集,其中,区域挂盘数据集包括区域内每个存量房对应的挂盘数据。

步骤B3,将区域挂盘数据集中的挂盘数据进行两两匹配,得到挂盘数据对,并计算每个挂盘数据对应的差异数据对。

步骤B4,利用差异数据对训练预设监督模型,以使预设监督模型学习差异数据对中的差异数据之间的关系,得到区域对应的属性预测模型。

在本申请实施例中,智能终端首先调用网络爬虫从网络上爬取不同区域的存量房交易记录,并基于存量房交易记录中存量房的挂盘数据的生成存量房挂盘交易数据集。其次,将存量房挂盘数据集中的挂盘数据按照区域进行划分,得到每个区域对应的区域挂盘数据集。再将每个区域挂盘数据集中的挂盘数据进行两两匹配,得到数据对,分别计算数据对中两套存量房的参数差异和属性差异数据,得到同区域存量房挂盘数据对表。表内容包括:目标存量房和现有存量房的属性差、目标存量房参数(area_x、bedroom_x、toilet_x、decoration_x、floor_x、lift_x)、现有存量房属性值、现有存量房参数(area_y、bedroom_y、toilet_y、decoration_y、floor_y、lift_y),目标存量房和现有存量房参数差异(area_dev、dev_bedroom、dev_toilet、dev_decoration、dev_area_rater)。

需要说明的是,目标存量房和现有存量房属性之间的差异数据采用直接作差的方法计算,以目标房源和参考房源的建筑面积差异为例:area_dev=area_y-area_x。

最终,基于同区域的存量房挂盘数据对,以目标存量房和现有存量房之间的属性值差为因变量,以目标存量房的参数、现有存量房属性值、参考存量房属性的确定、目标存量房和参考房源之间存量房参数的差异数据为自变量,训练XGBoost模型,构建该区域存量房的属性预测模型。

在本申请实施例中,将目标差异数据以及第一存量房参数对输入目标属性预测模型,得到目标存量房与现有存量房之间的属性差异数据,包括以下步骤C1-C3:

步骤C1,从至少一个属性预测模型中获取目标区域对应的目标属性预测模型。

步骤C2,基于第一存量房参数与每个目标差异数据生成数据对。

步骤C3,将每个数据对输入目标属性预测模型,得到目标存量房与现有存量房之间的属性差异数据。

在本申请实施例中,由于不同区域对应不同的属性预测模型时,基于此直接获取目标区域对应的目标属性预测模型。并基于第一存量房参数分别与每个目标差异数据生成数据对,例如:第一存量房参数为P,目标差异数据包括:Q1,Q2以及Q3。生成的数据对包括:(P,Q1),(P,Q2)以及(P,Q3)。最终将每个数据对输入至目标属性预测模型,得到目标存量房与现有存量房之间的属性差异数据。

步骤S14,基于属性差异数据以及挂盘数据确定目标存量房对应的目标属性值。

在本申请实施例中,步骤S14,基于属性差异数据以及挂盘数据确定目标存量房对应的目标属性值,包括以下步骤D1-D2:

步骤D1,分别计算每个属性差异数据与挂盘数据中挂盘属性值的第一和值,并将第一和值确定为目标存量房对应的至少一个参考属性值。

在本申请实施例中,属性值以价格为例的情况下,计算参考属性值(参考价格)的公式如下:

r_price=price_x+price_dev,其中,price_x是挂盘属性值,price_dev是属性差异数据。

步骤D2,基于参考属性值确定目标存量房对应的目标属性值。

在本申请实施例中,基于参考属性值确定目标存量房对应的目标属性值,包括:计算至少一个参考属性值对应的第二和值;将第二和值与参考属性值对应的数量的商值,确定为目标存量房对应的目标属性值。

在本申请实施例中,目标属性值对的计算公式如下:

在本申请实施例中,为了保证目标属性值的可靠程度,利用目标存量房的参考属性值的数量和分散程度计算目标属性值对应的置信度(confidence):

其中,q(x,75%)和q(x,25%)分别为计算数组x的75%和25%分位数的函数。

本申请实施例提供方法通过构建模型综合考虑了存量房属性对同小区内存量房的房源属性值差异的影响,实现了待处理存量房的合理属性值,例如存量房的价格。一方面,预测结果以同小区存量房挂盘数据为参考,确保输出结果更加准确,不会偏离当前市场水平;另一方面,构建了同小区存量房预测模型,消除了参考存量房数据中房屋参数差异对属性值的影响,使得输出结果更为准确、合理;最后,提供了属性值对应的置信度,可以更好地判断输出结果的准确性和参考价值。

图2为本申请实施例提供的一种存量房属性的确定的确定装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图2所示,该装置包括:

获取模块21,用于获取存量房属性预测任务,其中,存量房属性预测任务包括待预测目标存量房对应的第一存量房参数,以及目标存量房所处目标区域中现有存量房的目标挂盘数据;

确定模块22,用于从目标挂盘数据中获取与第一存量房参数相匹配的至少一个目标挂盘数据,并确定每个目标挂盘数据与第一存量房参数之间的目标差异数据;

计算模块23,用于将目标差异数据以及第一存量房参数对输入目标属性预测模型,得到目标存量房与现有存量房之间的属性差异数据;

处理模块24,用于基于属性差异数据以及挂盘数据确定目标存量房对应的目标属性值。

在本申请实施例中,确定模块22,用于从挂盘数据中提取现有存量房对应的第二存量房参数;计算第一存量房参数与第二存量房参数之间的相似度;将相似度大于预设相似度的第二存量房参数对应的挂盘数据确定为目标挂盘数据。

在本申请实施例中,确定模块22,用于从目标挂盘数据中提取现有存量房对应的第三存量房参数;将第三存放量房参数与第一存量房参数之间的差异数据,确定为目标差异数据。

在本申请实施例中,存量房属性的确定的确定装置还包括:模型构建模块,用于获取存量房挂盘数据集,其中,存量房挂盘数据集中包括多个不同区域内存量房的挂盘数据;从挂盘数据集合中获取每个区域对应的区域挂盘数据集,其中,区域挂盘数据集包括区域内每个存量房对应的挂盘数据;将区域挂盘数据集中的挂盘数据进行两两匹配,得到挂盘数据对,并计算每个挂盘数据对应的差异数据对;利用差异数据对训练预设监督模型,以使预设监督模型学习差异数据对中的差异数据之间的关系,得到区域对应的属性预测模型。

在本申请实施例中,计算模块23,用于从至少一个属性预测模型中获取目标区域对应的目标属性预测模型;将第一存量房参数与每个目标差异数据生成数据对;将每个数据对输入目标属性预测模型,得到目标存量房与现有存量房之间的属性差异数据。

在本申请实施例中,处理模块24,用于分别计算每个属性差异数据与挂盘数据中挂盘属性值的第一和值,并将第一和值确定为目标存量房对应的至少一个参考属性值;基于参考属性值确定目标存量房对应的目标属性值。

在本申请实施例中,处理模块24,用于计算至少一个参考属性值对应的第二和值;将第二和值与参考属性值对应的数量的商值,确定为目标存量房对应的目标属性值。

本申请实施例还提供一种电子设备,如图3所示,电子设备可以包括:处理器1501、通信接口1502、存储器1503和通信总线1504,其中,处理器1501,通信接口1502,存储器1503通过通信总线1504完成相互间的通信。

存储器1503,用于存放计算机程序;

处理器1501,用于执行存储器1503上所存放的计算机程序时,实现上述实施例的步骤。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的存量房属性的确定方法。

在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的存量房属性的确定方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk)等。

以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种问卷调查对象确定方法、装置、电子设备和存储介质
  • 一种车位确定方法、装置、电子设备、车辆及存储介质
  • 配送参数的确定方法、确定装置、存储介质和电子设备
  • 文本属性字段的匹配方法、装置、电子设备及存储介质
  • 一种浴室加热装置和用于控制浴室加热装置的方法、设备、电子设备及计算机可读存储介质
  • 一种属性确定方法、装置、存储介质及电子设备
  • 一种确定控件属性的方法及装置、电子设备和存储介质
技术分类

06120115925590